[MFC] HTML Code einlesen

RealStecker

Grünschnabel
Hi

Ich habe in der Schule die Aufgabe bekommen mit C++ von Internet seiten den HTML Code einzulesen. Das ganze als eine MFC Anwendung (also Fenster nicht Konsole). Ich muss allerdings nur die verschiedenen Tags einlesen, wie z.B. <TITLE>, <b> und so weiter. Ich muss dann die ganzen verschiedenen Tags zählen und in einem List Control ausgeben.

Jetzt wollte ich fragen ob mir jemand eine Funktion für das Tag einlesen und eine Funktion damit ich eine beliebige Seite eintragen kann von wo ich den Code einlese.

Ich hab hier ein Bild wie es ungefähr aussehen sollte. Oben sollte natürlich ein Textfeld kommen wo ich die URL eintragen kann.

http://img161.imageshack.us/img161/3424/bildva2.jpg

p.s. ich hab mich auch schon überlegt alles in einen CString zu schreiben aber ich habe absolut keine Ahnung wie das geht.


Ich hoffe mir kann jemand helfen

MfG
 
Also mein erster Tip an dich ist, werde dir detailliert klar über dein Problem. Bisher hast du nur eine grobe Aufgabenstellung. Diese könnte man so definieren:

- Lies HTML-Seiten ein (völlig egal wie)
- Dursuche den Code der gelesenen Seite (völlig egal wie)
- Gib hinterher die Art und Anzahl der Tags des HTML-Codes aus (völlig egal wie).

Das mag jetzt offensichtlich und simpel klingen, ist es aber nicht unbedingt. Der wichtige Punkt ist, daß du dir deine Aufgabe strukturierst und nicht gedanklich schon von Anfang an in's Schwimmen gerätsts. Je sorgfältiger du von Anfang an arbeitest, desto einfacher wird dir die Lösung fallen.

Bisher wurden von dir folgende Schlagworte in dieser Reihenfolge geliefert:
- C++
- Internetseiten
- HTML Code
- MFC Anwendung
- ListControl
- Funktion zum Einlesen der Tags
- Funktion zum Eintragen der Seite
- Bild mit Oberflächendesign
- Textfeld für Eintrag der URL
- CString

Die ersten Schlagworte, die mir sofort auffalllen sind C++ und MFC. Damit ist die Umgebung schon mal (so gut wie) festgelegt: Ein Windowsprogramm, benutzbar ab Win98 aufwärts und bitte noch in C++.

Die anderen Schlagworte teile ich mal so zu:

Lies HTML-Seiten ein
- Internetseiten (sollen gelesen werden)
- HTML Code (soll aus den Internetseiten gelesen werden)
- Funktion zum Eintragen der Seite (z.B. ein EditFeld)
- Textfeld für Eintrag der URL

Dursuche den Code der gelesenen Seite
- Funktion zum Einlesen der Tags

Gib hinterher die Art und Anzahl der Tags des HTML-Codes aus
- ListControl (soll wohl das Objekt sein, innerhalb dessen die Ergebnisse angezeigt werden sollen)
- CString


Ganz, ganz grob bewertet würde ich sagen:
- Du hast eine vage Vorstellung davon, mit was für die Daten du arbeiten sollst und woher du sie bekommst.
- Du hast nicht die leiseste Ahnung, wie du diese Daten (den HTML-Code) dann bearbeiten sollst.
- Du hast eine äußerst vage Vorstellung davon, was für ein Ergebnis du liefern sollst.


Mein zweiter Tip an dich:
Nimm dir die einzelnen Blöcke (Einlesen der HTML-Seite und ihres Codes, Scannen des Codes, Ausgabe des Ergebnisses) getrennt und in aller Ruhe vor. Damit es etwas einfacher wird, hier eine feinere Unterteilung des Blocks "Einlesen der HTML-Seite" in Einzelprobleme:

- Wie wird die URL von Benutzer eingegeben? EditFeld?
- Wie wird die HTML-Seite gelesen? Internet? Lokale Datei?
- Wenn Internet - wie wird die Internetverbindung hergestellt, damit man an die Seite gelangt?
- Wenn lokal - wo liegen die HTML-Seiten vor?
- In was für eine Datenstruktur soll der HTML-Code eingelesen werden? StringList? Einzelstring? Array von char*? Oder etwas ganz anderes?

Versuche die Einzelprobleme immer feiner und feiner aufzubrechen in Einzelschritte. Irgendwann wirst du dann verwundert feststellen, daß du die Probleme so fein aufgelöst hast, daß du tatsächlich direkt das Programmieren anfangen kannst.

Aber bei einem "isch mach gezz ma 'n neu'n Shoota, geg'n den Doom arm aussieht" kommt in 99.999 von 100.000 Fällen absolut nichts Brauchbares raus. Beim "Programmieren" (welches sehr gerne mit Softwareentwicklung verwechselt wird) ist Planung mindestens das halbe Leben.
 

Neue Beiträge

Zurück