ERLEDIGT
NEIN
NEIN
ANTWORTEN
3
3
ZUGRIFFE
620
620
EMPFEHLEN
-
Hallo,
ich will demnächst HTML Parsen und daraus bestimmte Werte auslesen (größtenteils ins Tabellen).
Nun gibts ja entpsrechende Bibliotheken wie Sand am Meer. Könnt Ihr was empfehlen? Eine gewisse Fehlertoleranz gegenüber invalid HTML wäre eventl ganz gut (hab noch nicht so genau die zu parsenden Seiten angeschaut). Wichtig wär für mich, das ich auf die Elemente der Seite DOM artig (so wie im Firefox DOM Inspector) zugreifen kann.
Kennt ihr da was?
Vielen Dank im Vorraus.
ToraxFalls ich entgegen meiner Gewohnheiten mal einen hilfreichen Beitrag schreibe, freu ich mich über eine positive Bewertung.
-
01.08.07 18:02 #2
Hi Torax,
ich habe mal etwas ähnliches gemacht. Allerdings habe ich da nicht allzuviel gefunden. Wichtig ist ja gerade das der Parser dreckiges xml (nämlich html) lesen muss.
Schau dir mal das tagsoup Projekt an, damit habe ich damals meinen html site scraper zum auslesen von Informationen auf Webseiten umgesetzt.
VG,
chefkoch
-
01.08.07 23:33 #3
- Registriert seit
- Jun 2002
- Ort
- Saarbrücken (Saarland)
- Beiträge
- 9.886
- Blog-Einträge
- 29
Hallo,
schau mal hier:
http://www.java-source.net/open-source/html-parsers
Ich hab mal JTidy benutzt und war damit weitesgehend zufrieden.
Gruß TomJava rocks!
How to become a good Java Programmer?
Does IT in Java and .Net
The only valid measurement of code quality: WTFs / minute
Blog
Xing
Twitter
-
Vielen Dank Euch beiden. Ich hatte/hab zwischenzeitlich bereits angefangen, die Seite mit den Opensource Parsern (aus Thomas Link) hatte ich bereits gefunden und mich erstmal für den Parser aus dem Lobo Projekt (Cobra) antschieden. Mittlerweile hab ich den DOM Tree und muss mich jetzt etwas mit DOM beschäftigen (nutzte bisher immer JDom für XML). Cobra scheint soweit auch ganz gut zu sein. Ich kann am Ende ja mal meine Erfahrungen Posten.
Gruß ToraxFalls ich entgegen meiner Gewohnheiten mal einen hilfreichen Beitrag schreibe, freu ich mich über eine positive Bewertung.
Ähnliche Themen
-
Java HTML Parser
Von Dinesh im Forum JavaAntworten: 2Letzter Beitrag: 12.07.10, 07:33 -
HTML-Parser benötigt !
Von AvS im Forum JavaAntworten: 3Letzter Beitrag: 02.06.09, 10:20 -
html parser
Von bblog im Forum Java GrundlagenAntworten: 2Letzter Beitrag: 24.12.08, 11:40 -
HTML-Parser Empfehlung ?!
Von angelikamorgan im Forum JavaAntworten: 2Letzter Beitrag: 03.08.08, 23:27 -
html Parser
Von Katzenbauer im Forum C/C++Antworten: 2Letzter Beitrag: 22.03.06, 20:33





Zitieren

Login





