ERLEDIGT
NEIN
NEIN
ANTWORTEN
3
3
ZUGRIFFE
584
584
EMPFEHLEN
-
02.02.12 19:15 #1
- Registriert seit
- Feb 2012
- Beiträge
- 2
Hallo zusammen!
Ich würde gerne mittels Java den html Code von Webseiten parsen. Das klappt eigentlich soweit auch recht gut. Nun habe ich aber das Problem, dass bei manchen Seiten der benötigte Inhalt dynamisch (AJAX) generiert wird. Möchte ich eine solche Seite parsen, erhalte ich leider nur den entsprechenden javascript Code und nicht den tatsächlichen Inhalt, den ich auswerten möchte. Könnt ihr mir vielleicht einen Ratschlag geben, wie ich auch solche Webseiten verarbeiten kann?
Vielen Dank schon einmal für eure Mühe.
Gruß Christian
-
02.02.12 19:29 #2
Hallo,
entweder ermittelst du die spezifischen URLs und stellst Regeln auf, sodass du sie nachladen kannst oder du musst das JS parsen*.
Vom Parsen & Interpretieren des JavaScripts würde ich abraten, denn erstmal bräuchtest du erstmal einen JavaScript Parser, usw. Da wäre es ein sog. Headless Browser einfacher zu implementieren.
*was mehrere andere Konsequenzen verlangt, also nicht sehr leicht.mfg ComFreek
Falls ich dir geholfen habe, würde ich mich über ein DANKE freuen!
Kenn mich am besten aus in C++, WEB-Sprachen (PHP, HTML, JavaScript) und vllt. mehr
[PHP] Überprüfen, ob Website erreichbar • Sicherheit in PHP-Codes schaffen • Google Chrome-Extension für tutorials.de • json_compress()
-
02.02.12 19:57 #3
- Registriert seit
- Jun 2002
- Ort
- Saarbrücken (Saarland)
- Beiträge
- 9.886
- Blog-Einträge
- 29
Hallo,
eine Variante wäre HTMLUnit zu verwenden:
http://htmlunit.sourceforge.net/faq....JAXDoesNotWork
eine weitere Möglichkeit wäre die Verwendung eines Webdrivers (Selenium) http://code.google.com/p/selenium/?redir=1
Gruß TomJava rocks!
How to become a good Java Programmer?
Does IT in Java and .Net
The only valid measurement of code quality: WTFs / minute
Blog
Xing
Twitter
-
02.02.12 20:36 #4
- Registriert seit
- Feb 2012
- Beiträge
- 2
Hi!
Also erst einmal vielen Dank für eure Antworten! Das klingt schon alles ziemlich kompliziert und ich bin kein Experte auf dem Gebiet. Ich habe gehofft, es wäre etwas einfacher
Gruß Christian
Ähnliche Themen
-
Shadowbox.setup() bei dynamischen Inhalten
Von deb_ugger im Forum Javascript & AjaxAntworten: 3Letzter Beitrag: 07.02.11, 08:29 -
Rekursives Löschen von DB Inhalten mittels Schleife
Von xtramen01 im Forum PHPAntworten: 7Letzter Beitrag: 14.05.09, 17:32 -
Sprachwechsel bei dynamischen Inhalten?
Von Kalma im Forum PHPAntworten: 12Letzter Beitrag: 13.02.08, 16:30 -
XML parsen mit Attribut und dynamischen Tags
Von Pollux im Forum PHPAntworten: 3Letzter Beitrag: 28.08.06, 10:39 -
html seite aus dynamischen inhalten generieren?
Von HammerHe@rt im Forum PHPAntworten: 10Letzter Beitrag: 12.08.04, 10:43





Zitieren


Login





