tutorials.de Buch-Aktion 05/2012
ERLEDIGT
NEIN
ANTWORTEN
3
ZUGRIFFE
584
EMPFEHLEN
  • An Twitter übertragen
  • An Facebook übertragen
AUF DIESES THEMA
ANTWORTEN
  1. #1
    christian- christian- ist offline Grünschnabel
    Registriert seit
    Feb 2012
    Beiträge
    2
    Hallo zusammen!

    Ich würde gerne mittels Java den html Code von Webseiten parsen. Das klappt eigentlich soweit auch recht gut. Nun habe ich aber das Problem, dass bei manchen Seiten der benötigte Inhalt dynamisch (AJAX) generiert wird. Möchte ich eine solche Seite parsen, erhalte ich leider nur den entsprechenden javascript Code und nicht den tatsächlichen Inhalt, den ich auswerten möchte. Könnt ihr mir vielleicht einen Ratschlag geben, wie ich auch solche Webseiten verarbeiten kann?

    Vielen Dank schon einmal für eure Mühe.

    Gruß Christian
     

  2. #2
    Avatar von ComFreek
    ComFreek ComFreek ist offline [x] Let it be logic!
    tutorials.de Moderator
    Registriert seit
    Jun 2009
    Beiträge
    2.363
    Blog-Einträge
    4
    Hallo,

    entweder ermittelst du die spezifischen URLs und stellst Regeln auf, sodass du sie nachladen kannst oder du musst das JS parsen*.

    Vom Parsen & Interpretieren des JavaScripts würde ich abraten, denn erstmal bräuchtest du erstmal einen JavaScript Parser, usw. Da wäre es ein sog. Headless Browser einfacher zu implementieren.
    *was mehrere andere Konsequenzen verlangt, also nicht sehr leicht.
     
    mfg ComFreek

    Falls ich dir geholfen habe, würde ich mich über ein DANKE freuen!
    Kenn mich am besten aus in C++, WEB-Sprachen (PHP, HTML, JavaScript) und vllt. mehr
    [PHP] Überprüfen, ob Website erreichbarSicherheit in PHP-Codes schaffenGoogle Chrome-Extension für tutorials.dejson_compress()

  3. #3
    Registriert seit
    Jun 2002
    Ort
    Saarbrücken (Saarland)
    Beiträge
    9.886
    Blog-Einträge
    29
    Hallo,

    eine Variante wäre HTMLUnit zu verwenden:
    http://htmlunit.sourceforge.net/faq....JAXDoesNotWork

    eine weitere Möglichkeit wäre die Verwendung eines Webdrivers (Selenium) http://code.google.com/p/selenium/?redir=1

    Gruß Tom
     
    Java rocks!
    How to become a good Java Programmer?
    Does IT in Java and .Net
    The only valid measurement of code quality: WTFs / minute
    Blog
    Xing
    Twitter

  4. #4
    christian- christian- ist offline Grünschnabel
    Registriert seit
    Feb 2012
    Beiträge
    2
    Hi!

    Also erst einmal vielen Dank für eure Antworten! Das klingt schon alles ziemlich kompliziert und ich bin kein Experte auf dem Gebiet. Ich habe gehofft, es wäre etwas einfacher

    Gruß Christian
     

Ähnliche Themen

  1. Shadowbox.setup() bei dynamischen Inhalten
    Von deb_ugger im Forum Javascript & Ajax
    Antworten: 3
    Letzter Beitrag: 07.02.11, 08:29
  2. Antworten: 7
    Letzter Beitrag: 14.05.09, 17:32
  3. Antworten: 12
    Letzter Beitrag: 13.02.08, 16:30
  4. Antworten: 3
    Letzter Beitrag: 28.08.06, 10:39
  5. Antworten: 10
    Letzter Beitrag: 12.08.04, 10:43