tutorials.de Buch-Aktion 05/2012
ERLEDIGT
NEIN
ANTWORTEN
3
ZUGRIFFE
2290
EMPFEHLEN
  • An Twitter übertragen
  • An Facebook übertragen
AUF DIESES THEMA
ANTWORTEN
  1. #1
    Nicole706 Nicole706 ist offline Grünschnabel
    Registriert seit
    Dec 2007
    Beiträge
    1
    Hi zusammen...

    Ich beiß mir jetzt schon ne zeit lang die Zähne an dem Problem aus, aber ich weiß nicht weiter... Hab schon diverse Foren durchsucht aber finde leider keine Antwort...
    Ich möchte eine HTML-Datei über eine URL aufrufen und dann dort z.B. nur die Inhalte bestimmter Tags, wie zum Beispiel Tabellen-Inhalte auslesen.

    Das Aufrufen der HTML funktioniert. Mit einem Iterator springe ich zu den relevanten Tags (z.B. TD). Ich kann zwar auf die Tag-Attribute zugreifen, aber ich weiß nicht wie ich die Inhalte (also den Bereich zwischen z.B. <TD> und </TD>) nach dem Iterator auslesen kann...

    Hier mal mein bisheriger Code:

    Code :
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    
    public class AmazonFavList {
     
       public static void main(String[] args) throws Exception {
     
             URL url = new URL("http://www.amazon.de/quot-design-quot/lm/RZIQFD0IQ5KPV"); //nur eine Beispiel-URL
             URLConnection connection = url.openConnection();
     
             BufferedReader buffer = new BufferedReader(new InputStreamReader(connection.getInputStream()));
     
             HTMLEditorKit editorKit = new HTMLEditorKit();
             HTMLDocument htmlDoc = new HTMLDocument();
             htmlDoc.putProperty("IgnoreCharsetDirective", Boolean.TRUE);
             editorKit.read(buffer, htmlDoc, 0);
     
             HTMLDocument.Iterator iter = htmlDoc.getIterator(HTML.Tag.TD);
     
             // hier würde ich jetzt gerne auf den Inhalt zugreifen....



    Wär für Eure Hilfe sehr dankbar...

    Vielen Dank!

    Nicole
     

  2. #2
    mk666 mk666 ist offline Mitglied Bronze
    Registriert seit
    Aug 2007
    Beiträge
    48
    HTMLEditorKit und HTMLDocument sind eigentlich Swing-Komponenten und eher für die Benutzung in GUIs gedacht. Für deinen Fall bietet sich eher ein SAXParser an.

    Kurze Einführung in SAX: http://www.galileocomputing.de/openb...c680b9e1486ea7
     

  3. #3
    Avatar von takidoso
    takidoso takidoso ist offline Mitglied Brillant
    Registriert seit
    Aug 2004
    Ort
    Kömigstein
    Beiträge
    911
    Also ich habe mir mal kurz dne Code von der Klasse HTMLDocument überflogen. Ich denke da müsste alles für Dein Unterfangen drinn sein.
    Der Iterator der ausgeeben wird ist offenbar ein LeafIterator. Du kannst wenn Du ein Tag suchst dir den start und Endoffset geben lassen. Vielleicht hilft Dir das ja schon weiter.

    Takidoso
     

  4. #4
    Avatar von takidoso
    takidoso takidoso ist offline Mitglied Brillant
    Registriert seit
    Aug 2004
    Ort
    Kömigstein
    Beiträge
    911
    Ich habe da noc mal ein bischen für Dich gegoogelt.
    ein interessanter Link zu einem Thread, der in seinen Antworten noch weitere Links beinhalter ist der folgende
    http://forum.de.selfhtml.org/archiv/2003/11/t63874/

    Viel Spaß und Glück

    Takidoso
     

Ähnliche Themen

  1. Antworten: 1
    Letzter Beitrag: 03.09.10, 11:19
  2. einzelne Tabelleninhalte neuladen
    Von fanste im Forum Javascript & Ajax
    Antworten: 2
    Letzter Beitrag: 04.05.05, 02:09
  3. Einzelne Tabelleninhalte neuladen
    Von fanste im Forum HTML-Editoren
    Antworten: 2
    Letzter Beitrag: 03.05.05, 18:43
  4. DB Inhalte in HTML - Repeater?
    Von Daijin im Forum .NET Archiv
    Antworten: 0
    Letzter Beitrag: 18.09.03, 08:36
  5. HTML-Inhalte beeinflussen
    Von wenco im Forum HTML & XHTML
    Antworten: 4
    Letzter Beitrag: 02.09.03, 07:23