Java HTML Parser

gr170

Grünschnabel
Hi ich bin recht neu in Java und kann leider auch nicht gut Englisch. Nun ja aber vielleicht kann mir trotzdem einer weiterhelfen. Ich möchte aus einer Homepage Daten auslesen. Obwohl diese Daten dynamisch sind, müsste es nach meiner Ansicht gehen den Momentwert zu erfassen. Eigentlich habe ich alle mir zur Verfügung stehenden Mittel ausgeschöpft und bin recht ratlos.
Zuerst habe ich versucht mittels erstellen einer Bilddatei von dem Entsprechenden Bildausschnitt die Daten zu lesen. Fehlschlag, da die Daten über die zugängliche OCR Software Tesseract zu klein sind. Also anders gesagt es wird nichts erkannt oder eben falsch. Damit war das Vorhaben gescheitert.
Nun versuche ich über jsoup oder ähnliches die Daten auszulesen. Ich habe auch ein Video und mehre Beispiele gefunden. Das Video scheint vielversprechend zu sein, Allerdings fehlen einige Import Dateien und die Variable FileInputStream ist offensichtlich nicht geeignet Internetseiten aufzunehmen. Da bin ich schon mal gescheitert.
Alle Beispiele die ich gefunden habe gehen von einer geringen Verschachtelung aus. Da meine Daten recht tief verschachtelt sind muss ich die Methode mit XPath nutzen der XPhat sieht so aus. //*[@id="application"]/div/div[2]/div/div[2]/div[3]/div[2]/div/div[2]/div/div[1]/div/div[4]/div
Ich wäre dankbar wenn mir einer helfen könnte ich bin am verzweifeln. Das Video ist unter http://www.youtube.com/watch?v=jGHLBPOOnmU zur Info was ich will.
Bitte denkt dran ich bin Anfänger in Java also eine Zeile mehr ist bei mir besser als nur ein Brocken. Ich weiß das es so ein ähnliches Thema schon gegeben hat allerdings passte dies nicht dazu was ich eigentlich will.
 
Hi

a) darfst du die Daten der Homepage verwenden?
Frage deshalb, weil es sehr vielen Leuten nicht klar zu sein scheint,
dass "anschauen dürfen" nicht auch "automatisch verarbeiten dürfen" bedeutet.

b) Willst du eine Fertiglösung oder Hilfe bei einem (uns unbekannten) Versuch?

c) Nur ein allgemeiner Tipp: Programmieren nicht über Videos lernen.
Gründe gibt viele, aber vor allem lernt man es damit nicht.
 
zu 1 Ich mache das für einen Bekannten der ein Konto bei dem entsprechenden Anbieter hat, also ist es nicht illegal. Es giebt allerdings auf Nachfrage dort keine Benutzerschnittstelle.
zu 3 ich will nicht über das Video lernen, aber es war bisher das einzige was ich gefunden und auch einigermaßen nachfollziehen konnte. Leider ist eben mein englisch nicht so gut.
zu 2 ich denke eine Fertiglösung werde ich nicht bekommen können, da die Verarbeitung der Daten ja auch noch erfolgen muß. Daten speichern und verarbeiten, das ist einfacher für mich, da ich bereits in Pascale programmiert habe und auch mit Acces einige Anwendungen gemacht habe. ich denke ich werd zum speichern die lokale Datenbank H2 verwenden. Rechenoperationen und Umwandlungen sind analog Pascale hab ich festgestellt. Wenn mir einer beim Auslesen helfen kann, wäre ich schon etwas weiter. Da ich aber nicht unbedingt ein Profi in Java bin , ist eben mehr besser für mich.Ich denke, es kann nur besser werden, auch wenn es nur ein wenig Hilfe ist. Wenn du eine Fertiglösung in der Tasche hast nehm ich die natürlich gern.

Gerald
 
Zuletzt bearbeitet:
Zurück