tutorials.de Buch-Aktion 05/2012
Seite 1 von 2 12 LetzteLetzte
ERLEDIGT
NEIN
ANTWORTEN
17
ZUGRIFFE
1130
EMPFEHLEN
  • An Twitter übertragen
  • An Facebook übertragen
AUF DIESES THEMA
ANTWORTEN
  1. #1
    aboony aboony ist offline Rookie
    Registriert seit
    Sep 2011
    Beiträge
    5
    Hallo,

    man nehme folgende Seite:
    http://ecal.forexpros.de/e_cal.php
    und versuche die (stets aktualisierten) Daten auszulesen.

    Meine Fragen:

    Geht das überhaupt?
    Hat jemand eine Idee?

    Ja, es gibt real-time Data Feeds, aber die kosten satte Summen. Dies hier ist ein Low-Budget-Projekt...

    Für Vorschläge wäre ich sehr dankbar.

    Bert
     

  2. #2
    Avatar von Fabio Hellmann
    Fabio Hellmann Fabio Hellmann ist offline Mitglied Brokat
    Registriert seit
    Aug 2011
    Ort
    München
    Beiträge
    494
    Hi aboony und Willkommen bei Tutorials.de,
    für java gibt es bereits mehrere HTML-Parser. Mit denen ist es möglich diese Seite zu parsen und den Inhalt aus der Tabelle raus zu filtern. Hier ein HTML-Parser.

    Gruß

    Fabio
     
    Bitte die Code-Tags verwenden. Bei Java-Code: [java]...[/java]

    Tutorials:
    Automatisches erzeugen eines Inhaltsverzeichnisses (Javascript)
    JAnimationPanel - Animationen für Swing/AWT
    SWTRatingBar (Bewertungs-Composite) selbst programmieren
    ____________________________________________________________________________
    Über eine Bewertung (Stern links unter dem Beitrag) oder ein Danke freue ich mich sehr.

  3. #3
    aboony aboony ist offline Rookie
    Registriert seit
    Sep 2011
    Beiträge
    5
    Auf Parsen wollte ich weitgehend verzichten, weil die Seiten echt viel HTML-Text enthalten. Parsen wäre eigentlich die Notlösung.

    Sonst noch eine Idee?
     

  4. #4
    SE Tutorials.de Gastzugang
    Naja was hast du dir denn Vorgestellt ? Du bekommst vom Server nunmal nur ne HTML ... und die musst du selbst parsen und verarbeiten. Oder was genau wolltest du ?
     

  5. #5
    aboony aboony ist offline Rookie
    Registriert seit
    Sep 2011
    Beiträge
    5
    Hm, na ja, vielleicht so etwas wie
    linkBlaBla/e_cal.php?getRowData=1

    OK, OK! Ich sehe es ein. Mann darf ja noch träumen. Dann eben Parsen...

    Danke.
     

  6. #6
    SE Tutorials.de Gastzugang
    Wenn es dein Script wäre könntest du es ja so einprogrammieren ... aber es ist nun mal nicht dein Script. Und wenn derjenige der das Script geschrieben hat so eine Funktion nicht implementiert hat dann kannst du zwar an das GET alles Mögliche ranhängen ... wirst aber keine andere Antwort bekommen.

    btw : du meinst das doch nicht ernst das man ein PHP so einfach manipulieren könnte oder ?
     

  7. #7
    aboony aboony ist offline Rookie
    Registriert seit
    Sep 2011
    Beiträge
    5
    Nun trampel nicht weiter auf mir herum: ich habe mich schon mit dem Parsen abgefunden.

    Woher soll ich es wissen? PHP ging bislang an mir vorüber...
     

  8. #8
    SE Tutorials.de Gastzugang
    Kurze Erläuterung : das was nach dem ? an einer URL steht sind Parameter für PHP ... ähnlich den Startparametern in Java ...
    Analog : wenn du in Java die Abfrage der Parameter nicht implementierst kannst du ja dranhängen was du willst und es passiert nichts ... genau so ist das bei PHP ... wenn du da nicht explizit was mit diesen Parametern machst werden sie schlicht ignoriert.
     

  9. #9
    aboony aboony ist offline Rookie
    Registriert seit
    Sep 2011
    Beiträge
    5
    OK. Und wer das Skript nicht kennt, kennt die Parameter nicht...ärgerlich.

    Wenn man mal Zeit hat, könnte man dann ein Skript entwickeln, welches alle möglichen Parameter ausprobiert. Klappt aber dann vermutlich nur, wenn es überhaupt zugreifbare Parameter gibt, nicht wahr?

    Tja. Fazit: Parsen...
     

  10. #10
    SE Tutorials.de Gastzugang
    Nun ... da PHP in der Regel in ANSI programmiert wird ... und irgendwo mal Schluss mit differenzierung ist *ich glaube wie in C nach der 28ten Stelle des Bezeichners* bleiben immer noch 62^28 mögliche Bezeichnerkombinationen. Und selbst dann auch nur wenn überhaupt eine Paramterabfrage stattfindet. Und dann musst du noch rausbekommen welche Werte für die Parameter überhaupt möglich sind ...
    Da eine URL aber nur eine maximale Länge von 255 Zeichen haben darf *zumindest soweit ich das richtig im Kopf hab* und sowohl Server als auch Script sehr kurze Namen haben indeinem fall mehr als 200 Stellen die du mit 62 Zeichen belegen kannst ... also 62^200 ... na dann mal VIEL SPASS.
     

  11. #11
    genodeftest genodeftest ist offline Mitglied Brillant
    Registriert seit
    Jun 2009
    Beiträge
    870
    Zitat Zitat von SPiKEe Beitrag anzeigen
    Nun ... da PHP in der Regel in ANSI programmiert wird ...
    Kann ich mir nicht vorstellen. Warum sollte man so einen Unfug machen?
    Meines Wissens wird PHP üblicherweise in UTF-8 geschrieben.
     
    Code bitte so einfügen: [java]System.out.println("Hallo");[/java] (Analog für andere Programmiersprachen)
    Code java:
    1
    
    System.out.println("Hallo");
    hilfreich zu Java: Really Big Index, Java ist auch eine Insel Band 1 und Band 2.
    ___________
    Ubuntu Bug #1: Microsoft has a majority market share
    Casecon: Projekt leiser Käse

  12. #12
    genodeftest genodeftest ist offline Mitglied Brillant
    Registriert seit
    Jun 2009
    Beiträge
    870
    @Thread: Manche Anbieter solcher Daten stellen auch eine API bereit, auf die man über spezielle Protokolle oder mit Hilfe von JSON-Abfragen zugreifen kann. Es wäre einfacher, wenn du eine solche API findest!
    An sonsten: Ausprobieren würde ich nicht, der Server wird deine IP nach einigen hundert Abfragen ignorieren (aus Schutz vor Überlastung). Es ist erfolgsversprechender (aber programmiertechnisch deutlich Aufwändiger) die JavaScripte auszuführen.
     
    Code bitte so einfügen: [java]System.out.println("Hallo");[/java] (Analog für andere Programmiersprachen)
    Code java:
    1
    
    System.out.println("Hallo");
    hilfreich zu Java: Really Big Index, Java ist auch eine Insel Band 1 und Band 2.
    ___________
    Ubuntu Bug #1: Microsoft has a majority market share
    Casecon: Projekt leiser Käse

  13. #13
    SE Tutorials.de Gastzugang
    Zitat Zitat von genodeftest Beitrag anzeigen
    Kann ich mir nicht vorstellen. Warum sollte man so einen Unfug machen?
    Meines Wissens wird PHP üblicherweise in UTF-8 geschrieben.
    Ja ... PHP selbst schon ... aber wenn man unter Windows arbeitet werden die Scripte nur als ANSI-Text gespeichert ... ich weis nicht wie es unter anderen Systemen ist.
     

  14. #14
    genodeftest genodeftest ist offline Mitglied Brillant
    Registriert seit
    Jun 2009
    Beiträge
    870
    Du meinst wahrscheinlich US-ASCII...

    Und das Problem ist höchstwahrscheinlich, dass der MS Editor (und andere schlechte Editoren) nur us-ascii oder eine CP12xx / ISO-8859-xx-Variante können. PHP wird aber höchstwahrscheinlich mit UTF-8 oder UTF-16 (wie Java, .NET, KDE/Qt, Mac OS X, Windows (System) seit NT, ...) arbeiten und dementsprechend auch Sonderzeichen verarbeiten können.

    Windows-Notepad hat allerdings massive Probleme bei der Codierung von Dateien, siehe https://secure.wikimedia.org/wikiped..._hid_the_facts
     
    Code bitte so einfügen: [java]System.out.println("Hallo");[/java] (Analog für andere Programmiersprachen)
    Code java:
    1
    
    System.out.println("Hallo");
    hilfreich zu Java: Really Big Index, Java ist auch eine Insel Band 1 und Band 2.
    ___________
    Ubuntu Bug #1: Microsoft has a majority market share
    Casecon: Projekt leiser Käse

  15. #15
    SE Tutorials.de Gastzugang
    Hmm ... wenn du den Wiki-Post mal selbst durchgelesen hättest wüsstest du das ich schon ANSI meine.
    Zitat aus dem Wiki-Post
    If the file is saved as "UTF-8" rather than "ANSI" (which in reality means Windows-1252 on systems using western european languages) the text displays correctly, because Notepad prepends the UTF-8 byte order mark, which is a different pattern that does not trigger this bug. UTF-8 without the byte order mark would still trigger the bug, as it is identical to ASCII.
    Dessweiteren auch ein Screenshot von Notepad unter Win7 Ulti x64
    Daten aus PHP Tabelle auslesen-ansi-code.jpg
    Ich meinte es schon genau so wie gesagt habe das Win standardmäßig in ANSI speichert ... und nicht in ASCII.

    Dessweiteren gibt es einen sehr lustigen Bug in Win7 :
    Da ich selber nur den Notepad2 verwende habe ich es natürlich mit diesem auch ausprobiert. Erstaunlicher weise stimmt es was im Wiki-Post steht : unter Win7 wurde es gefixt ... allerdings nur im Notepad selbst ... die Win-API auf die alle anderen Programme zugreifen enthält diesen Fehler weiterhin wesshalb bei einem ANSI-Text der Bug sogar im Notepad2 auftritt.
     

Ähnliche Themen

  1. Daten aus Tabelle von Webseite auslesen
    Von Umbra im Forum Java
    Antworten: 10
    Letzter Beitrag: 19.02.12, 21:25
  2. csv-Daten aus Tabelle auslesen
    Von kbit im Forum PHP
    Antworten: 7
    Letzter Beitrag: 03.04.10, 12:29
  3. Daten aus 2 ter Tabelle Auslesen
    Von counteract im Forum PHP
    Antworten: 8
    Letzter Beitrag: 09.08.06, 12:34
  4. Timestamp-Daten aus Tabelle auslesen
    Von oliPro im Forum PHP
    Antworten: 2
    Letzter Beitrag: 11.03.05, 21:04
  5. Daten aus Access-Tabelle auslesen...WIE?
    Von Blooby im Forum Visual Basic 6.0
    Antworten: 7
    Letzter Beitrag: 29.03.04, 21:43

Stichworte