tutorials.de Buch-Aktion 05/2012
ERLEDIGT
NEIN
ANTWORTEN
4
ZUGRIFFE
369
EMPFEHLEN
  • An Twitter übertragen
  • An Facebook übertragen
AUF DIESES THEMA
ANTWORTEN
  1. #1
    Centin Centin ist offline Mitglied
    Registriert seit
    May 2006
    Beiträge
    11
    Hi,
    ich hätte mal ne bekloppte:
    Kann man nur den <body> Tag einer Seite laden?

    Ich will ein Programm schreiben das 10 Seiten alle 60 Sekunden in einer DB abspeichert um nachher bestimmte Trends zu untersuchen. Jetzt hab ich geguckt und musste mit Entsetzen feststellen dass diese ca. 150KB groß sind und das nur der Quellcode, also ohne Bilder, Flash, etc. . Das wären dann Gigabytes an Daten die ich speichern/übertragen müsste. Habt ihr vielleicht andere Ansätze wie man das Problem lösen könnte?

    Ich denke wenn ich den Header nicht mitübertragen muss dann spare ich schon paar KBs wegen javascripts, aber ich bin da selber skeptisch ob es möglich ist.

    Danke im Voraus!

    Centin
     

  2. #2
    Avatar von einfach nur crack
    einfach nur crack einfach nur crack ist gerade online mag Cookies & Kekse
    tutorials.de Premium-User
    Registriert seit
    May 2007
    Ort
    Dresden (Sachsen)
    Beiträge
    1.956
    Es ist definitiv nicht möglich nur den body-Tag direkt von einer Seite zu laden.
     
    Ich mag:
    • positive Bewertungen meiner Beiträge
    • ein Danke für meine hilfreichen Beiträge

    Dabei kann ich dir helfen: PHP --- Javascript --- Ruby --- Coffeescript --- CSS --- HTML --- Webtechnologien --- Shell --- UNIX

    ... noch was: falls du mit dem Thema hier fertig bist, dann kannst du es auch als erledigt markieren.

  3. #3
    Avatar von Dr Dau
    Dr Dau Dr Dau ist offline ich wisch hier durch
    Registriert seit
    Feb 2005
    Ort
    hinterm Mond gleich Links
    Beiträge
    6.160
    Blog-Einträge
    4
    Hallo!

    Du könntest die Seite laden und Dir mit regulären Ausdrücken die für Dich relevanten Teile raussuchen und nur diese in der Datenbank speichern.

    Scheinbar dreht es sich aber nicht um Deine Seiten..... sonst würde es sicherlich noch andere Möglichkeiten geben, als nur die ganze Seite auszulesen.
    Und da Du die Seiten im Minutentakt laden willst, könnte es sein dass es da dann Ärger geben könnte (Du verursachst eigentlich unnötigen und damit hohen Traffic).

    Gruss Dr Dau
     
    Schri-Schra-Schrödi *g*
    mehrspaltiges/zeiliges Seitenlayout mit DIV's und CSS
    Dinge, die mit Tabellen besser klappen als mit CSS
    Ausgabe von Datum/Zeit unabhängig von der Server Zeitzone [php]
    Meine Links zum Thema Linux (Last update: 29.10.2011)
    Kein Busen ist so flach wie das Niveau dieser Party!
    ----
    Alte Weisheit: wer uns in den Arsch kriecht wird beschissen!
    ----
    Ich habe 3 Kinder und kein Geld!
    Warum kann ich nicht keine Kinder haben und 3 Geld?! (Homer Jay Simpson)

  4. #4
    Centin Centin ist offline Mitglied
    Registriert seit
    May 2006
    Beiträge
    11
    Scheinbar dreht es sich aber nicht um Deine Seiten..... sonst würde es sicherlich noch andere Möglichkeiten geben, als nur die ganze Seite auszulesen.
    Und da Du die Seiten im Minutentakt laden willst, könnte es sein dass es da dann Ärger geben könnte (Du verursachst eigentlich unnötigen und damit hohen Traffic).
    Jap, hast mich erwischt Es sind Aktienkurse um genau zu sein. Aber ob ich da rumsitze und ständig F5 drücke oder einfach ein kleines Programm schreibe das sowas für mich erledigt ist doch egal, oder? Ich will ja nicht die Daten verkaufen oder veröffentlichen, sondern nur für eigene Spielereien benutzen. Außerdem hab ich schon Extentions für Firefox gesehen die ne Seite in bestimmten Intervallen aktualisieren, von daher sollte es den Betreibern also nicht besonders auffallen.
     

  5. #5
    Avatar von Sven Mintel
    Sven Mintel Sven Mintel ist offline Mitglied
    Registriert seit
    Aug 2003
    Beiträge
    18.238
    Blog-Einträge
    6
    Moin,

    so, wie es sich liest, ist dein Problem nicht, dass die Seiten 150kb gross sind, sondern dass du diese 150kb auch in die DB packst.

    Du könntest das vermeiden, indem du, sobald du den Quelltext hast, dort per bspw. RegExp nur die relevanten Daten herausfischt und auch nur diese in die DB einträgst, wie es bereits Dr.Dau vorschlug.

    Das Beste wäre natürlich, wenn du dir gleich einen Anbieter suchst, der nur die benötigten Daten bspw. als RSS-Feed anbietet.
     

Ähnliche Themen

  1. nach onload im body kann kein 2.script aufgerufen werden
    Von goodie im Forum Javascript & Ajax
    Antworten: 1
    Letzter Beitrag: 26.06.08, 10:16
  2. Sql abrufen und while
    Von Teddy7000 im Forum Relationale Datenbanksysteme
    Antworten: 7
    Letzter Beitrag: 25.07.07, 09:15
  3. IDs Abrufen
    Von supser im Forum Relationale Datenbanksysteme
    Antworten: 1
    Letzter Beitrag: 31.03.07, 15:15
  4. Antworten: 1
    Letzter Beitrag: 19.02.06, 15:23
  5. Alles vor <body> u. nach </body> löschen
    Von online-markus im Forum PHP
    Antworten: 3
    Letzter Beitrag: 05.03.05, 14:20