ERLEDIGT
NEIN
NEIN
ANTWORTEN
4
4
ZUGRIFFE
369
369
EMPFEHLEN
-
Hi,
ich hätte mal ne bekloppte:
Kann man nur den <body> Tag einer Seite laden?
Ich will ein Programm schreiben das 10 Seiten alle 60 Sekunden in einer DB abspeichert um nachher bestimmte Trends zu untersuchen. Jetzt hab ich geguckt und musste mit Entsetzen feststellen dass diese ca. 150KB groß sind und das nur der Quellcode, also ohne Bilder, Flash, etc. . Das wären dann Gigabytes an Daten die ich speichern/übertragen müsste. Habt ihr vielleicht andere Ansätze wie man das Problem lösen könnte?
Ich denke wenn ich den Header nicht mitübertragen muss dann spare ich schon paar KBs wegen javascripts, aber ich bin da selber skeptisch ob es möglich ist.
Danke im Voraus!
Centin
-
17.05.10 19:13 #2
- Registriert seit
- May 2007
- Ort
- Dresden (Sachsen)
- Beiträge
- 1.956
Es ist definitiv nicht möglich nur den body-Tag direkt von einer Seite zu laden.
Ich mag:- positive Bewertungen meiner Beiträge
- ein Danke für meine hilfreichen Beiträge
Dabei kann ich dir helfen: PHP --- Javascript --- Ruby --- Coffeescript --- CSS --- HTML --- Webtechnologien --- Shell --- UNIX
... noch was: falls du mit dem Thema hier fertig bist, dann kannst du es auch als erledigt markieren.
-
17.05.10 20:43 #3
Hallo!
Du könntest die Seite laden und Dir mit regulären Ausdrücken die für Dich relevanten Teile raussuchen und nur diese in der Datenbank speichern.
Scheinbar dreht es sich aber nicht um Deine Seiten..... sonst würde es sicherlich noch andere Möglichkeiten geben, als nur die ganze Seite auszulesen.
Und da Du die Seiten im Minutentakt laden willst, könnte es sein dass es da dann Ärger geben könnte (Du verursachst eigentlich unnötigen und damit hohen Traffic).
Gruss Dr DauSchri-Schra-Schrödi *g*
mehrspaltiges/zeiliges Seitenlayout mit DIV's und CSS
Dinge, die mit Tabellen besser klappen als mit CSS
Ausgabe von Datum/Zeit unabhängig von der Server Zeitzone [php]
Meine Links zum Thema Linux (Last update: 29.10.2011)
Kein Busen ist so flach wie das Niveau dieser Party!
----
Alte Weisheit: wer uns in den Arsch kriecht wird beschissen!
----
Ich habe 3 Kinder und kein Geld!
Warum kann ich nicht keine Kinder haben und 3 Geld?! (Homer Jay Simpson)
-
Jap, hast mich erwischtScheinbar dreht es sich aber nicht um Deine Seiten..... sonst würde es sicherlich noch andere Möglichkeiten geben, als nur die ganze Seite auszulesen.
Und da Du die Seiten im Minutentakt laden willst, könnte es sein dass es da dann Ärger geben könnte (Du verursachst eigentlich unnötigen und damit hohen Traffic).
Es sind Aktienkurse um genau zu sein. Aber ob ich da rumsitze und ständig F5 drücke oder einfach ein kleines Programm schreibe das sowas für mich erledigt ist doch egal, oder? Ich will ja nicht die Daten verkaufen oder veröffentlichen, sondern nur für eigene Spielereien benutzen. Außerdem hab ich schon Extentions für Firefox gesehen die ne Seite in bestimmten Intervallen aktualisieren, von daher sollte es den Betreibern also nicht besonders auffallen.
-
Moin,
so, wie es sich liest, ist dein Problem nicht, dass die Seiten 150kb gross sind, sondern dass du diese 150kb auch in die DB packst.
Du könntest das vermeiden, indem du, sobald du den Quelltext hast, dort per bspw. RegExp nur die relevanten Daten herausfischt und auch nur diese in die DB einträgst, wie es bereits Dr.Dau vorschlug.
Das Beste wäre natürlich, wenn du dir gleich einen Anbieter suchst, der nur die benötigten Daten bspw. als RSS-Feed anbietet.
Ähnliche Themen
-
nach onload im body kann kein 2.script aufgerufen werden
Von goodie im Forum Javascript & AjaxAntworten: 1Letzter Beitrag: 26.06.08, 10:16 -
Sql abrufen und while
Von Teddy7000 im Forum Relationale DatenbanksystemeAntworten: 7Letzter Beitrag: 25.07.07, 09:15 -
IDs Abrufen
Von supser im Forum Relationale DatenbanksystemeAntworten: 1Letzter Beitrag: 31.03.07, 15:15 -
Kann ich Schriftarten am Server auslagern und diese dort abrufen?
Von Newcomer1 im Forum HTML & XHTMLAntworten: 1Letzter Beitrag: 19.02.06, 15:23 -
Alles vor <body> u. nach </body> löschen
Von online-markus im Forum PHPAntworten: 3Letzter Beitrag: 05.03.05, 14:20





Zitieren

Login





