Content Grab von geschützter Seite

Feely

Mitglied
Guten Morgen,

das Prinzip des Grabben als solches ist mir bekannt und funktioniert auch, allerdings brauche ich Informationen die von einer Seite kommt die mit einem Login geschützt ist.

Bevor jetzt alle Sirenen anspringen... ich habe die Zugangsdaten zu dieser Seite und es ist auch nichts illegales. Wir nutzen hier ein Druckerüberwachungstool welches Zählerstande und Füllstände von Tonern anzeigt. Leider bietet mir der Dienst keine Statistik.

Mein Plan...von jedem dieser Geräte jeden Tag zu bestimmten Zeiten die Tonerstände auslesen und entsprechend auswerten.

So... Das Problem ist aber wie gesagt das diese Seite per Login läuft und ich weiß nicht wie ich diesen in das Grabber-Script übernehmen kann. Meine ersten Versuche sowie google lassen mich jedoch daran zweifeln das es überhaupt funktioniert...

Bin für Anregungen jeder Art dankbar.
 
Guten Morgen Feely,

ich würde cURL empfehlen. Damit kannst du einen Browser simulieren und insbesondere Cookies, die meist für Logins benutzt werden.

Folgendes musst du abarbeiten:
  1. Login
  2. Abgreifen der spezifischen Seite
Wie der Login genau funktioniert, hängt immer von der verwendeten Plattform seitens des Servers ab.
Meist ist es aber ein Formular. Wenn du Glück hast, hat dieses keinen CSRF-Schutz (siehe Wikipedia, was das ist), denn dann müsstest du einfach das Abschicken des Login-Formulars mittels cURL simulieren.
Hat das Formular allerdings einen CSRF-Schutz, musst du zuerst die Login-Seite abgreifen, das CSRF-Token auslesen und dann das Abschicken des Formulas inklusive des vorher ermittelten Tokens simulieren.

Ich hoffe mal, dass dein Loginsystem in eine dieser zwei Kategorien fällt.
 
Schon ne Weile her....aber ich mach das nur neben meiner eigenltichen Arbeit hier.

Ich weiss nicht genau, ob ich das Problem verstanden habe, aber die URL könntest Du vermutlich mit http://benuterzname:passwort@DruckerIP aufrufen. Dann müsstest Du angemeldet sein.

Im Prinzip richtig, jedoch komme ich ja von hier nicht in die Netzwerke unserer Kunden. Auf den Kundenservern läuft ein Dienst der die Stände alle 2h an einen Server schickt. Dort werden die Daten gespeichert und dort kann ich mich in das Frontend einloggen und die ganzen Werte einsehen. Da diese Seite jedoch ein bunter Mix aus Java und ASPX ist komme ich da mit meinen PHP Kentnissen einfach nicht weiter was das Grabben angeht.

Hab es jetzt über automatisierten CSV Datenexport gelöst der mir jeden Tag zugeschickt wird. Den wiederum muss ich zwar manuell hochladen, aber besser als nix.

Sorry für die späte Antwort :>
 
Zurück