Zugriffsstatistik

Gumbo

Erfahrenes Mitglied
Ich entwickele gerade eine Zugriffsstatistik, basierend auf den Daten der Apache Logfile. Die dortigen Daten werden mittels eines Scriptes in eine MySQL-Datenbank eingefügt.

Nun stellt sich mir die Frage, ob sich dies überhaupt lohnt, immerhin sind es monatlich etwa 100000 Einträge.
Weitergehend beschäftige ich mich auch mit der Frage, wie eine Tabellen- bzw. Datenbankstruktur für solche Datenmengen aussieht, damit auch noch Abfragen effizient ausgeführt werden können.
 
Ich möchte nochmals nachhaken: Ist die Beschreibung zu abstrakt oder zu kompliziert, oder wisst ihr garnicht worüber ich spreche?

Redet mit mir! Auch wenn es nur ein „Du beschäftigst dich wirklich mit sinnlosen Dingen“ ist.
 
Nunja, die Frage ist meistens: Welche Daten brauchst du, und wie oft und in welchem Kontext (sollen die Daten nur von dir eingesehen werden oder von allen Besuchern deiner Seite) werden sie abgefragt?
 
Die Daten basieren auf den Daten der Apache-Logfile, welche schließlich etwa zehn verschienene Eigenschaften entsprechen. Hauptsächlich sollen die Daten für mich persönlich sein oder für die Webseite, um z. B. auf Fehlerseiten entsprechende Vorschläge zu geben. Für die Öffentlichkeit würde ich, wenn überhaupt, nur statische Statistiken zugägnlich machen.
 
Es gibt doch diverse Programme, die umfangreiche Auswertungen der Log-Files für Dich erledigen.
Ich habe jetzt leider keinen passenden Link parat, aber ich weiß, dass es sie gibt.
Wenn Du die Daten eh nicht dynamisch der Öffentlichkeit zur Verfügung stellen willst, halte ich es persönlich für sinnvoller, ein solches Tool zu verwenden.
Ich denke auch, dass Du bei der Datenflut an die Grenzen von PHP und MySQL (ich denke mal, das sind die typischen Systeme die auch auf Deinem Webserver zur Verfügung stehen?) stoßen wirst. Vor allem, wenn Du noch umfangreiche Statistik darauf loslässt.
Wenn Du das Projekt trotzdem fortsetzt würde ich Zwecks sinnvollerer Abfragen und Datenreduktion eine Datenbank mit mehreren Tabellen verwenden und bereits beim Eintragen eine Menge "sortieren".
Auf jeden Fall halte ich eine Tabelle für Deine eigenen URIs und eine für die Referrer für sinnvoll.
Datum und Uhrzeit würde ich auf jeden Fall als DATETIME speichern.
Wenn der Referrer von Deiner eigenen Seite kam, würde ich das auch so eintragen und eigene und fremde URIs getrennt behandeln. Evtl. mit einem Feld isLocalReferrer oder so ähnlich.
Die Statuscodes solltest Du natürlich auch nicht vergessen. Ich würde sie in eine eigene Tabelle schreiben, aber darüber gibt es sicher viele Meinungen.

Gruß hpvw
 

Neue Beiträge

Zurück