Ordnung in der Webseite

Status
Nicht offen für weitere Antworten.

mediaroad

Mitglied
Guten Morgen,

wie es manchaml so ist bekommt man auch mal Aufträge durch die man einfach nicht mehr durchsteigen kann. Sitze hier vor einer Webseite die von jemand anderem erstellt wurde und will diese aufräumen. In den Ordner befinden Sie teilweise Dokumente mit Bezeichnern wie "news1.html" oder "news_alt.php".
Leider besteht die Seite aus relativ vielen Dateien und nun die Frage, welche Möglichkeiten habe ich, überflüssige Dokumente zu ermitteln. Durchforschen wäre sicherlich zu aufwändig. Gibt es dafür Tools? Auch in einer generierten Sitemap finde ich nicht alle Dateien, da einige PHP Dateien nur inkludiert sind.

Wäre über einen Tipp sehr dankbar.
 
Hi,

meines Erachtens wirst du nicht darum herumkommen, die Zeit zu investieren, alle Dokumente / Dateien zu sichten, um zu überprüfen, ob sie im Projekt noch benötigt werden.

mfg Maik
 
Wie wäre es, wenn du dir das ganze in einen lokalen XAMP lädst.
Dann surfst du die gesamte Seite ab.
Danach müsstest du über die Log-Dateien des Apache alle heruntergeladenen bzw. angesprochenen Seiten finden können.
(ungetestet, würde ich aber mal von ausgehen)
 
@Maik: Ok, das mit dem aufwendigen testen wollte ich ja eigentlich vermeiden :rolleyes:

@shutdown: Das hatte ich auch schon überlegt, dies würde ja auch über den eigentlichen Webserver gehen, wobei ich angenommen habe, dass dort nicht die abgerufenen/inkludierten *.php Dokumente aufgeführt werden oder?

Wenn keiner mehr eine Idee hat muss ich mich wohl die Tag einfach ranmachen und es sortieren.
 
Ich bin mir da jetzt nicht sicher, aber rein von der Logik her, muss ein Webserver jede in irgendeiner Form abgerufene Datei loggen, inkludiert oder nicht. Letztlich läuft das Inkludieren ja auf dem Webserver - Zugriff auf die Daten des Vorgangs inkludieren hat er somit allemal
 
in der log-datei werden in der regel alle dateien angezeigt die aufgerufen werden. also auch die verwendeten .php dateien
 
Ok dann werde ich das zu Beginn der Folgewoche mal durchführen. Danke für die Tipps und ich werde mich danach wieder melden.

Allen ein schönes Wochenende!
 
kannst du nicht eine Art Web-Spider laufen lassen? Die Reichweite auf deinen Server eingrenzen und irgendwie bewerkstelligen, dass die php-Dateien nicht geparst werden, also zum Beispiel alles herunterladen. Wenn es sehr viele Dateien sind, würde es sich schon lohnen, die php-Dateien nach Links zu durchforsten -> ev. Tool selber schreiben.

grz
 
Naja...geloggt werden ja nur HTTP-Zugriffe, und ein solcher erfolgt nicht beim inkluden.

Du könntest per RegExp alle Dateien nach allen Dateinamen durchsuchen, wenn ein Dateiname nirgends auftaucht, könnte man davon ausgehen, dass sie nirgends mehr benötigt wird.
Das würde allerdings vorraussetzen, dass die Dateinamen dort immer am Stück notiert sind und nicht zusammengesetzt werden, was ja auch nicht so unüblich ist.
 
Status
Nicht offen für weitere Antworten.

Neue Beiträge

Zurück