HTML Dateien Skriptbasiert modifizieren und abspeichern

Carrear

Erfahrenes Mitglied
Hi Leute,

ich habe einen riesen Stapel an HTML Dateien (ca. 3000 Stück), welche ich gerne via php, automatisiert bearbeiten möchte. Alle dieses Dateien enthalten ein komplettes HTML Grundgerüst mit Inhalt im Body-Bereich.

Diese möchte ich automatisiert öffnen, und das 'Drumherum' löschen und abspeichern, sodass am Ende nur noch der Inhalt des Body Tags in der Datei verbleibt. Kann mir vielleicht jemand grob skizzieren wie ich vorgehen kann, bzw. wie und mit welchen Befehlen ich Dateien öffne, den entsprechenden Inhalt eingrenze, alles andere lösche und dann abspeichere?

Viele Grüße
Martin
 
"m' löschen und abspeichern, sodass am Ende nur noch der Inhalt des Body Tags in der Datei verbleibt. Kann mir vielleicht jemand grob skizzieren wie ich vorgehen kann, bzw. wie und mit welchen Befehlen ich Dateien öffne, den entsprechenden Inhalt eingrenze, alles andere lösche und dann abspeichere?"
Da kannste auch geich fragen wer schreibt mir das Skript?
Wenn ich dir jetzt (Recursive)DirectoryIterator und DOMDocument an den Kopf werfe (Ja, mit denen beiden geht alles oben genannte, außer du willst etwas in einer Datenbank speichern), kannst du damit vermutlich wenig anfangen, oder?
 
1. Mir dir() das Verzeichnis öffnen
2. mit while ... ->read() die einzelnen Dateien aus dem Verzeichnis lesen
3. mit file_get_contents() den Inhalt der Dateien auslesen
4. mit explode('<body'> ... den Anfang abschneiden
5. mit explode('</body'> ... das Ende abschneiden
6. mit file_put_contents() das Ergebnis in eine neue Datei schreiben
7. glücklich sein.
 
alxy sonst ist aber alles cool? Du solltest mir nicht die Iteration für das auslesen des Verzeichnisses schreiben. Ich habe um eine GROBE SKIZZIERUNG gebeten, welche befehle ich zur Lösung des Kernbproblems (alles was in der Datei passiert) nutzen kann. Danke an die Person, die mir mit 7 Zeilen Text, unproblematisch geholfen hat.
 
Zurück