Hallo zusammen...
Habe da ein "Problem".
Ich soll eine Suche programmieren, die in einer ziemlich großen Ordnerstruktur von pdf-Dateien sucht. (ca 2 GB groß....)
Die PDF-Dateien liegen in vielen Unterverzeichnissen.
Beispiel:
pdfs/häuser/1.pdf
pdfs/häuser/2.pdf
pdfs/autos/1.pdf
pdfs/autos/2.pdf
pdfs/autos/rot/1.pdf
pdfs/autos/blau/2.pdf
pdfs/autos/blau/gestreift/2.pdf
Dies könnten beispielsweise Dateien aus dieser Ordnerstruktur sein.
Die Unterordner sind nicht "fest", d.H. es können neue hinzu kommen oder entfernt werden usw.
Ich benötige nun ein Script, welches alle diese Ordner durchgeht, und mir quasi einen SQL-Index liefert, in dem ich dann suchen kann.
Es soll also jeder Dateiname in die Spalte "name" und jeder Dateifad in die Spalte "Fad" überführt werden. Da es ja aber wie gesagt keine festen Ordner sind, und die Zahl der Dateien mächtig groß ist, bin ich da ein bisschen überfragt.
Das ganze soll hinterher eine art Job werden... D.H. die "Suchdatenbank" wird alle X Tage neu erstellt.
Hat da jemand einen Codeschnipsel für mich, der mir da weiterhelfen könnte?
lG
PS: Achja, würde diesen "Crawler" gerne mit PHP umsetzen ;-)
Habe da ein "Problem".
Ich soll eine Suche programmieren, die in einer ziemlich großen Ordnerstruktur von pdf-Dateien sucht. (ca 2 GB groß....)
Die PDF-Dateien liegen in vielen Unterverzeichnissen.
Beispiel:
pdfs/häuser/1.pdf
pdfs/häuser/2.pdf
pdfs/autos/1.pdf
pdfs/autos/2.pdf
pdfs/autos/rot/1.pdf
pdfs/autos/blau/2.pdf
pdfs/autos/blau/gestreift/2.pdf
Dies könnten beispielsweise Dateien aus dieser Ordnerstruktur sein.
Die Unterordner sind nicht "fest", d.H. es können neue hinzu kommen oder entfernt werden usw.
Ich benötige nun ein Script, welches alle diese Ordner durchgeht, und mir quasi einen SQL-Index liefert, in dem ich dann suchen kann.
Es soll also jeder Dateiname in die Spalte "name" und jeder Dateifad in die Spalte "Fad" überführt werden. Da es ja aber wie gesagt keine festen Ordner sind, und die Zahl der Dateien mächtig groß ist, bin ich da ein bisschen überfragt.
Das ganze soll hinterher eine art Job werden... D.H. die "Suchdatenbank" wird alle X Tage neu erstellt.
Hat da jemand einen Codeschnipsel für mich, der mir da weiterhelfen könnte?
lG
PS: Achja, würde diesen "Crawler" gerne mit PHP umsetzen ;-)