Dateien vergleichen

All93rounder

Grünschnabel
Moin,

ich habe da ein Problem... Ich habe über die Jahre viele Bilder und Videoaufnahmen angesammelt von Urlauben und Reisen...
Nun wollte ich mich mal dem Problem wittmen das Verzeichnis aufzuräumen, jedoch sind viele Bilder doppelt vorhanden. Daher habe ich nun ein Script geschreiben, dass mir nach gewünschten Kriterien die Bilder ordnet...
Ich gekomme leider keine vernünftige Überprüfung hin, mit der ich überprüfen kann, ob bilder identisch oder nahezu sind (Qualitätsverluste)...

Kann mir jemand weiterhelfen?
Ich müsste an die Methode zwei Pfade übergeben können (Vergleich Pfad-A mit Pfad-B) und als Ausgabewert müsste ich eine Liste erhalten mit den Treffern...

Kennt jemand zufällig eine passende API?

Gurß flo
 

MAN

Erfahrenes Mitglied
Eine Möglichkeit für identische Bilder wäre folgende:

Code:
- Wenn die Dateigröße beider Dateien gleich ist, könnte der Inhalt schonmal identisch sein.
- Wenn zudem die Checksumme (bspw. MD5) beider Dateien gleich ist, SIND die beiden Dateien identisch.

Für ähnliche Dateien hatte ich mal einen sehr einfachen Algorythmus (ich hatte Audio-Dateien für das gleiche Problem verglichen). Ich hatte glaube ich einfach beide Dateien zeilenweise eingelesen und verglichen. Am Ende konnte man dann anhand der identischen und der nicht identischen Zeilen erahnen, ob die Dateien sich ähneln. Hatte ganz gut für MP3-Dateien funktioniert, allerdings wird das nicht funktionieren, wenn bei dir die Kompressionen und eventuell sogar Bildgrößen unterschiedlich sind.

Aber wenn du dazu einen guten Ansatz gefunden hast, lass es uns wissen!

Viele Grüße,
MAN