[AI] Muster erkennen lernen

Parantatatam

mag Cookies & Kekse
Ahoi allerseits,

es ist jetzt schon eine gefühlte Ewigkeit her, dass ich mich zum letzten Mal hier in diesem Forum herumgetrieben habe, auch wenn es immer wieder Momente gab, in denen ich mir dachte, dass ich doch mal wieder aktiver werden sollte. Aber Ihr kennt das: Studium, Arbeit, Familie, Freundin... man hat so viel um die Ohren und dann kommt man doch nicht dazu. Das hat aber mit meinem Problem nicht im geringsten etwas zu tun :D

Mein Problem ist folgendes: ich bin gerade dabei als Übersicht meiner Finanzen ein Programm zu schreiben, in dem ich alle Transaktionen, ob über Banken oder über Bargeld, festhalten will, und dazu noch zusätzliche Informationen sammeln möchte, wie Kassenzettel, Bestellungen, etc. Soweit funktioniert das auch alles, jedoch habe ich ein Problem damit, dass ich bei Banktransaktionen aus dem Verwendungszweck Informationen wie Ende-zu-Ende-Referenz, Gläubiger-ID, Mandatsreferenz und Kontonummer/BLZ/IBAN ermitteln möchte. Ihr braucht jetzt nicht genau wissen, was das ist, sondern nur, dass diese manchmal im Verwendungszweck stehen und manchmal nicht. Außerdem gibt es kein einheitliches Format, wie diese im Verwendungszweck markiert sind.

Jetzt also die Frage: wie kann ich diese Muster erkennen, ohne dass ich sie über e.g. reguläre Ausdrücke definieren muss? Es bietet sich ja Fuzzy String Matching an und dann genauer noch N-Gramme, aber so etwas wie eine Levenshtein-Distanz funktioniert deshalb schon nicht, weil sich e.g. jede IBAN zwar vom Aufbau her und der Länge ähnelt, aber alle Ziffern darin variieren können.

Im Anhang seht Ihr ein Beispiel dafür, wie so ein Verwendungszweck (hier von Amazon) aussehen kann.
 

Anhänge

  • Verwendungszweck.png
    82,2 KB · Aufrufe: 20

Spyke

Premium-User
der screenshot funktioniert nicht.

Aber schau mal ob du von deiner Bank die daten eventuell im MT940 Format bekommen kannst.
Der Dateiaufbau ist dann relativ "simpel".