Notepad++ Regular Expressions

tobbimann

Mitglied
Guten Morgen,

ich habe eine ziemlich große Datei mit Kundenstammdaten (Export aus einem Uralt-ERP), die sehr unstruktiert ist. Vor jedem neuen Kundensatz (Name, Adresse, Kontaktdaten, usw.) steht eine Kurzbezeichnung nur aus Großbuchstaben (5 bis 6 an der Zahl).

Nun möchte ich, das jeder neue Kundensatz auch in einer neuen Zeile beginnt. Wie kriege ich das hin?
 
Hallo,

könntest du bitte 2-3 Testdatensätze hier schreiben? So recht habe ich den Aufbau der Datei nicht verstanden.

Gruß
BK
 
Klar, kein Problem...

ABBGEB firm Anrede Firmen-/Familienname Adresse Telefon Fax LEVENI prkd Anrede Firmen-/Familienname Adresse
Telefon Fax Bemerkung/Kommentar ADKIRA apot Anrede Firmen-/Familienname Adresse Telefon Fax ADLERA apot ...

All das steht jetzt immer wild hintereinander weg. Mal kommt ein Zeilenumbruch nach der Anrede, mal an anderer Stelle.
 
Hallo,

siehr wirklich ziemlich wüst aus ;)
Als erstes würde ich einmal alle Zeilenumbrüche durch ein Leerzeichen ersetzen (wenn die Zeilenumbrüche wirklich "zufällig" sind.

Zuerst also ein einfaches Ersetzen von "\n" durch " ". (Erweitert, nicht Regex oder normal)

Als nächsten Schritt kannst du dann "[A-Z]{5,6}" durch "\n" machen, somit sollte du jeden Datensatz in einer extra Zeile haben.

Gruß
BK
 
Hi.
Als nächsten Schritt kannst du dann "[A-Z]{5,6}" durch "\n" machen, somit sollte du jeden Datensatz in einer extra Zeile haben.
Notepad++ reg. Ausdrücke sind wirklich *sehr* "bescheiden". :(

Es gibt keine {} Quantifizierung und auch keine Alternative "|" und keinen optionalen Quantifizierer "?".

Du mußt also die Ersetzung schrittweise machen, erst "\<([A-Z][A-Z][A-Z][A-Z][A-Z][A-Z])\>" durch "\n\1" und danach nochmal die für die 5 Buchstaben langen Präfixe. Und wolltest du die Präfixe beibehalten oder auch entfernen?

Und nicht vergessen die Groß-/Kleinschreibung anzuhaken.

Gruß
 

Neue Beiträge

Zurück