ERLEDIGT
NEIN
NEIN
ANTWORTEN
4
4
ZUGRIFFE
236
236
EMPFEHLEN
-
27.09.11 18:16 #1
- Registriert seit
- Mar 2009
- Beiträge
- 26
Hallo zusammen,
ich bin auf der Suche nach einer Library die mir hilft unstrukturierte Ascii-Files zu untersuchen. Dabei sollte grob erkannt werden um was für Textfiles es sich handelt um dann aus dem Textfile Nutzdaten zu ziehen.
Hintergrund: Bekomme Bestellungen als E-Mail von unterschiedlichen Kunden. Diese Kunden haben im MailBody (Text) die Informationen je nach Kunde die Daten an unterschiedlichen Stellen stehen, teilweise auch unterschiedlich formattiert (z.B. ein Bestelldatum).
Ich möchte jetzt diese unterschiedlichen Bestellungen erkennen (ginge evt noch über die Mail-Adresse) und die Informationen dann auslesen und in eine gemeinsame Datenbank-Tabelle überführen.
Hat jemand eine Idee welches Tool mich ggf untersützen könnte ohne das man alles selbst entwickeln muss. Außerdem zählen Regular-Expressions (die sicher hier auch einiges möglich machen würden) nicht unbedingt zu meinen Lieblingen...
Gruß
McD
-
27.09.11 22:25 #2
- Registriert seit
- Jun 2009
- Beiträge
- 870
Wie wäre es damit, bei Bestellungen im Betreff immer eine ID anzugeben, die die Kunden unbedingt dort drin lassen sollen? Dann würdest du dir mit der Erkennung zumindest deutlich leichter tun.
Code bitte so einfügen: [java]System.out.println("Hallo");[/java] (Analog für andere Programmiersprachen)
hilfreich zu Java: Really Big Index, Java ist auch eine Insel Band 1 und Band 2.Code java:1
System.out.println("Hallo");
___________
Ubuntu Bug #1: Microsoft has a majority market share
Casecon: Projekt leiser Käse
-
28.09.11 14:23 #3
- Registriert seit
- Mar 2009
- Beiträge
- 26
Hallo,
das reicht leider nicht. Wir haben es mit vielen Kunden zu tun. Leider auch teilweise größer als wir. Denen vorzuschreiben wie sie uns die Daten senden ist so als wenn ich einem Schwarm Bienen sage auf welchem Feld sie Honig sammeln sollen. Das ist oft versucht worden.
Der Auftrag kommt aus deren Warenwirtschaft zu uns. Und mal als Pdf, mal als Tiff, mal als Ascii-Mail. Alle drei laufen letztlich darauf hinaus, irgendwie die Daten im Dokument zu identifizieren die man braucht. Für wichtige Kunden lohnt das, für weniger wichtige lässt man es. Pdf und Tiff werden zunächst in Text überführt und dann genauso behandelt wie der Auftrag im Mail-Body.
Also hab eich eben eine Textdatei die letztlich ein Bestellformular abbildet. Hab mich schon ein wenig mit der Java-Klasse Scanner rangewagt, wo ich dann mit (einfachen) RegEx-Ausdrücken nach Schlüsselwörtern such (z.B. Kdnr: ) und den Text dahinter interpretiere.
Habe nur gehofft es es irgendwie noch ne Lib gibt die das noch besser und vor allem für mich als Entwickler der eigentlichen Busines-Logik noch einfach hinbringt.
Gruß
McD
-
Imker können dass so weit ich weiß :-D
Verstehe ich Dich richtig, dass die Bestellungen durchaus "genormt" sind, nur aber von Kunde zu Kunde unterschiedlich?
Der Ansatz klingt doch schon ganz prima.
Es gäbe da noch eine Kanone für Deinen Spatz.
Stichwort: Java Compiler Compiler :-D
Nebenbei: Ohne ReGex wirst Du vermutlich nicht rumkommen. Habe selbst auch einige Zeit gebraucht mich damit gescheit auseinanderzusetzen, weil sie oft sehr kryptisch wirken.
Nur Mut dazu
Takidoso
-
Es gibt Libs zum Lesen und Schreiben Bestimmter Dokumente, aber keine dieser Libs kann die das Untersuchen deiner Dokumente abnehmen!
Denn eins sollte dir klar sein, Es muss immer eine Struktur vorhanden sein die du untersuchen kannst! Und diese ist von Anwendungsfall zu Anwendungsfall immer unterschiedlich.
Zum Beispiel:
Code :1 2 3 4 5
beliebiger text Bestel Nr.: 123456 Artikel-Nr.: 987654 Stk.: 5 Artikel-Nr.: 654547 Stk.: 1 beliebiger text
so was kann man untersuchen, dazu würde ich dann einen inputreader nehmen und ziele für Zeile, Wort für Wort einlesen und auf mein Key Wörd mittels Regex untersuchen. Wenn ich mein Key gefunden habe wäre das nächste Word das was ich haben möchte.
Ähnliche Themen
-
Gesucht: C++ Library, die PDF in Grafik konvertiert
Von vfl_freak im Forum C/C++Antworten: 3Letzter Beitrag: 15.09.11, 14:15 -
Konvertierung Vb6.0 nach VB.Net 2008
Von discipuli im Forum Visual Basic 6.0Antworten: 2Letzter Beitrag: 03.03.09, 11:24 -
Anregung für FTP-Library gesucht
Von kuscheltier im Forum .NET Web und KommunikationAntworten: 1Letzter Beitrag: 08.10.07, 20:43 -
Konvertierung .max nach C4D (obj etc)
Von mamboben im Forum 3D Studio MaxAntworten: 4Letzter Beitrag: 22.02.05, 09:52 -
konvertierung von float nach int?
Von Evola im Forum C/C++Antworten: 10Letzter Beitrag: 13.12.04, 13:14





Zitieren
Login





