tutorials.de Buch-Aktion 05/2012
ERLEDIGT
NEIN
ANTWORTEN
4
ZUGRIFFE
236
EMPFEHLEN
  • An Twitter übertragen
  • An Facebook übertragen
AUF DIESES THEMA
ANTWORTEN
  1. #1
    mcdroemmel mcdroemmel ist offline Mitglied Bronze
    Registriert seit
    Mar 2009
    Beiträge
    26
    Hallo zusammen,

    ich bin auf der Suche nach einer Library die mir hilft unstrukturierte Ascii-Files zu untersuchen. Dabei sollte grob erkannt werden um was für Textfiles es sich handelt um dann aus dem Textfile Nutzdaten zu ziehen.

    Hintergrund: Bekomme Bestellungen als E-Mail von unterschiedlichen Kunden. Diese Kunden haben im MailBody (Text) die Informationen je nach Kunde die Daten an unterschiedlichen Stellen stehen, teilweise auch unterschiedlich formattiert (z.B. ein Bestelldatum).

    Ich möchte jetzt diese unterschiedlichen Bestellungen erkennen (ginge evt noch über die Mail-Adresse) und die Informationen dann auslesen und in eine gemeinsame Datenbank-Tabelle überführen.

    Hat jemand eine Idee welches Tool mich ggf untersützen könnte ohne das man alles selbst entwickeln muss. Außerdem zählen Regular-Expressions (die sicher hier auch einiges möglich machen würden) nicht unbedingt zu meinen Lieblingen...

    Gruß
    McD
     

  2. #2
    genodeftest genodeftest ist offline Mitglied Brillant
    Registriert seit
    Jun 2009
    Beiträge
    870
    Wie wäre es damit, bei Bestellungen im Betreff immer eine ID anzugeben, die die Kunden unbedingt dort drin lassen sollen? Dann würdest du dir mit der Erkennung zumindest deutlich leichter tun.
     
    Code bitte so einfügen: [java]System.out.println("Hallo");[/java] (Analog für andere Programmiersprachen)
    Code java:
    1
    
    System.out.println("Hallo");
    hilfreich zu Java: Really Big Index, Java ist auch eine Insel Band 1 und Band 2.
    ___________
    Ubuntu Bug #1: Microsoft has a majority market share
    Casecon: Projekt leiser Käse

  3. #3
    mcdroemmel mcdroemmel ist offline Mitglied Bronze
    Registriert seit
    Mar 2009
    Beiträge
    26
    Hallo,

    das reicht leider nicht. Wir haben es mit vielen Kunden zu tun. Leider auch teilweise größer als wir. Denen vorzuschreiben wie sie uns die Daten senden ist so als wenn ich einem Schwarm Bienen sage auf welchem Feld sie Honig sammeln sollen. Das ist oft versucht worden.
    Der Auftrag kommt aus deren Warenwirtschaft zu uns. Und mal als Pdf, mal als Tiff, mal als Ascii-Mail. Alle drei laufen letztlich darauf hinaus, irgendwie die Daten im Dokument zu identifizieren die man braucht. Für wichtige Kunden lohnt das, für weniger wichtige lässt man es. Pdf und Tiff werden zunächst in Text überführt und dann genauso behandelt wie der Auftrag im Mail-Body.

    Also hab eich eben eine Textdatei die letztlich ein Bestellformular abbildet. Hab mich schon ein wenig mit der Java-Klasse Scanner rangewagt, wo ich dann mit (einfachen) RegEx-Ausdrücken nach Schlüsselwörtern such (z.B. Kdnr: ) und den Text dahinter interpretiere.
    Habe nur gehofft es es irgendwie noch ne Lib gibt die das noch besser und vor allem für mich als Entwickler der eigentlichen Busines-Logik noch einfach hinbringt.

    Gruß
    McD
     

  4. #4
    Avatar von takidoso
    takidoso takidoso ist offline Mitglied Brillant
    Registriert seit
    Aug 2004
    Ort
    Kömigstein
    Beiträge
    911
    Zitat Zitat von mcdroemmel Beitrag anzeigen
    Denen vorzuschreiben wie sie uns die Daten senden ist so als wenn ich einem Schwarm Bienen sage auf welchem Feld sie Honig sammeln sollen.
    Imker können dass so weit ich weiß :-D

    Zitat Zitat von mcdroemmel Beitrag anzeigen
    Und mal als Pdf, mal als Tiff, mal als Ascii-Mail. Alle drei laufen letztlich darauf hinaus, irgendwie die Daten im Dokument zu identifizieren die man braucht. Für wichtige Kunden lohnt das, für weniger wichtige lässt man es. Pdf und Tiff werden zunächst in Text überführt und dann genauso behandelt wie der Auftrag im Mail-Body.
    Verstehe ich Dich richtig, dass die Bestellungen durchaus "genormt" sind, nur aber von Kunde zu Kunde unterschiedlich?
    Zitat Zitat von mcdroemmel Beitrag anzeigen
    Also hab eich eben eine Textdatei die letztlich ein Bestellformular abbildet. Hab mich schon ein wenig mit der Java-Klasse Scanner rangewagt, wo ich dann mit (einfachen) RegEx-Ausdrücken nach Schlüsselwörtern such (z.B. Kdnr: ) und den Text dahinter interpretiere.
    Der Ansatz klingt doch schon ganz prima.
    Zitat Zitat von mcdroemmel Beitrag anzeigen
    Habe nur gehofft es es irgendwie noch ne Lib gibt die das noch besser und vor allem für mich als Entwickler der eigentlichen Busines-Logik noch einfach hinbringt.
    Es gäbe da noch eine Kanone für Deinen Spatz.
    Stichwort: Java Compiler Compiler :-D

    Nebenbei: Ohne ReGex wirst Du vermutlich nicht rumkommen. Habe selbst auch einige Zeit gebraucht mich damit gescheit auseinanderzusetzen, weil sie oft sehr kryptisch wirken.
    Nur Mut dazu

    Takidoso
     

  5. #5
    wakoz wakoz ist offline Mitglied Gold
    Registriert seit
    Apr 2010
    Beiträge
    114
    Es gibt Libs zum Lesen und Schreiben Bestimmter Dokumente, aber keine dieser Libs kann die das Untersuchen deiner Dokumente abnehmen!

    Denn eins sollte dir klar sein, Es muss immer eine Struktur vorhanden sein die du untersuchen kannst! Und diese ist von Anwendungsfall zu Anwendungsfall immer unterschiedlich.

    Zum Beispiel:

    Code :
    1
    2
    3
    4
    5
    
    beliebiger text
    Bestel Nr.: 123456
    Artikel-Nr.: 987654 Stk.: 5
    Artikel-Nr.: 654547 Stk.: 1
    beliebiger text

    so was kann man untersuchen, dazu würde ich dann einen inputreader nehmen und ziele für Zeile, Wort für Wort einlesen und auf mein Key Wörd mittels Regex untersuchen. Wenn ich mein Key gefunden habe wäre das nächste Word das was ich haben möchte.
     

Ähnliche Themen

  1. Antworten: 3
    Letzter Beitrag: 15.09.11, 14:15
  2. Konvertierung Vb6.0 nach VB.Net 2008
    Von discipuli im Forum Visual Basic 6.0
    Antworten: 2
    Letzter Beitrag: 03.03.09, 11:24
  3. Anregung für FTP-Library gesucht
    Von kuscheltier im Forum .NET Web und Kommunikation
    Antworten: 1
    Letzter Beitrag: 08.10.07, 20:43
  4. Konvertierung .max nach C4D (obj etc)
    Von mamboben im Forum 3D Studio Max
    Antworten: 4
    Letzter Beitrag: 22.02.05, 09:52
  5. konvertierung von float nach int?
    Von Evola im Forum C/C++
    Antworten: 10
    Letzter Beitrag: 13.12.04, 13:14