tutorials.de Buch-Aktion 05/2012
Seite 1 von 2 12 LetzteLetzte
ERLEDIGT
NEIN
ANTWORTEN
25
ZUGRIFFE
2832
EMPFEHLEN
  • An Twitter übertragen
  • An Facebook übertragen
AUF DIESES THEMA
ANTWORTEN
  1. #1
    Avatar von multimolti
    multimolti multimolti ist offline Game Programmer
    Registriert seit
    Jan 2007
    Beiträge
    802
    Hallo!

    Ich habe ein Dokument in Papierform, welches Tabellen, kleine Grafiken, Texte und auch etwas Handschrift enthält. Diese Dokument möchte ich jetzt in einer bearbeitbaren Form digitalisieren, also der Text soll nachher auch wirklich Text sein, den man verändern kann.
    Wie mache ich das am Besten? Ich denke, die meisten OCR-Programme werden damit nicht klarkommen. Das manuell in Word nachzubauen würde ewig dauern, bei anderen Programmen ist das wahrscheinlich entsprechend... Vielleicht mit InkScape "abpausen" oder so?

    Mein Output-File soll nachher auch vom PC editierbar sein, d.h. es muss in irgendeinem Format sein, dass ein selbstgeschriebenes Programm editieren kann (Latex ginge, Word sogar auch, PDF vielleicht, SVG wahrscheinlich auch).

    Wie mache ich das mit dem wenigsten Aufwand?

    EDIT:
    Habe es geschafft, wie lest bitte weiter unten, hier ist was ich damit erreichen wollte:
    http://plupp.weg/
    Der Link wurde aus den unten genannten Gründen entfernt.
    Wir distanzieren uns von solchen Inhalten!
    Geändert von multimolti (25.07.09 um 01:42 Uhr)
     

  2. #2
    Avatar von smileyml
    smileyml smileyml ist offline Tankwart
    tutorials.de Moderator
    Registriert seit
    Feb 2004
    Beiträge
    2.904
    Blog-Einträge
    14
    Ich kenne für so etwas nur OCR-Software.
    Wenn Programme wie Inkscape das "abpausen", erhälst du Vektoren und kannst diese nicht in bekannter Textform bearbeiten.

    Grüße Marco
     

  3. #3
    Avatar von multimolti
    multimolti multimolti ist offline Game Programmer
    Registriert seit
    Jan 2007
    Beiträge
    802
    Nein, ich kann in Inkscape ja einfach nur die Tabellen nachmalen und den Text als Text-Bausteine reintun, das wiederrum ist dann bearbeitbar. Nur würde das wahrscheinlich doch 1. recht lange dauern und 2. kann man das glaube ich nicht abpausen, oder? Gibt es eine Möglichkeit, das eingescannte Originaldokument halb-transparent in den Hintergrund zu tun?
     

  4. #4
    Registriert seit
    Dec 2001
    Ort
    Bayern
    Beiträge
    5.806
    Blog-Einträge
    5
    Zitat Zitat von multimolti Beitrag anzeigen
    Ich habe ein Dokument in Papierform, welches Tabellen, kleine Grafiken, Texte und auch etwas Handschrift enthält. Diese Dokument möchte ich jetzt in einer bearbeitbaren Form digitalisieren, also der Text soll nachher auch wirklich Text sein, den man verändern kann.
    Wie mache ich das am Besten? Ich denke, die meisten OCR-Programme werden damit nicht klarkommen.
    Gute OCR-Programme bieten die Möglichkeit, Texte, Tabellen und Grafiken als solche zu markieren (sofern die automatische Erkennung versagt). Wenn der Aufwand der manuellen Rekonstruktion zu hoch ist, wird sowieso kein Weg an OCR vorbei führen.

    Grüße, Matthias
     
    „Gib einem Menschen einen Fisch, und er wird für einen Tag satt. Lehre ihn Fischen, und er wird ein Leben lang satt.“
    “For every complex problem, there is an answer that is short, simple and wrong.”
    “Pessimism is safe, but optimism is a lot faster!”


    Aktuelles Coding Quiz: #17 - Wörter kreuz und quer

  5. #5
    Avatar von smileyml
    smileyml smileyml ist offline Tankwart
    tutorials.de Moderator
    Registriert seit
    Feb 2004
    Beiträge
    2.904
    Blog-Einträge
    14
    Ist das Original so komplex, das ein "Nachbauen" mit einem Office-Programm so aufwändig wäre?
    Da ich persönlich nicht mit Inkscape arbeite, kann ich nicht genau sagen wo, gehe aber fest davon aus, das man dort Bilder auch transparent schalten kann.

    Vielleicht ist es möglich das Dokument zumindest in Teilen hier zu zeigen. Dann könnte man besser nach eine Lösung suchen.

    Grüße Marco
     

  6. #6
    Avatar von multimolti
    multimolti multimolti ist offline Game Programmer
    Registriert seit
    Jan 2007
    Beiträge
    802
    Aaaaaaaalso... ich habe euren Rat beherzigt und es mal mit einem OCR-Programm probiert.. ABBYY Fine Reader hat ganz gute Dienste geleistet und mir die grundsätzlichen Sachen digitalisiert, ein paar kleine Schreibfehler waren drin, aber nicht weiter schlimm, eher schlimm war dass er 2 von den 5 Tabellen nicht erkannt hat, und dass der Export zu Word 2003/2007 nicht ging (zumindest hat Word immer nur zerhackstückelten Mist angezeigt).
    PDF-Export ging einwandfrei, habe dann mit dem Foxit PDF Editor in einer stundenlangen Feinstarbeit die Tabellen nachgebaut und andere Feinheiten (z.B. Hintergrundschattierungen) ergänzt...
    Jetzt habe ich das mit einem Aufwand von ca. 2-3h komplett digitalisiert, sieht auch recht gut aus!

    Nächste Frage: Kann ich ein PDF vernünftig von einem Programm editieren lassen?

    Wahrscheinlich nicht soo toll, da PDF binär ist und ich damit immer auf die Länge des Textes achten muss (kann den Originaltext "asdaf" im PDF nicht problemlos durch "blablubbbla" ersetzen)...
    Kann man PDFs in irgendein besseres Format konvertieren? (Okay, die Frage gehört nicht wirklich hier her, aber egal...)
    ... und es hatte schon seine Gründe, warum ich nicht einen Beispielausschnitt aus dem Dokument hier hochgeladen habe
     

  7. #7
    Avatar von Jan-Frederik Stieler
    Jan-Frederik Stieler Jan-Frederik Stieler ist offline JFS - aka DirtyWorld
    tutorials.de Moderator
    Registriert seit
    Nov 2003
    Ort
    Darmstadt
    Beiträge
    4.934
    Blog-Einträge
    1
    Hi,
    also PDFs kannst du recht weitestgehend mit dem Acrobat von Adobe bearbeiten. Ist soweit ich weiß auch das einzigste Programm welches das so in der Form anbietet.
    Adobe hat halt nach wie vor auf gewisse Dinge den Daumen drauf. Texte sollten nur im kleinen Rahmen bearbeitet werden da sonst echt kritisch werden kann da Umbrüche und so nicht mehr funktionieren. Also ein Programm mit dem du Tabellen innerhalb einer PDF erzeugst wirst du wohl nicht finden.

    Es gibt da noch das Programm PDF Editor mit dem man auch PDFs bearbeiten kann, aber ich weiß jetzt nicht in welchem Maße.

    Fine Reader is tbisher das beste OCR was ich kenne und ich habe schon eine Menge ausprobiert. Finereader hat aber soweit ich weiß auch einen Tabellenmodus drinnen. Wenn dieses Prog das nicht erkennt dann wirst du wohl nicht drum herumkommen die Tabelle nochmal von Hand zu schreiben.

    Viele Grüße
     
    Dirt is my World
    www.janstieler.de coming soon!
    Xing Profil (OpenBC)
    del.icio.us Profil
    flickr Profil

    Portfolio

    Bitte bewerte mich wenn ich dir weitergeholfen habe. Und makiere dein Beitrag als erledigt wenn das Problem geklärt wurde.
    Information zum neuen Bewertungsmodell.

  8. #8
    Avatar von multimolti
    multimolti multimolti ist offline Game Programmer
    Registriert seit
    Jan 2007
    Beiträge
    802
    Dass ich die PDFs manuelle editieren kann ist mir klar, habe ich ja gemacht um die fehlenden Tabellen reinzubekommen (Adobe Acrobat habe ich jetzt nicht probiert, aber mit Foxit Editor ging's ganz gut).

    Mit "mit einem Programm" editieren lassen meinte ich: Ich will ein Programm SELBER schreiben, was das PDF editieren kann, aber nur im KLEINSTEN Rahmen... also z.B. an einigen festgelegten Stellen den Text umändern, aktuelles Datum einfügen, sowas in der Richtung...
     

  9. #9
    Avatar von multimolti
    multimolti multimolti ist offline Game Programmer
    Registriert seit
    Jan 2007
    Beiträge
    802
    Wen es interessiert, hier ist das Endprodukt
    http://plupp.weg/

    Der Link wurde aus den unten genannten Gründen entfernt.
    Wir distanzieren uns von solchen Inhalten!
     

  10. #10
    Avatar von Jan-Frederik Stieler
    Jan-Frederik Stieler Jan-Frederik Stieler ist offline JFS - aka DirtyWorld
    tutorials.de Moderator
    Registriert seit
    Nov 2003
    Ort
    Darmstadt
    Beiträge
    4.934
    Blog-Einträge
    1
    Hi,
    also man kann in PDFs Textfelder realisieren mit denen der Betrachter arbeiten kann.

    Aber mal eine Frage das was du da gemacht hast ist das nicht Urkundenfälschung? Auch wenn du darauf hinweist das die rechtlichen Folgen beim Ersteller liegen.

    Gruß
     
    Dirt is my World
    www.janstieler.de coming soon!
    Xing Profil (OpenBC)
    del.icio.us Profil
    flickr Profil

    Portfolio

    Bitte bewerte mich wenn ich dir weitergeholfen habe. Und makiere dein Beitrag als erledigt wenn das Problem geklärt wurde.
    Information zum neuen Bewertungsmodell.

  11. #11
    Registriert seit
    Dec 2001
    Ort
    Bayern
    Beiträge
    5.806
    Blog-Einträge
    5
    Zitat Zitat von DirtyWorld Beitrag anzeigen
    Aber mal eine Frage das was du da gemacht hast ist das nicht Urkundenfälschung? Auch wenn du darauf hinweist das die rechtlichen Folgen beim Ersteller liegen.
    Ich bin zwar kein Jurist, aber ich denke dass man das als Beihilfe zur Urkundenfälschung sehen kann. Die Zurückweisung jeglicher Verantwortung würde meinem Verständnis nach vor einem Gericht nichts daran ändern.

    Grüße, Matthias

    PS: Dies ist keine Rechtsberatung, sondern meine persönliche Meinung.
    multimolti bedankt sich. 
    „Gib einem Menschen einen Fisch, und er wird für einen Tag satt. Lehre ihn Fischen, und er wird ein Leben lang satt.“
    “For every complex problem, there is an answer that is short, simple and wrong.”
    “Pessimism is safe, but optimism is a lot faster!”


    Aktuelles Coding Quiz: #17 - Wörter kreuz und quer

  12. #12
    Avatar von Dr Dau
    Dr Dau Dr Dau ist offline ich wisch hier durch
    Registriert seit
    Feb 2005
    Ort
    hinterm Mond gleich Links
    Beiträge
    6.160
    Blog-Einträge
    4
    Hallo!

    Zitat Zitat von Matthias Reitinger Beitrag anzeigen
    Ich bin zwar kein Jurist, aber ich denke dass man das als Beihilfe zur Urkundenfälschung sehen kann. Die Zurückweisung jeglicher Verantwortung würde meinem Verständnis nach vor einem Gericht nichts daran ändern.
    Sehe ich genauso.
    Aber damit nicht genug.....
    Wofür braucht man ein Schulzeugnis?
    I.d.R. um sich zu bewerben.
    Kommt irgendwann mal raus dass der Ausbildungsplatz/Arbeitsplatz mit gefälschten Urkunden "erschlichen" wurde, kommt noch Betrug hinzu.
    Eine fristlose Kündigung und ggf. Schadenersatzansprüche sind hier (neben der Strafanzeige) die übliche Folge.

    Etwas anderes wäre es wenn ganz fett und unübersehbar "Musterbeispiel" (oder ähnliches) quer auf dem Blatt stehen würde.
    Das "kleingedruckte" langt hier nicht..... dieses könnte schon den Verdacht einer (versuchten) Täuschung erwecken (Betrug).

    Gerade mit Urkunden sollte man sehr pingelig umgehen.
    Der Kaffeefleck auf der schlechten Note könnte auch schon den Tatbestand einer Urkundenfälschung erfüllen..... genauso wie ein total verdrecktes Kfz-Kennzeichen (das Kfz-Kennzeichen ist im juristischen Sinne auch eine Urkunde).

    Gruss Dr Dau

    PS: dieses ist keine Rechtsberatung, sondern spiegelt nur meine persönliche Meinung wider.
    multimolti bedankt sich. 
    Schri-Schra-Schrödi *g*
    mehrspaltiges/zeiliges Seitenlayout mit DIV's und CSS
    Dinge, die mit Tabellen besser klappen als mit CSS
    Ausgabe von Datum/Zeit unabhängig von der Server Zeitzone [php]
    Meine Links zum Thema Linux (Last update: 29.10.2011)
    Kein Busen ist so flach wie das Niveau dieser Party!
    ----
    Alte Weisheit: wer uns in den Arsch kriecht wird beschissen!
    ----
    Ich habe 3 Kinder und kein Geld!
    Warum kann ich nicht keine Kinder haben und 3 Geld?! (Homer Jay Simpson)

  13. #13
    Avatar von multimolti
    multimolti multimolti ist offline Game Programmer
    Registriert seit
    Jan 2007
    Beiträge
    802
    Hmm okay, ich sehe schon dass die Sache schwierig wird. Ich dachte, dur den Stempel "Gefälscht" wäre das eigentlich behoben...

    Zitat Zitat von Dr Dau Beitrag anzeigen
    Wofür braucht man ein Schulzeugnis? I.d.R. um sich zu bewerben.
    Oder um als Tutor Darth Vader hinzuschreiben, siehe Beispiel (--> Scherzprogramm). Außerdem ist eine ausgedruckte Unterschrift immer als solche zu erkennen... vielleicht könnte jemand mit viel Talent sie mit einem Kugelschreiber nachziehen, aber ich denke, man wird trotzdem noch die Fälschung erkennen.

    Zitat Zitat von Dr Dau Beitrag anzeigen
    Etwas anderes wäre es wenn ganz fett und unübersehbar "Musterbeispiel" (oder ähnliches) quer auf dem Blatt stehen würde.
    Das "kleingedruckte" langt hier nicht..... dieses könnte schon den Verdacht einer (versuchten) Täuschung erwecken (Betrug).
    Es steht doch recht fett und unübersehbar "GEFÄLSCHT" in rot unten dran, entspricht das nicht dem "Musterbeispiel"?

    Zitat Zitat von Matthias Reitinger Beitrag anzeigen
    Die Zurückweisung jeglicher Verantwortung würde meinem Verständnis nach vor einem Gericht nichts daran ändern.
    Kann man das nicht irgendwie so formulieren, dass eben nicht ich dafür haften muss, sondern derjenige, der das Tool benutzt? Habe ja extra schon den Satz druntergeschrieben, aber wenn das nicht reicht...
     

  14. #14
    Avatar von Dr Dau
    Dr Dau Dr Dau ist offline ich wisch hier durch
    Registriert seit
    Feb 2005
    Ort
    hinterm Mond gleich Links
    Beiträge
    6.160
    Blog-Einträge
    4
    Zitat Zitat von multimolti Beitrag anzeigen
    Außerdem ist eine ausgedruckte Unterschrift immer als solche zu erkennen...
    Drucker sind heute so gut dass man es nicht unbedingt auf den ersten Blick erkennen muss.
    Und es wird wohl niemand so genau hinschauen weil er von anfang an denkt dass das Zeugnis gefälscht ist.
    Abgesehen davon: egal ob Betrug oder versuchter Betrug, beides ist strafbar.

    Zitat Zitat von multimolti Beitrag anzeigen
    Es steht doch recht fett und unübersehbar "GEFÄLSCHT" in rot unten dran.....
    "Da unten" ist so ein komisches Kästchen..... wofür dieses wohl sein mag?!

    Zitat Zitat von multimolti Beitrag anzeigen
    Kann man das nicht irgendwie so formulieren, dass eben nicht ich dafür haften muss, sondern derjenige, der das Tool benutzt?
    Nein, kann man nicht "umformulieren".
    Anstiftung bleibt Anstiftung.
    Und der Anstifter bist halt DU, also wirst auch DU zur Verantwortung gezogen.
    Der "Nutzer" bekommt allerdings auch eine reingewürgt.

    Ein Bekannter von mir hat mal eine Anzeige wegen Anstiftung zu einer Straftat bekommen.
    Und dass nur weil er an seinem Auto den Schlüssel im Zündschloss hat stecken lassen und er sich vom Auto aus dem Sichtbereich entfernt hat.

    PS: dieses ist keine Rechtsberatung, sondern spiegelt nur meine persönliche Meinung wider.
     
    Schri-Schra-Schrödi *g*
    mehrspaltiges/zeiliges Seitenlayout mit DIV's und CSS
    Dinge, die mit Tabellen besser klappen als mit CSS
    Ausgabe von Datum/Zeit unabhängig von der Server Zeitzone [php]
    Meine Links zum Thema Linux (Last update: 29.10.2011)
    Kein Busen ist so flach wie das Niveau dieser Party!
    ----
    Alte Weisheit: wer uns in den Arsch kriecht wird beschissen!
    ----
    Ich habe 3 Kinder und kein Geld!
    Warum kann ich nicht keine Kinder haben und 3 Geld?! (Homer Jay Simpson)

  15. #15
    Avatar von multimolti
    multimolti multimolti ist offline Game Programmer
    Registriert seit
    Jan 2007
    Beiträge
    802
    Zitat Zitat von Dr Dau Beitrag anzeigen
    "Da unten" ist so ein komisches Kästchen..... wofür dieses wohl sein mag?!
    "Da unten" im PDF steht "Gefälscht" und "da unten" auf der Website ist die Checkbox, um das zu entfernen MIT Hinweis auf mögliche rechtliche Probleme... wenn das einzige Problem die Checkbox ist dann mach ich die einfach raus und der "Gefälscht"-Stempel bleibt immer dran, wäre es dann "legal"?
     

Ähnliche Themen

  1. Antworten: 1
    Letzter Beitrag: 19.09.06, 17:46
  2. Benutzer manuell erstellen
    Von drvj im Forum Enterprise Java (JEE, J2EE, Spring & Co.)
    Antworten: 0
    Letzter Beitrag: 30.06.05, 21:33
  3. PDF Dokument aus DB Inhalt erstellen
    Von xony im Forum PHP
    Antworten: 4
    Letzter Beitrag: 06.10.04, 01:06
  4. Word Dokument via PHP erstellen
    Von hans_schmid im Forum PHP
    Antworten: 15
    Letzter Beitrag: 28.09.04, 09:32
  5. Word Dokument in C# erstellen
    Von astaluego im Forum .NET Archiv
    Antworten: 3
    Letzter Beitrag: 17.08.04, 12:19