-
22.07.09 20:40 #1
Hallo!
Ich habe ein Dokument in Papierform, welches Tabellen, kleine Grafiken, Texte und auch etwas Handschrift enthält. Diese Dokument möchte ich jetzt in einer bearbeitbaren Form digitalisieren, also der Text soll nachher auch wirklich Text sein, den man verändern kann.
Wie mache ich das am Besten? Ich denke, die meisten OCR-Programme werden damit nicht klarkommen. Das manuell in Word nachzubauen würde ewig dauern, bei anderen Programmen ist das wahrscheinlich entsprechend... Vielleicht mit InkScape "abpausen" oder so?
Mein Output-File soll nachher auch vom PC editierbar sein, d.h. es muss in irgendeinem Format sein, dass ein selbstgeschriebenes Programm editieren kann (Latex ginge, Word sogar auch, PDF vielleicht, SVG wahrscheinlich auch).
Wie mache ich das mit dem wenigsten Aufwand?
EDIT:
Habe es geschafft, wie lest bitte weiter unten, hier ist was ich damit erreichen wollte:
http://plupp.weg/
Der Link wurde aus den unten genannten Gründen entfernt.
Wir distanzieren uns von solchen Inhalten!Geändert von multimolti (25.07.09 um 01:42 Uhr)
Website: http://www.multimolti.com/
-
Ich kenne für so etwas nur OCR-Software.
Wenn Programme wie Inkscape das "abpausen", erhälst du Vektoren und kannst diese nicht in bekannter Textform bearbeiten.
Grüße Marcokeep on smiling
www.smileyml.de
Typografie-Basiswissen | Grafik - Basiswissen
TypoWars | ...ja, auch im Chat
-
22.07.09 20:49 #3
Nein, ich kann in Inkscape ja einfach nur die Tabellen nachmalen und den Text als Text-Bausteine reintun, das wiederrum ist dann bearbeitbar. Nur würde das wahrscheinlich doch 1. recht lange dauern und 2. kann man das glaube ich nicht abpausen, oder? Gibt es eine Möglichkeit, das eingescannte Originaldokument halb-transparent in den Hintergrund zu tun?
Website: http://www.multimolti.com/
-
„Gib einem Menschen einen Fisch, und er wird für einen Tag satt. Lehre ihn Fischen, und er wird ein Leben lang satt.“
“For every complex problem, there is an answer that is short, simple and wrong.”
“Pessimism is safe, but optimism is a lot faster!”
Aktuelles Coding Quiz: #17 - Wörter kreuz und quer
-
Ist das Original so komplex, das ein "Nachbauen" mit einem Office-Programm so aufwändig wäre?
Da ich persönlich nicht mit Inkscape arbeite, kann ich nicht genau sagen wo, gehe aber fest davon aus, das man dort Bilder auch transparent schalten kann.
Vielleicht ist es möglich das Dokument zumindest in Teilen hier zu zeigen. Dann könnte man besser nach eine Lösung suchen.
Grüße Marcokeep on smiling
www.smileyml.de
Typografie-Basiswissen | Grafik - Basiswissen
TypoWars | ...ja, auch im Chat
-
23.07.09 01:38 #6
Aaaaaaaalso... ich habe euren Rat beherzigt und es mal mit einem OCR-Programm probiert.. ABBYY Fine Reader hat ganz gute Dienste geleistet und mir die grundsätzlichen Sachen digitalisiert, ein paar kleine Schreibfehler waren drin, aber nicht weiter schlimm, eher schlimm war dass er 2 von den 5 Tabellen nicht erkannt hat, und dass der Export zu Word 2003/2007 nicht ging (zumindest hat Word immer nur zerhackstückelten Mist angezeigt).
PDF-Export ging einwandfrei, habe dann mit dem Foxit PDF Editor in einer stundenlangen Feinstarbeit die Tabellen nachgebaut und andere Feinheiten (z.B. Hintergrundschattierungen) ergänzt...
Jetzt habe ich das mit einem Aufwand von ca. 2-3h komplett digitalisiert, sieht auch recht gut aus!
Nächste Frage: Kann ich ein PDF vernünftig von einem Programm editieren lassen?
Wahrscheinlich nicht soo toll, da PDF binär ist und ich damit immer auf die Länge des Textes achten muss (kann den Originaltext "asdaf" im PDF nicht problemlos durch "blablubbbla" ersetzen)...
Kann man PDFs in irgendein besseres Format konvertieren? (Okay, die Frage gehört nicht wirklich hier her, aber egal...)
... und es hatte schon seine Gründe, warum ich nicht einen Beispielausschnitt aus dem Dokument hier hochgeladen habe
Website: http://www.multimolti.com/
-
Hi,
also PDFs kannst du recht weitestgehend mit dem Acrobat von Adobe bearbeiten. Ist soweit ich weiß auch das einzigste Programm welches das so in der Form anbietet.
Adobe hat halt nach wie vor auf gewisse Dinge den Daumen drauf. Texte sollten nur im kleinen Rahmen bearbeitet werden da sonst echt kritisch werden kann da Umbrüche und so nicht mehr funktionieren. Also ein Programm mit dem du Tabellen innerhalb einer PDF erzeugst wirst du wohl nicht finden.
Es gibt da noch das Programm PDF Editor mit dem man auch PDFs bearbeiten kann, aber ich weiß jetzt nicht in welchem Maße.
Fine Reader is tbisher das beste OCR was ich kenne und ich habe schon eine Menge ausprobiert. Finereader hat aber soweit ich weiß auch einen Tabellenmodus drinnen. Wenn dieses Prog das nicht erkennt dann wirst du wohl nicht drum herumkommen die Tabelle nochmal von Hand zu schreiben.
Viele GrüßeDirt is my World
www.janstieler.de coming soon!
Xing Profil (OpenBC)
del.icio.us Profil
flickr Profil
Portfolio
Bitte bewerte mich wenn ich dir weitergeholfen habe. Und makiere dein Beitrag als erledigt wenn das Problem geklärt wurde.
Information zum neuen Bewertungsmodell.
-
23.07.09 10:42 #8
Dass ich die PDFs manuelle editieren kann ist mir klar, habe ich ja gemacht um die fehlenden Tabellen reinzubekommen (Adobe Acrobat habe ich jetzt nicht probiert, aber mit Foxit Editor ging's ganz gut).
Mit "mit einem Programm" editieren lassen meinte ich: Ich will ein Programm SELBER schreiben, was das PDF editieren kann, aber nur im KLEINSTEN Rahmen... also z.B. an einigen festgelegten Stellen den Text umändern, aktuelles Datum einfügen, sowas in der Richtung...Website: http://www.multimolti.com/
-
25.07.09 01:41 #9
Wen es interessiert, hier ist das Endprodukt

http://plupp.weg/
Der Link wurde aus den unten genannten Gründen entfernt.
Wir distanzieren uns von solchen Inhalten!Website: http://www.multimolti.com/
-
Hi,
also man kann in PDFs Textfelder realisieren mit denen der Betrachter arbeiten kann.
Aber mal eine Frage das was du da gemacht hast ist das nicht Urkundenfälschung? Auch wenn du darauf hinweist das die rechtlichen Folgen beim Ersteller liegen.
GrußDirt is my World
www.janstieler.de coming soon!
Xing Profil (OpenBC)
del.icio.us Profil
flickr Profil
Portfolio
Bitte bewerte mich wenn ich dir weitergeholfen habe. Und makiere dein Beitrag als erledigt wenn das Problem geklärt wurde.
Information zum neuen Bewertungsmodell.
-
Ich bin zwar kein Jurist, aber ich denke dass man das als Beihilfe zur Urkundenfälschung sehen kann. Die Zurückweisung jeglicher Verantwortung würde meinem Verständnis nach vor einem Gericht nichts daran ändern.
Grüße, Matthias
PS: Dies ist keine Rechtsberatung, sondern meine persönliche Meinung.„Gib einem Menschen einen Fisch, und er wird für einen Tag satt. Lehre ihn Fischen, und er wird ein Leben lang satt.“
“For every complex problem, there is an answer that is short, simple and wrong.”
“Pessimism is safe, but optimism is a lot faster!”
Aktuelles Coding Quiz: #17 - Wörter kreuz und quer
-
25.07.09 05:08 #12
Hallo!
Sehe ich genauso.
Aber damit nicht genug.....
Wofür braucht man ein Schulzeugnis?
I.d.R. um sich zu bewerben.
Kommt irgendwann mal raus dass der Ausbildungsplatz/Arbeitsplatz mit gefälschten Urkunden "erschlichen" wurde, kommt noch Betrug hinzu.
Eine fristlose Kündigung und ggf. Schadenersatzansprüche sind hier (neben der Strafanzeige) die übliche Folge.
Etwas anderes wäre es wenn ganz fett und unübersehbar "Musterbeispiel" (oder ähnliches) quer auf dem Blatt stehen würde.
Das "kleingedruckte" langt hier nicht..... dieses könnte schon den Verdacht einer (versuchten) Täuschung erwecken (Betrug).
Gerade mit Urkunden sollte man sehr pingelig umgehen.
Der Kaffeefleck auf der schlechten Note könnte auch schon den Tatbestand einer Urkundenfälschung erfüllen..... genauso wie ein total verdrecktes Kfz-Kennzeichen (das Kfz-Kennzeichen ist im juristischen Sinne auch eine Urkunde).
Gruss Dr Dau
PS: dieses ist keine Rechtsberatung, sondern spiegelt nur meine persönliche Meinung wider.Schri-Schra-Schrödi *g*
mehrspaltiges/zeiliges Seitenlayout mit DIV's und CSS
Dinge, die mit Tabellen besser klappen als mit CSS
Ausgabe von Datum/Zeit unabhängig von der Server Zeitzone [php]
Meine Links zum Thema Linux (Last update: 29.10.2011)
Kein Busen ist so flach wie das Niveau dieser Party!
----
Alte Weisheit: wer uns in den Arsch kriecht wird beschissen!
----
Ich habe 3 Kinder und kein Geld!
Warum kann ich nicht keine Kinder haben und 3 Geld?! (Homer Jay Simpson)
-
25.07.09 12:25 #13
Hmm okay, ich sehe schon dass die Sache schwierig wird. Ich dachte, dur den Stempel "Gefälscht" wäre das eigentlich behoben...
Oder um als Tutor Darth Vader hinzuschreiben, siehe Beispiel (--> Scherzprogramm). Außerdem ist eine ausgedruckte Unterschrift immer als solche zu erkennen... vielleicht könnte jemand mit viel Talent sie mit einem Kugelschreiber nachziehen, aber ich denke, man wird trotzdem noch die Fälschung erkennen.
Es steht doch recht fett und unübersehbar "GEFÄLSCHT" in rot unten dran, entspricht das nicht dem "Musterbeispiel"?
Kann man das nicht irgendwie so formulieren, dass eben nicht ich dafür haften muss, sondern derjenige, der das Tool benutzt? Habe ja extra schon den Satz druntergeschrieben, aber wenn das nicht reicht...Website: http://www.multimolti.com/
-
25.07.09 12:48 #14
Drucker sind heute so gut dass man es nicht unbedingt auf den ersten Blick erkennen muss.
Und es wird wohl niemand so genau hinschauen weil er von anfang an denkt dass das Zeugnis gefälscht ist.
Abgesehen davon: egal ob Betrug oder versuchter Betrug, beides ist strafbar.
"Da unten" ist so ein komisches Kästchen..... wofür dieses wohl sein mag?!
Nein, kann man nicht "umformulieren".
Anstiftung bleibt Anstiftung.
Und der Anstifter bist halt DU, also wirst auch DU zur Verantwortung gezogen.
Der "Nutzer" bekommt allerdings auch eine reingewürgt.
Ein Bekannter von mir hat mal eine Anzeige wegen Anstiftung zu einer Straftat bekommen.
Und dass nur weil er an seinem Auto den Schlüssel im Zündschloss hat stecken lassen und er sich vom Auto aus dem Sichtbereich entfernt hat.
PS: dieses ist keine Rechtsberatung, sondern spiegelt nur meine persönliche Meinung wider.Schri-Schra-Schrödi *g*
mehrspaltiges/zeiliges Seitenlayout mit DIV's und CSS
Dinge, die mit Tabellen besser klappen als mit CSS
Ausgabe von Datum/Zeit unabhängig von der Server Zeitzone [php]
Meine Links zum Thema Linux (Last update: 29.10.2011)
Kein Busen ist so flach wie das Niveau dieser Party!
----
Alte Weisheit: wer uns in den Arsch kriecht wird beschissen!
----
Ich habe 3 Kinder und kein Geld!
Warum kann ich nicht keine Kinder haben und 3 Geld?! (Homer Jay Simpson)
-
25.07.09 13:35 #15
"Da unten" im PDF steht "Gefälscht" und "da unten" auf der Website ist die Checkbox, um das zu entfernen MIT Hinweis auf mögliche rechtliche Probleme... wenn das einzige Problem die Checkbox ist dann mach ich die einfach raus und der "Gefälscht"-Stempel bleibt immer dran, wäre es dann "legal"?
Website: http://www.multimolti.com/
Ähnliche Themen
-
[C++] Manuell Ordner auf HDD erstellen/löschen/...
Von Sircoly im Forum C/C++Antworten: 1Letzter Beitrag: 19.09.06, 17:46 -
Benutzer manuell erstellen
Von drvj im Forum Enterprise Java (JEE, J2EE, Spring & Co.)Antworten: 0Letzter Beitrag: 30.06.05, 21:33 -
PDF Dokument aus DB Inhalt erstellen
Von xony im Forum PHPAntworten: 4Letzter Beitrag: 06.10.04, 01:06 -
Word Dokument via PHP erstellen
Von hans_schmid im Forum PHPAntworten: 15Letzter Beitrag: 28.09.04, 09:32 -
Word Dokument in C# erstellen
Von astaluego im Forum .NET ArchivAntworten: 3Letzter Beitrag: 17.08.04, 12:19



2Danke

Zitieren



Login





