PDF wieder in ein XML wandeln

KlaDi

Erfahrenes Mitglied
Hallo,

ich habe mir mittels eines XSLTs aus einem XML ein PDF erzeugt. Nun brauche ich aber aus dem PDF wieder eine XML-Datei.
Der Adobe Reader bietet mir zwar die Möglichkeit, das ganze als Text zu exportieren, aber ich brauch es wieder als XML, damit ich möglichst nah wieder an mein Ursprungsxml herankommen.
Gibt es dafür ne Möglichkeit? Eventuell mit nen Programm, wenn möglich Open Source?

gruß klaus.
 
Das Problem: PDF enthält etwas ganz anderes als XML. PDF beschreibt die Positionen bestimmter Text- und Bildelemente auf einer definierten (Druck-)Seite. Ein Beispiel, grob übersetzt: "Der Buchstabe Z in Schriftart Times in Farbe schwarz an der Position 24,50".

XML beschreibt i.d.R. nur die Struktur, also in etwa so: "Der Buchstabe Z als Teil einer Überschrift, die Teil eines Kapitels ist, das sich innerhalb eines Buch befindet."

Der Weg von PDF zu XML ist daher grundsätzlich SCHWIERIG. Aber vielleicht schafft Adobe ja hiermit irgendwann Abhilfe.
 

Neue Beiträge

Zurück