OpenOffice / Microsoft Office Dateien zu Text-Files konvertieren

DrMueller

Erfahrenes Mitglied
Hallo Leute,

ich habe im VB6 Forum angefragt, ob jemand Möglichkeiten kennt, wie man verschiedene Formate zu Text-Files konvertieren kann.
Es kann auch ein zugekauftes Programm sein, allerdings würden wir da eine royalty free Lizenz benötigen, und irgendwie wird dies so nirgends, oder extrem überteuert, angeboten.
Eine Alternative wäre, für die einzelnen Typen einzelne Programme zu kaufen, also:
PDF --> TXT ein Programm
DOC --> TXT ein Programm

etc.
für PDF 2 TXT braucht es sicher was zugekauftes, allerdings habe ich mir überlegt: Wäre es nicht möglich, gerade für OpenOffice und Microsofrt Office dies selber zu schreiben? Es braucht ja sicher kein komplettes Office installiert zu sein, um dies zu bewerkstellen, die benötigten DLLs würden doch reichen, oder?

Hat da jemand schon mal Erfahrung mit gemacht oder wird dies eher so nicht realisierbar sein?


Vielen Dank im Voraus für alle Antworten

Müller Matthias
 
Hallo DrMueller,

ich habe leider nicht so viel Erfahrung damit, aber du könntest ja mal

http://www.softinterface.com/Convert-Doc/Convert-PDF-Target.htm?gclid=CMDSnOyw0LMCFYta3god33AAog

oder

http://www.chip.de/downloads/Some-PDF-to-Txt-Converter_31735164.html

für PDF -> TXT versuchen.

Mit

http://doxillion-document-converter.softonic.de/

habe ich selber recht gute Erfahrungen gemacht. Leider geht da bei mir auch immer die Formatierung verloren. Das Tool ist aber kostenlos, kann jedoch Upgegraded werden.

Gruß
Hale
 
Zuletzt bearbeitet:
Ich habe hier kein Word installiert, kann es also nicht testen. Aber ich bin mir sicher, dass Word eine Funktion hat, um Dokumente als Text-Datei zu speichern (Datei -> Speichern unter -> txt?). Wenn dem so ist, dann sollte es recht einfach sein, diese Funktion mit C#/VB.Net/VB6/VBA aufzurufen.
 
Das Problem ist eben, dass es ein Indexer ist und auf dem Server läuft.
Daher darf es eben keine Voraussetzung sein, dass die einzelnen Programme installiert werden.
Ich müsste also alles benötigte selber mitliefern, daher auch die Idee mit den Zusatzprogrammen.

Formatierung ist eben egal, es sollen nur die Wörter geindext werden.


@Hale, schaue ich mir an, Danke. PDF2TXT dürfte nicht so das Problem sein, eher Excel/word/OpenOffice
 

Neue Beiträge

Zurück