Suche Programm Fuer Textverarbeitung das Zeichen,Kommas usw entfert

son gohan

Erfahrenes Mitglied
Hallo,

ich habe im Moment eine Word Datei mit ca. 140.000 Woertern Text.
Ich wuerde gerne diesen Text in ein PHP Programm kopieren, aber habe das Problem das der Text voll ist mit Satzzeichen wie Kommas, Anfuehrungstriche usw, also lauter Sachen die in PHP selbst als verschiedene Befehler gelten.

Ich suche jetzt eine Moeglichkeit wie ich diesen Text auf die schneller bearbeiten kann, so das ich den Text bekomme ohne die Kommas und andere Zeichen die im moment noch drine sind, kann mir jemand ein Tipp geben?
 

tombe

Erfahrenes Mitglied
Also ich glaube nicht das es ein Programm gibt welches dir automatisch alle Satzzeichen bzw. Zeichen die du vorgibst aus einer WORD-Datei entfernt.

Wobei du das eigentlich recht schnell mit der WORD eigenen "Suchen und Ersetzen"-Funktion schaffen solltest.

Davon mal ganz abgesehen, habe ich dir doch in deinem ursprünglichen Beitrag gezeigt wie du die Satzzeichen mit PHP entfernen kannst!
 

son gohan

Erfahrenes Mitglied
Ja das problem ist ja das ich den Text erst so bearbeiten muss das ich in PHP ueberhaupt benutzen kann, im Moment ist der Text beispielweise mit Anfuehrungsstrichen voll sodass PHP lauter Fehlermeldungen zurueck gibt. Ich kann den Text so wie der jetzt ist ueberhaupt nicht in eine PHP variable mal einfach reinschreiben damit ich dann mit PHP das bearbeiten kann.

Am besten ware wenn ich ein Programm finde wo ich direkt den kompletten Text reinschreiben kann und nach einzelnen uniquen Woetern durchsuchen oder Filtern lassen kann.
 

tombe

Erfahrenes Mitglied
Na dann nimm wie oben geschrieben die "Suchen und Ersetzen"-Funktion.

Du suchst dann beispielsweise nach doppelten Anführungszeichen und ersetzt sie durch nichts (Feld einfach leer lassen).

Du kannst so sogar mehrere, verschiedene Zeichen (Punkt, Komma, ...) gleichzeitig ersetzen lassen indem du sie z.B. so schreibst [;,:.-], also alle Zeichen die ersetzt werden sollen in eckige Klammern und dann "Platzhalter verwenden" markieren.
 

Bratkartoffel

gebratene Kartoffel
Premium-User
Hi son_gohan,

mit folgendem Konstrukt kannst den Text 1:1 in dein PHP-Script kopieren:
PHP:
<?php

$a = <<<'END_OF_TEXT_MARKER'
hier der inhalt.
dies ist 'ein"test.$abc

END_OF_TEXT_MARKER;

echo $a;

Weiß zwar jetzt nicht wie das heißt, aber somit kannst du beliebige Zeichen in einer Variable speichern ohne dich um das Escaping kümmern zu müssen.

// Edit: Sowas nennt sich Heredoc, bzw. ohne dass Variablen interpretiert werden bei PHP dann nowdoc.

Grüße,
BK
 
Zuletzt bearbeitet:

son gohan

Erfahrenes Mitglied
Stimmt jetzt klappt es mit der Suchen und Ersetzen Funktion.

@Bratkartoffel:
Danke wenn ich nicht weiter komme probiere ich das auch aus, ich habe jetzt mit Suchen und Ersetzen die vielen Anfuehrungsstriche entfernt und konnte so schon den Text in eine PHP string variable speichern.
 

ComFreek

Mod | @comfreek
Moderator
Stimmt jetzt klappt es mit der Suchen und Ersetzen Funktion.

Sorry, wenn ich das so sage, aber die Idee mit Suchen und Ersetzen ist doch nur umständlich!

Nimm einfach Bratkartoffel's Lösung und fertig.

Oder - noch besser - speicher den Text in ein normales Textdokument und lade dieses per [phpf]file_get_contents[/phpf]:
PHP:
<?php
$str = file_get_contents('file.txt');
 

son gohan

Erfahrenes Mitglied
Sorry, wenn ich das so sage, aber die Idee mit Suchen und Ersetzen ist doch nur umständlich!

Nimm einfach Bratkartoffel's Lösung und fertig.

Oder - noch besser - speicher den Text in ein normales Textdokument und lade dieses per [phpf]file_get_contents[/phpf]:
PHP:
<?php
$str = file_get_contents('file.txt');

danke fuer die guten ideen.