Nicht utf8 Zeichen aus String entfernen

Templorials

Erfahrenes Mitglied
Hallo,

ich weiß zwar nicht ob ich den Titel Technisch richtig gewählt habe aber ich habe folgendes Problem:

Mir liegt eine XML Datei vor die ich per SimpleXMLElement einlese.

Jedoch kommen in diesem Dokument verschiedenste / nicht von mir beeinflussbare Inhalte vor. Also muss ich die Datei vor dem Einlesen per Script anpassen.

Sonderzeichen lassen sich ja noch recht einfach ersetzen. Jedoch kommen dann auch noch so Zeichen wie dieser langgezogene Bindestrich – etc vor.

Gibt es da eine Möglichkeit diese Zeichen zu entfernen bzw ersetzen?

Lg, Michi
 
Oh sry hatte ich garnet gesagt..

ansonsten funktioniert das einlesen nicht..

hab es jetzt mit urldecode(urlencode(dateiinhalt)) gelöst ..
 
Hast du denn die korrekte Kodierung angegeben? Und wo stammt das XML-Dokument her? Wenn es eine Fehlermeldung gibt, scheint es nicht wohlgeformt zu sein.
 
ja wie gesagt ich hab keinen einfluss auf diese xml dateien..

und eins gibs zb da kommt irgentwo so ein langer bindestrich vor und lässt sich nicht einlesen.. sobald ich den bindestrich entferne gehts.
 

Neue Beiträge

Zurück