Sprint
Erfahrenes Mitglied
Hallo zusammen,
ich arbeite momentan daran, eine CSV Datei in eine Datenbank einzulesen. Diese Datei ist normalerweise ISO-8859-15 codiert. Wenn ich die betroffenen Felder mit mb_convert_encoding() in UTF-8 umwandle, stehen die anschließend auch korrekt mit Umlauten in der Datenbank.
Es läßt sich jetzt aber nicht ausschließen, daß die Datei mal UTF-8 kodiert kommt. Wenn ich die dann einlese, erscheinen nur ? anstelle der Umlaute. Ein vorheriges mb_detect_encoding() ergibt aber immer UTF-8, was mir im Falle einer erforderlichen Umwandlung natürlich nicht hilft.
Gibt es eine Möglichkeit, den Zeichensatz eines Strings oder der Datei korrekt zu ermitteln?
ich arbeite momentan daran, eine CSV Datei in eine Datenbank einzulesen. Diese Datei ist normalerweise ISO-8859-15 codiert. Wenn ich die betroffenen Felder mit mb_convert_encoding() in UTF-8 umwandle, stehen die anschließend auch korrekt mit Umlauten in der Datenbank.
Es läßt sich jetzt aber nicht ausschließen, daß die Datei mal UTF-8 kodiert kommt. Wenn ich die dann einlese, erscheinen nur ? anstelle der Umlaute. Ein vorheriges mb_detect_encoding() ergibt aber immer UTF-8, was mir im Falle einer erforderlichen Umwandlung natürlich nicht hilft.
Gibt es eine Möglichkeit, den Zeichensatz eines Strings oder der Datei korrekt zu ermitteln?