Zeichensatz ermitteln?

Status
Nicht offen für weitere Antworten.

klaeuschen41

Mitglied
Hallo ng,

ist es möglich, den Zeichensatz zu ermitteln, den ein Browser verwendet?

Ich habe nämlich das Problem, dass ich aus verschiedenen Ländern (u.a. Osteuropa) Formular-Daten geschickt bekomme, die ich auf dem Server als UTF-8 speichern möchte.

Wenn ich es richtig sehe, widerspricht es dem Internet-Gedanken, den Browser zu irgendetwas zu zwingen (z.B. einen bestimmten Zeichensatz zu verwenden), aber es sollte doch zumindest möglich sein, den verwendeten Zeichensatz zu ermitteln, so dass man ihn dann auf dem Server entsprechend umwandeln kann, oder? (es gibt da eine JS-Eigentschaft document.charset, aber die ist laut Selfhtml leider nur für IE gültig).

Vielen Dank für Hilfe (bin schon ziemlich am Verzweifeln!) und schöne Grüße,
Klaus
 
Für Formulare benutze ich generell Windows1252 als Zeichenkodoierung und ich hab auch von drüben Kollegen die mir ab und an mailen!
 
Hallo,
thecamillo hat gesagt.:
Für Formulare benutze ich generell Windows1252 als Zeichenkodoierung und ich hab auch von drüben Kollegen die mir ab und an mailen!
Aber wie legst du fest, dass Windows1252 im Formular verwendet wird? Ich habe nichts finden können, wie das geht.

zusätzliches Problem: Was passiert mit Linux-Nutzern?

Viele Grüße,
Klaus
 
Ich habe mich um ehrlich zu sein nicht mit einer solchen Thematik, der Linux-User betreffend, auseinandergesetzt!

Damit meine Formulardaten als W1252 bei mir ausgelsen werden habe ich das entsprechende Attribut dafür in das Feedbackformular eingebunden!

BSP:
<form action="/cgi-bin/feedbackformular.pl" method="get" accept-charset="ISO-8859-1, ISO-8859-2, windows-1252">
<!-- hier folgen Formularelemente -->
</form>

Ich habe mich nunmal deswegen für dieses Formular entschieden, weil ich der Ansicht bin, du anscheinend nicht, dass UTF-8 derzeit, noch vollkommen überflüssig ist. UTF-8 macht erst dann Sinn, wenn man auf dotNet Ebene arbeitet!

mfg cu thecamillo
 
thecamillo hat gesagt.:
Ich habe mich nunmal deswegen für dieses Formular entschieden, weil ich der Ansicht bin, du anscheinend nicht, dass UTF-8 derzeit, noch vollkommen überflüssig ist. UTF-8 macht erst dann Sinn, wenn man auf dotNet Ebene arbeitet!
Du denkst irgendwie zu Windows-lastig. Das hat doch mit .NET gar nichts zu tun. UTF-8 macht generell Sinn wenn man mit verschiedenen (natürlichen) Sprachen arbeitet. Wenn z.B. ein japanischer Nutzer gern seinen Namen als Hiragana oder Kanji in das Formular eintragen will, ist das ohne weiteres möglich dies als UTF-8 zu übertragen. Mit cp-1252 sieht das schlecht aus.

Gruß
 
thecamillo hat gesagt.:
Ich habe mich um ehrlich zu sein nicht mit einer solchen Thematik, der Linux-User betreffend, auseinandergesetzt! ...
..., weil ich der Ansicht bin, du anscheinend nicht, dass UTF-8 derzeit, noch vollkommen überflüssig ist. UTF-8 macht erst dann Sinn, wenn man auf dotNet Ebene arbeitet!
Niemals!
Du hast mit Angabe der akzeptierten Zeichensätze u.U. kyrillische Zeichen ausgeschlossen. Mit UTF-8 passiert das eben nicht.
Und was auf dotNet-Ebene passiert, ist UTF-8 sicherlich egal.
 
UTF8 und dotNet haben in etwa soviel zusammen tun wie Birnen mit Äpfeln.
Ich kann auch nur empfehlen UTF8 zu verwenden. Der Zeichensatz deckt einfach alles ab und sperrt keinen aus.

Grüße
Heiko
 
Leute mir liegt es fern euch in eurem Progger Ego zu kränken aber vielleicht wisst ihrs net besser also klär ich euch grad mal short auf:

Ich arbeite in einer Firma die sich mit Produktklassifizierung auseinander setzt und das mittlerweile so lange um sagen zu können, das die Leute hier recht viel Ahnung haben im Bezug auf Zeichenkoodierung.

Wir beschäftigen uns mit der Thematik X-Daten in X-Anwendungen zu übertragen, ob nun Standalone, Networks oder Internet-Applikationen. Bei Internet-Applikationen hat sich dotNet als sinnvoll erwiesen, jedoch basieren die meisten Daten, die im Umlauf sind, auf 8-Bit Zeichensätze (256 möglich Zeichen) aber für Intenet-Applikationen mit kuryllischen Zeichen oder gar Icons (für asiatische Schrifttypen üblich) intelligent zu verwenden ist ein heikles Thema. Als Beispiel nehmen wir Multilingualität im dynamischen screenediting. Erst da macht UTF-8 wirklich Sinn und nicht bei einem pobligen Formular und hätte einer von euch sich nicht nur die ersten beiden Sätze von SelfHTML durch gelesen, wäre so eine Antwort die Ihr mir da hingeklatscht habt, gar nicht gekommen!

Wenn ich von Internetapplikationen rede, dann versteh ich das was die Leute darunter verstehen, die sich auch mit der Thematik von so etwas beschäftigen und für alle Egomanen unter euch:

Eine Internetappliaktion ist ein Anwendungsprogramm zur Lösung bestimmter Aufgaben welche vollständig auf einem Webserver laufen, so dass man sich dort anmeldet und jederzeit im Takt von 24/7 jederzeit seine Daten bearbeiten kann!


mfg thecamillo
 
Ich hoffe, du weißt, dass die Zeichensätze ISO 8859-1, ISO 8859-2 und Windows 1252 alle unterschiedlich sind. Wie entscheidest du nun serverseitig, welches der angegebenen Zeichensätze tatsächlich verwendet wurde?

thecamillo hat gesagt.:
[…] und hätte einer von euch sich nicht nur die ersten beiden Sätze von SelfHTML durch gelesen, wäre so eine Antwort die Ihr mir da hingeklatscht habt, gar nicht gekommen!
Unicode hat doch gerade den Vorteil, dass man sich über die verfügbaren Zeichen und daher auch die Wahl des passenden Zeichensatzes keine Gedanken machen muss, da Unicode bereits alle abdeckt.

Vielleicht solltest du dich mal etwas genauer mit Unicode beschäftigen, bevor du uns deine Weisheiten mitteilst.
 
Status
Nicht offen für weitere Antworten.
Zurück