Re: Codierungsproblem mit UTF-8

From: Martin Honnen (mahotrash_at_yahoo.de)
Date: 09/17/04


Date: Fri, 17 Sep 2004 13:23:05 +0200


Thomas wrote:

> Ich versuche mit ASP ein XML-Dokument zu erzeugen, was an
> und für sich auch ganz gut klappt. Ich erzeuge ein paar
> Schleifen und Datenbankabfragen einen String, welchen ich
> in einer Datei speichere.
> Das Problem dabei ist, dass die Daten in UTF-16 gespeichert
> werden, obwohl ich bei dem Skript @CodePage=65001 für UTF-8
> notiert habe. Man sieht eigentlich keinen Unterschied - nur
> mit einem Hex-Editor kann man sich die BOM-Bytes anschauen.
> Dort stehen dann die UTF-16 BOM-Bytes und auch ganz normale
> ASCII-Zeichen werden in zwei Bytes abgespeichert. Dadurch
> ist die Datei natürlich doppelt so gross, wie sie mit UTF-8
> wäre.
>
> Was muss ich anders machen, damit die Daten richtig
> gespeichert werden?
>
> Oder liegt es nur am Speichern selbst? Ich speichere mit
> der CreateTextFile()-Methode des FileSystem-Objekts. Dabei
> kann ich nur sagen, ob ich Unicode will oder nicht. Das
> Ändern dieses Parameters hat aber dem Anschein nach auch
> keinen Einfluss darauf. Wie kriege ich das richtig hin?

Das FileSystemObject kann meines Wissens nur UTF-16 oder aber 8-bit code
pages wie Windows-1252.
Per MSXML kann man aber sicher eine UTF-8 kodierte XML-Datei erzeugen.

-- 
	Martin Honnen
	http://JavaScript.FAQTs.com/


Relevant Pages

  • Re: The Register interview Nigel Brown
    ... performance isn't quite as good as string. ... Have you considered implementing a native UTF-8 ... than UTF-16 with European ... which does not include all Chinese characters. ...
    (borland.public.delphi.non-technical)
  • Re: What string encoding to pick as standard for a programming language?
    ... UTF-8 doesn't suffer from endianness issues. ... I don't want different string types in the language and I don't want them to ... UTF-16 has a number of issues, as you seem to have discovered as well. ...
    (comp.lang.misc)
  • Codierungsproblem mit UTF-8
    ... dass die Daten in UTF-16 gespeichert ... mit einem Hex-Editor kann man sich die BOM-Bytes anschauen. ... ist die Datei natürlich doppelt so gross, wie sie mit UTF-8 ...
    (microsoft.public.de.inetserver.iis.asp)
  • Re: UTF-8 encoding in AJAX web application.
    ... And if so how come the result is still in UTF-8 when I retrieve ... in the string have to be read with a UTF-8 encoding to make sense? ... you would like the string to be UTF-16, but the bytes in the string have to ... So does fetching the CDATA section's value like this actually translate from ...
    (microsoft.public.dotnet.languages.csharp)
  • Re: Unicode Delphi Win32 - which approach
    ... Personally I'd probably go for UTF-8. ... But that's just my opinion. ... What are, in your opinion, the disadvantages of string compared with string? ... Because we are mainly on Windows I'd rather prefer an UTF-16 encoding. ...
    (borland.public.delphi.non-technical)