Re: Zeichenketten konvertieren

Tech-Archive recommends: Repair Windows Errors & Optimize Windows Performance





Stefan Hornung wrote:

Ich will aus einer ASCII-Datei eine Zeichenkette auslesen und diese dann in einem Script in ein utf-8 Format konvertieren. Leider finde ich zum konvertieren keinen Befehl. Kann mir da vielleicht jemand aushelfen??

In VBScript oder JScript arbeitet man ja einfach mit Zeichenketten, deren interne Kodierung ist zwar meines Wissens UTF-16, aber das Script sieht ja nur eine Sequenz von Zeichen, deren Kodierung nicht relevant ist. Eine Kodierung macht ja nur Sinn, wenn man auf die Byte-Ebene geht, so du also mit dem FileSystemObject arbeitest, dann erlaubt dir das meines Wissens nur das Speichern als ANSI-Codepage, als ASCII oder als Unicode (was dann UTF-16 ist):
<http://msdn.microsoft.com/library/default.asp?url=/library/en-us/script56/html/jsmthOpenAsTextStream.asp>


Was nun das konvertieren von ASCII in UTF-8 angeht, frage ich mich allerdings, was das bewirken soll, ASCII enthaelt 128 Zeichen und diese 128 Zeichen sind auch als Untermenge in Unicode enthalten und da in UTF-8 auch genau so kodiert wie in ASCII.
<http://www.unicode.org/charts/PDF/U0000.pdf>



--

	Martin Honnen --- MVP XML
	http://JavaScript.FAQTs.com/
.



Relevant Pages

  • Re: UTF-8 Erkennung
    ... ASCII meint Zeichen von 0-127. ... Diese sind aber in UTF-8 identisch. ... D.h. ASCII ist eine echte Untermenge von UTF-8. ... kann man es mit Java einfach konvertieren. ...
    (de.comp.lang.java)
  • Re: Zeichenketten konvertieren
    ... Ich will über ein vb-Script eine Datei im Dateiaufbau konvertieren. ... > deren interne Kodierung ist zwar meines Wissens UTF-16, ... > Was nun das konvertieren von ASCII in UTF-8 angeht, ... > allerdings, was das bewirken soll, ASCII enthaelt 128 Zeichen und diese ...
    (microsoft.public.de.german.scripting.wsh)
  • Re: Zeichensatz von us-ascii nach UTF-8 konvertieren
    ... us- ascii nach UTF-8. ... sind die 128 US-ASCII Zeichen aus ... wenn du eine reine US-ASCII Datei ... ASCII Dateien auch unter UTF-8 nur ein Byte belegt würde. ...
    (de.comp.os.unix.shell)
  • Re: Zeichenkodierung in der shell
    ... wenn Leute, die eigentlich nur ASCII brauchen, eine Kodierung f.AN|r ... Unicode bauen. ... UTF-8 hat sich mitlerweile als eine durchaus brauchbare codierung ...
    (de.comp.os.unix.linux.misc)
  • Re: =?windows-1252?Q?LaTeX-Einf=FChrung_f=FCr_Doktoranden_?= =?windows-1252?Q?=28quasi_f
    ... UTF-8 ist lediglich eine Kodierung für Unicode und erlaubt theoretisch deutlich mehr Zeichen. ...
    (de.comp.text.tex)