Code Seite 936 (Microsoft Windows)

Windows -Code Seite 936 (abgekürzt MS936, Windows-936 oder (mehrdeutig) CP936),[1] ist Microsofts Charaktercodierung für vereinfachtes Chinesisch, einer der vier DBCSS zum Ostasiatische Sprachen. Ursprünglich bedeckte Windows-936 GB 2312 (in seinem EUC-CN Form), aber es wurde erweitert, um den größten Teil abzudecken GBK mit der Veröffentlichung von Windows 95.

IBMs Code Seite 936[2] ist eine andere Kodierung für vereinfachte Chinesen, obwohl jedoch Internationale Komponenten für Unicode Fügen Sie keinen IBM-936-Codec bei und verwendet die Windows-Code-Seite für die Etikett "CP936".[1] Die Codeseite von IBM für die GBK -Berichterstattung ist Code Seite 1386 (CP1386 oder IBM-1386), die als eine Kombination des einzelnen Byte definiert ist Code Seite 1114 und das Doppelbyte Code Seite 1385.[3]

Es wurde von ersetzt von Code Seite 54936 (GB 18030), aber ab 2014 war immer noch im Gebrauch. Das Windows -Eingabeaufforderung Verwendet CP936 als Standardcode -Seite für vereinfachte chinesische Installationen, obwohl ein Teil des GB 18030 für alle in China verkauften Softwareprodukte obligatorisch gemacht wurde. Im Jahr 2002 der IANA -Internetname GBK wurde bei der Mapping von Windows-936 registriert,[4][5] Machen Sie es zum de facto GBK -Definition im Internet.

Die Konzepte von "Windows-936", "GBK",[a] "GB2312" und "EUC-CN" sind manchmal in verschiedenen Softwareprodukten verwirrt. Codeseiten MS936 und 1386 sind nicht identisch mit GBK, da eine Code -Seite Zeichen codiert, während GBK nur Codepunkte definiert. zusätzlich Eurozeichen (€), codiert als 0x80 sowohl in Windows-936 als auch IBM-1386, ist in GBK nicht definiert. Andererseits wurden 95 in GBK definierte 95 Zeichen anfangs nicht in Windows-936 codiert.

Dies wird teilweise in späteren Versionen von Windows und wie in Windows 7 alle GBK -Zeichen nicht im Unicode -BMP aufgelöst Privatnutzungsbereich Kann mit Code Seite 936 angezeigt werden, aber die Codierung der 95 Zeichen wurde ab 2014 noch nicht unterstützt. "CP936" und "GBK" werden jedoch aufgrund der Popularität von Microsoft -Produkten auf dem chinesischen Markt häufig austauschbar verwendet, als GBK dann veröffentlicht wurde.

Seit GBK vor langer Zeit GB 2312 ersetzt hat, sind diese beiden Begriffe auch vielen Benutzern praktisch entsprechend geworden, sodass "Windows-936", "GBK" und "GB 2312" von vielen missverstanden werden, um dasselbe zu bedeuten, während sie sich tatsächlich erheblich unterscheiden. Anstatt genau EUC-CN / GB 2312 zu unterstützen, bedeuten die meisten modernen Windows-basierten Softwareprodukte eine teilweise Unterstützung für GBK über Windows-936, wenn sie den Begriff "GB 2312" als Charakter-Codierungsoption verwenden. Dies kann in Produkten wie Microsoft Internet Explorer und Notepad ++ beobachtet werden.

Anmerkungen

  1. ^ GBK 1.0

Verweise

  1. ^ a b "Windows-936-2000 (Alias ​​CP936)". ICU -Demonstration - Konverter -Explorer. Internationale Komponenten für Unicode.
  2. ^ "Codierte Zeichensatzkennungen - CCSID 936". IBM Globalisierung. IBM. Archiviert von das Original Am 2014-12-01.
  3. ^ "Codierte Zeichensatzkennungen - CCSID 1386". IBM. Archiviert von das Original Am 2014-11-29.
  4. ^ "Charaktersätze". Abgerufen 3. Oktober 2016.
  5. ^ Anwendung der IANA Charset -Registrierung für GBK

Externe Links

Windows-936:

IBM-1386: