ISO/IEC 8859-11

ISO/IEC 8859-11: 2001, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 11: Latein/thailändisches Alphabet, ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen, Erstausgabe, veröffentlicht im Jahr 2001. Es wird informell als als bezeichnet als Latein/Thai. Es ist nahezu identisch mit dem National Thai Standard TIS-620 (1990). Der einzige Unterschied besteht darin, dass ISO/IEC 8859-11 zuteilt Nicht bahnbrechender Raum zum Code 0xa0, während TIS-620 es undefiniert lässt. (In der Praxis wird diese kleine Unterscheidung normalerweise ignoriert.)

ISO-8859-11 ist nicht Ein Hauptname des Haupt registrierten Iana Charset, obwohl er dem normalen Muster für IANA -Charsets basierend auf dem folgt ISO 8859 Serie. Es ist jedoch als Alias ​​definiert[1] des engen Äquivalents TIS-620 (was fehlt der nicht bahnbrechende Raum) und was ohne Probleme für ISO/IEC 8859-11 verwendet werden kann, da der No-Break-Raum einen Code hat, der in TIS-620 nicht zugewiesen wurde. Microsoft hat zugewiesen Code Seite 28601 a.k.a. Windows-28601 zu ISO-8859-11 in Windows.[2] Ein Entwurf hatte die thailändischen Briefe an verschiedenen Stellen.[3]

Wie bei allen Sorten von ISO/IEC 8859 entsprechen die unteren 128 Codes zu ASCII. Die zusätzlichen Charaktere, abgesehen von No-Break-Raum, werden in gefunden Unicode In der gleichen Reihenfolge wechselte nur von 0xa1 auf u+0e01 und so weiter.

Das Microsoft Windows -Code -Seite 874 sowie die Code -Seite, die in der thailändischen Version der verwendet wird Apple Macintosh, Macthai, sind Varianten von TIS-620-jedoch unvereinbar miteinander.

Zeichensatz

ISO/IEC 8859-11[4]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x
Axt NBSP
BX
CX
Dx ◌ ั ◌ ิ ◌ ี ◌ ึ ◌ ื ◌ ุ ◌ ู ◌ ฺ ฿
Ex ◌ ็ ◌ ่ ◌ ้ ◌ ๊ ◌ ๋ ◌ ์ ◌ ํ ◌ ๎
Fx

Codewerte D1, D4-da, E7-ee sind Charaktere kombinieren.

Verkäuferverlängerungen

Code Seite 874 (IBM) / 9066

IBM -Code Seite 874 (CP874, IBM-874, X-IBM874), auch bekannt als Code Seite 9066 (IBM-9066),[5] Unterscheidet sich von ISO/IEC 8859-11 in nur neun in der folgenden Tabelle angegebenen Symbole:[6][7][8]

IBM-Code Seite 874/9066 (Unterschiede von ISO-8859-11)[9][10][11]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
Axt ◌ ่
BX
CX
Dx ◌ ั ◌ ิ ◌ ี ◌ ึ ◌ ื ◌ ุ ◌ ู ◌ ฺ ◌ ้ ︀ ◌ ๊ ︀ ◌ ๋ ︀ ◌ ์ ︀ ฿
Ex ◌ ็ ◌ ่ ◌ ้ ◌ ๊ ◌ ๋ ◌ ์ ◌ ํ ◌ ๎
Fx ¢ ¬ ¦ NBSP
 Unterschiede von ISO 8859-11

Code Seite 1161

Code Seite 1161 (CP1161, IBM-1161), ist eine Variante von IBM -Code Seite 874. Die einzige Differenz ist das Euro -Zeichen (€) in Position De deverhexen (222).[12][13]

Code Seite 874 (Microsoft) / 1162

Windows -Code Seite 874 (Windows-874, MS874, X-Windows-874), bekannt als Code Seite 1162 (CP1162, IBM-1162) von IBM,[14][15] wird von Microsoft Windows verwendet. Es unterscheidet sich von ISO/IEC 8859-11 um nur neun Symbole, wie in der folgenden Tabelle gezeigt:

Code Seite 1162 (IBM) / 874 (Microsoft): Differenz von ISO-8859-11[16][17][18][19]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
8x
9x
 Unterschiede von ISO 8859-11

Mac OS Thai

Dies ist die Variante, die auf dem verwendet wird Klassischer Mac OS.

Mac OS Thai[20]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
8x « » ◌ ่ ◌ ้ ◌ ๊ ◌ ๋ ◌ ์ ◌ ่ ◌ ้ ◌ ๊ ◌ ๋ ◌ ์ ◌ ํ
9x ◌ ั ◌ ็ ◌ ิ ◌ ี ◌ ึ ◌ ื ◌ ่ ◌ ้ ◌ ๊ ◌ ๋ ◌ ์
Axt NBSP
BX
CX
Dx ◌ ั ◌ ิ ◌ ี ◌ ึ ◌ ื ◌ ุ ◌ ู ◌ ฺ   W J  ZwSP ฿
Ex ◌ ็ ◌ ่ ◌ ้ ◌ ๊ ◌ ๋ ◌ ์ ◌ ํ
Fx ® ©
 Unterschiede von ISO 8859-11

Siehe auch

Fußnoten

Verweise

  1. ^ "Iana -Charakter setzt".
  2. ^ "JS-Cododepage, Codepages erhalten". GitHub. 12. Oktober 2021.
  3. ^ Everson, Michael. "Vorgeschlagener ISO 8859-11".
  4. ^ Whistler, Ken (2002-10-07), ISO/IEC 8859-11: 2001 an Unicode, Unicode -Konsortium
  5. ^ IBM; Unicode -Konsortium. "concrtrs.txt". Internationale Komponenten für Unicode. v. 59180.0.1. Ja IBM-874 == IBM-9066. IBM-1161 hat das Euro-Update.
  6. ^ "Code Seite 874 Informationsdokument". Archiviert von das Original Am 2017-01-16.
  7. ^ "CCSID 874 Informationsdokument". Archiviert von das Original am 2016-03-27.
  8. ^ "CCSID 9066 Informationsdokument". Archiviert von das Original am 2016-03-27.
  9. ^ IBM. "Code Seite CPGID 00874" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
  10. ^ Code Seite CPGID 00874 (TXT), IBM
  11. ^ "Converter Explorer: IBM-874_P100-1995". Internationale Komponenten für Unicode. Unicode -Konsortium.
  12. ^ "Code Seite 01161" (PDF).
  13. ^ "CCSID 1161 Informationsdokument". Archiviert von das Original am 2016-03-27.
  14. ^ "Code Seite 1162 Informationsdokument". Archiviert von das Original Am 2016-03-17.
  15. ^ "CCSID 1162 Informationsdokument". Archiviert von das Original am 2016-03-27.
  16. ^ "Code Seite 01162" (PDF).
  17. ^ Steele, Shawn (1998-02-28). "CP874 zu Unicode Tabelle". Unicode -Konsortium, Microsoft.
  18. ^ Code Seite CPGID 01162 (TXT), IBM
  19. ^ Internationale Komponenten für Unicode (ICU), IBM-1162_P100-1999.UCM, 2002-12-03
  20. ^ Apfel (2005-04-05). "Karte (externe Version) vom Mac OS Thai -Zeichen auf Unicode 3.2 und später". Unicode -Konsortium.

Externe Links