ISO/IEC 8859-11
ISO/IEC 8859-11: 2001, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 11: Latein/thailändisches Alphabet, ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen, Erstausgabe, veröffentlicht im Jahr 2001. Es wird informell als als bezeichnet als Latein/Thai. Es ist nahezu identisch mit dem National Thai Standard TIS-620 (1990). Der einzige Unterschied besteht darin, dass ISO/IEC 8859-11 zuteilt Nicht bahnbrechender Raum zum Code 0xa0, während TIS-620 es undefiniert lässt. (In der Praxis wird diese kleine Unterscheidung normalerweise ignoriert.)
ISO-8859-11 ist nicht Ein Hauptname des Haupt registrierten Iana Charset, obwohl er dem normalen Muster für IANA -Charsets basierend auf dem folgt ISO 8859 Serie. Es ist jedoch als Alias definiert[1] des engen Äquivalents TIS-620 (was fehlt der nicht bahnbrechende Raum) und was ohne Probleme für ISO/IEC 8859-11 verwendet werden kann, da der No-Break-Raum einen Code hat, der in TIS-620 nicht zugewiesen wurde. Microsoft hat zugewiesen Code Seite 28601 a.k.a. Windows-28601 zu ISO-8859-11 in Windows.[2] Ein Entwurf hatte die thailändischen Briefe an verschiedenen Stellen.[3]
Wie bei allen Sorten von ISO/IEC 8859 entsprechen die unteren 128 Codes zu ASCII. Die zusätzlichen Charaktere, abgesehen von No-Break-Raum, werden in gefunden Unicode In der gleichen Reihenfolge wechselte nur von 0xa1 auf u+0e01 und so weiter.
Das Microsoft Windows -Code -Seite 874 sowie die Code -Seite, die in der thailändischen Version der verwendet wird Apple Macintosh, Macthai, sind Varianten von TIS-620-jedoch unvereinbar miteinander.
Zeichensatz
ISO/IEC 8859-11[4] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Axt | NBSP | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ |
BX | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
CX | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
Dx | ะ | ◌ ั | า | ำ | ◌ ิ | ◌ ี | ◌ ึ | ◌ ื | ◌ ุ | ◌ ู | ◌ ฺ | ฿ | ||||
Ex | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌ ็ | ◌ ่ | ◌ ้ | ◌ ๊ | ◌ ๋ | ◌ ์ | ◌ ํ | ◌ ๎ | ๏ |
Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ |
Codewerte D1, D4-da, E7-ee sind Charaktere kombinieren.
Verkäuferverlängerungen
Code Seite 874 (IBM) / 9066
IBM -Code Seite 874 (CP874, IBM-874, X-IBM874), auch bekannt als Code Seite 9066 (IBM-9066),[5] Unterscheidet sich von ISO/IEC 8859-11 in nur neun in der folgenden Tabelle angegebenen Symbole:[6][7][8]
IBM-Code Seite 874/9066 (Unterschiede von ISO-8859-11)[9][10][11] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | ◌ ่ | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ |
BX | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
CX | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
Dx | ะ | ◌ ั | า | ำ | ◌ ิ | ◌ ี | ◌ ึ | ◌ ื | ◌ ุ | ◌ ู | ◌ ฺ | ◌ ้ ︀ | ◌ ๊ ︀ | ◌ ๋ ︀ | ◌ ์ ︀ | ฿ |
Ex | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌ ็ | ◌ ่ | ◌ ้ | ◌ ๊ | ◌ ๋ | ◌ ์ | ◌ ํ | ◌ ๎ | ๏ |
Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ¢ | ¬ | ¦ | NBSP |
Code Seite 1161
Code Seite 1161 (CP1161, IBM-1161), ist eine Variante von IBM -Code Seite 874. Die einzige Differenz ist das Euro -Zeichen (€) in Position De deverhexen (222).[12][13]
Code Seite 874 (Microsoft) / 1162
Windows -Code Seite 874 (Windows-874, MS874, X-Windows-874), bekannt als Code Seite 1162 (CP1162, IBM-1162) von IBM,[14][15] wird von Microsoft Windows verwendet. Es unterscheidet sich von ISO/IEC 8859-11 um nur neun Symbole, wie in der folgenden Tabelle gezeigt:
Code Seite 1162 (IBM) / 874 (Microsoft): Differenz von ISO-8859-11[16][17][18][19] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
8x | € | … | ||||||||||||||
9x | ‘ | ’ | “ | ” | • | – | — |
Mac OS Thai
Dies ist die Variante, die auf dem verwendet wird Klassischer Mac OS.
Mac OS Thai[20] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
8x | « | » | … | ◌ ่ | ◌ ้ | ◌ ๊ | ◌ ๋ | ◌ ์ | ◌ ่ | ◌ ้ | ◌ ๊ | ◌ ๋ | ◌ ์ | “ | ” | ◌ ํ |
9x | • | ◌ ั | ◌ ็ | ◌ ิ | ◌ ี | ◌ ึ | ◌ ื | ◌ ่ | ◌ ้ | ◌ ๊ | ◌ ๋ | ◌ ์ | ‘ | ’ | ||
Axt | NBSP | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ |
BX | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
CX | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
Dx | ะ | ◌ ั | า | ำ | ◌ ิ | ◌ ี | ◌ ึ | ◌ ื | ◌ ุ | ◌ ู | ◌ ฺ | W J | ZwSP | – | — | ฿ |
Ex | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌ ็ | ◌ ่ | ◌ ้ | ◌ ๊ | ◌ ๋ | ◌ ์ | ◌ ํ | ™ | ๏ |
Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ® | © |
Siehe auch
Fußnoten
Verweise
- ^ "Iana -Charakter setzt".
- ^ "JS-Cododepage, Codepages erhalten". GitHub. 12. Oktober 2021.
- ^ Everson, Michael. "Vorgeschlagener ISO 8859-11".
- ^ Whistler, Ken (2002-10-07), ISO/IEC 8859-11: 2001 an Unicode, Unicode -Konsortium
- ^ IBM; Unicode -Konsortium. "concrtrs.txt". Internationale Komponenten für Unicode. v. 59180.0.1.
Ja IBM-874 == IBM-9066. IBM-1161 hat das Euro-Update.
- ^ "Code Seite 874 Informationsdokument". Archiviert von das Original Am 2017-01-16.
- ^ "CCSID 874 Informationsdokument". Archiviert von das Original am 2016-03-27.
- ^ "CCSID 9066 Informationsdokument". Archiviert von das Original am 2016-03-27.
- ^ IBM. "Code Seite CPGID 00874" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ Code Seite CPGID 00874 (TXT), IBM
- ^ "Converter Explorer: IBM-874_P100-1995". Internationale Komponenten für Unicode. Unicode -Konsortium.
- ^ "Code Seite 01161" (PDF).
- ^ "CCSID 1161 Informationsdokument". Archiviert von das Original am 2016-03-27.
- ^ "Code Seite 1162 Informationsdokument". Archiviert von das Original Am 2016-03-17.
- ^ "CCSID 1162 Informationsdokument". Archiviert von das Original am 2016-03-27.
- ^ "Code Seite 01162" (PDF).
- ^ Steele, Shawn (1998-02-28). "CP874 zu Unicode Tabelle". Unicode -Konsortium, Microsoft.
- ^ Code Seite CPGID 01162 (TXT), IBM
- ^ Internationale Komponenten für Unicode (ICU), IBM-1162_P100-1999.UCM, 2002-12-03
- ^ Apfel (2005-04-05). "Karte (externe Version) vom Mac OS Thai -Zeichen auf Unicode 3.2 und später". Unicode -Konsortium.
Externe Links
- ISO/IEC 8859-11: 2001
- ISO/IEC 8859-11: 1999 -8-Bit-Single-Byte-codierte grafische Zeichensätze, Teil 11: Latein/Thai-Zeichensatz (Entwurf vom 22. Juni 1999; ersetzt von ISO/IEC 8859-11: 2001, veröffentlicht am 15. Dezember 2001)
- Windows -Code Seite 874
- ISO-IR 166 Thai -Charakter -Set (13. Juli 1992 aus Thai Standard TIS 620-2533 (1990))
- Standardisierung und Implementierung der thailändischen Sprache PDF 175K