Thai Industrial Standard 620-2533

Thai Industrial Standard 620-2533, allgemein bezeichnet als TIS-620, ist das häufigste Zeichensatz und Zeichenkodierung für die Thai Sprache. Der Standard wird vom Thai Industrial Standards Institute (TISI), einem Organ des Industrieministeriums unter der Royal Thai -Regierung, veröffentlicht und ist der einzige offizielle Standard für die Kodierung von Thai in Thailand.

Der deskriptive Name des Standards ist "Standard für thailändische Zeichencodes für Computer" (Thai: รหัส สำหรับ ไทย ไทย ที่ ใช้ กับ คอมพิวเตอร์). "2533" bezieht sich auf Jahr 2533 der Buddhistische Ära (1990), das Jahr, in dem die vorliegende Version des Standards veröffentlicht wurde; Eine frühere Überarbeitung, TIS 620-2529 (1986), ist jetzt veraltet. Das Code -Seitenlayout ist zwischen den beiden Ausgaben gleich.[1]

TIS-620 ist der Iana Bevorzugter Charset-Name für TIS-620, und dieser Charset-Name wird auch für verwendet ISO/IEC 8859-11 (Dies fügt bei 0xa0 einen Space-Charakter ohne Break hinzu, der in TIS-620 nicht zugewiesen ist). Wenn der IANA -Name verwendet wird, werden die Codes mit dem ergänzt C0- und C1 -Kontrollcodes aus ISO/IEC 6429.

Struktur

TIS-620 ist ein konventionell strukturiert Erweiterte ASCII Nationales Charakter-Set, das die volle Kompatibilität mit 7-Bit behält ASCII und verwendet den 8-Bit-Bereich HEX A1, um die zu codieren, um die zu codieren Thai Alphabet. Aufgrund des Komplexes, der die Natur von thailändischen Vokalen und Diakritikern kombiniert, ist TIS-620 nur zum Interchange für den Informationsaustausch vorgesehen, und eine zusätzliche Display-Engine ist erforderlich, um Zeichen korrekt zu komponieren.

Varianten

Eine nahezu identische Version von TIS-620 wurde als übernommen als ISO/IEC 8859-11 Im Jahr 2001 ist der einzige Unterschied, dass ISO/IEC 8859-11 HEX A0 als a definiert Nicht bahnbrechender Raum, während TIS-620 es undefiniert lässt, aber reserviert. (In der Praxis wird diese kleine Unterscheidung normalerweise ignoriert.)

Das ISO/IEC 8859-11-Set wurde ebenfalls als registriert als ISO-IR-166 durch ECMA InternationalAber diese Variation fügt explizite Fluchtcodes hinzu, um den Beginn und Ende der thailändischen Zeichensequenzen zu signalisieren.

Die TIS-620-Charakter-Set-Bestellung wurde im Wesentlichen verwendet, wie es sich befindet Unicode (ISO/IEC 10646) auch. Unicode Thai -Block ist u+0e01 über u+0e7f und TIS-620-thai-Zeichen können in konvertiert werden UTF-16 Einfach durch Präfix jedes Byte mit 0E und Subtrahieren von Hex A0 vom Wert.

Zeichensatz

TIS-620[2]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x
Axt
BX
CX
Dx ◌ ั ◌ ิ ◌ ี ◌ ึ ◌ ื ◌ ุ ◌ ู ◌ ฺ ฿
Ex ◌ ็ ◌ ่ ◌ ้ ◌ ๊ ◌ ๋ ◌ ์ ◌ ํ ◌ ๎
Fx

In der obigen Tabelle ist 20 der reguläre Weltraumcharakter. Die Codewerte 00-1F, 7F, 80-9F, A0, DB-de und FC-FF werden von TIS-620 nicht zugeordnet.

Codewerte D1, D4-da, E7-ee sind Charaktere kombinieren.

Weitere Lektüre

  • Flohr, Guido (2016) [2006]. "Lokale :: Recodedata :: TIS_620 - Konvertierungsroutinen für TIS -620". CPAN libintl-perl. 1.0. Archiviert vom Original am 2017-01-14. Abgerufen 2017-01-14.

Verweise

  1. ^ Meru, Ibrahim (1996-12-03). "Re: Thai -Codierungsstandards". Unicode Mail -Listenarchiv.
  2. ^ Leiser, Mark (1998-03-06), TCCII 2533 1009 / TIS 620 Thai, Tis620.txt

Externe Links