VSCII
Alias (e) | x-viet-tcvn5712 [1] |
---|---|
Sprachen) | Vietnamesisch, Englisch |
Erstellt von | Tcvn/TC1 |
Standard | TCVN 5712: 1993 |
Einstufung | 8 Bit SBCS; Erweiterte ASCII (VSCII-2/-3) |
Vscii (Vietnamesischer Standardcode für den Informationsaustausch), auch bekannt als TCVN 5712,[2] ISO-IR-180,[3] .Vn,[4] ABC[4] oder einfach das TCVN -Kodierungen,[4][5] ist ein Satz von drei eng verwandten Vietnamesischer Nationalstandard Charaktercodierungen zum Verwenden der vietnamesischen Sprache mit Computern, entwickelt vom TCVN Technischen Komitee für Informationstechnologie (TCVN/TC1) und erstmals 1993 verabschiedet (als TCVN 5712: 1993).[2]
Es sollte nicht mit dem ähnlich benannten Inoffiziellen verwechselt werden Viscii Codierung, das manchmal von vietnamesischen Sprechern in Übersee verwendet wurde.[4] Viscii sollte auch für stehen Vietnamesischer Standardcode für den Informationsaustausch, ist aber nicht mit VSCII verwandt.[6]
VSCII (TCVN) wurde im Norden von Vietnam ausgiebig verwendet Vni war im Süden beliebt.[4] Unicode und die Windows-1258 Die Code -Seite wird jetzt für praktisch alle vietnamesischen Computerdaten verwendet, aber Legacy -Dateien oder archivierte Nachrichten müssen möglicherweise konvertiert werden.
Codierungen
Alle drei Formen von VSCII halten die 95 druckbaren Zeichen von ASCII unverändert.
VSCII-3, auch bekannt als TCVN 5712-3, VN3 oder einfach TCVN3,[7] Enthält die wenigsten Aufgaben. Es ist ein erweiterte ASCII, weil es alle 128 Codes von ASCII unmodifiziert hält. Es gibt keine der von der zugute C0- und C1 -Kontrollcodes. Verglichen mit ASCIIEs fügt 75 Zeichen hinzu:
- 67 Kleinbuchstaben, sodass die Unterstützung in der Vollkasse ausreichend ist.
- 7 Großbuchstaben, die Großbuchstaben für die ermöglichen 29 Basisbuchstaben ohne Tonmarken.
- Das Nicht bahnbrechender Raum.
Die Tonmarken an Großbuchstaben werden in TCVN3 durch Wechsel zu einer All-Capital-Schriftart erreicht.[8]
VSCII-2Auch als TCVN 5712-2 und VN2 bekannt, ist ein Superet von VSCII-3. Es ist ein erweiterte ASCII, weil es alle 128 Codes von ASCII unmodifiziert hält. Es gibt keine der von der zugute C0- und C1 -Kontrollcodes, damit es entspricht mit ISO 2022 als 96-set.[2][3] Im Vergleich zu VSCII-3 fügt es hinzu (für insgesamt 96 Nicht-ASCII-Zeichen):
- 16 Weitere Großbuchstaben mit vorgefertigten Tonmarken (für insgesamt 23 Nicht-ASCII-Großbuchstaben)
- 5 Diakritik kombinieren zum Tonmarken, damit andere Kombinationen von Großbuchstaben und Tonmarken dargestellt werden können. Kombinieren Sie Markierungen folgen dem Basisbuchstaben[2] wie in Vni (anstatt sie vorzugehen wie in Ansel).
VSCII-1, auch bekannt als TCVN 5712-1 und VN1, ist eine Erweiterung von VSCII-2 und ist ein modifiziertes ASCII, da es 12 der 33 ersetzt Steuerzeichen mit vorkomponierten Zeichen. Im Vergleich zu VSCII-2 (für insgesamt 140 Nicht-ASCII-Zeichen):
- Fügt 44 weitere vorgefertigte Großbuchstaben hinzu und bringt sie in die gleiche Anzahl wie der Kleinbuchstaben
- Tut dies durch Ersetzen von 12 ASCII -Steuerzeichen und die Zuweisung von 32 grafischen Zeichen für den C1 -Steuerbereich, wodurch die Kompatibilität von ISO 2022 gebrochen wird
Die Konvertierung von VSCII-3 auf VSCII-2 oder VSCII-1 und die Konvertierung von VSCII-2 nach VSCII-1 ist nicht erforderlich, kann jedoch zu kleineren Dateien führen.
Die Konvertierung von VSCII-1 in VSCII-2 oder VSCII-3 und die Konvertierung von VSCII-2 zu VSCII-3 erfordern eine Ausdehnung einiger vorkomponierter Zeichen.
Zeichensatz
VSCII-1[2] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Ú 00da | Ụ 1ee4 | ETX | Ừ 1eea | Ử 1ec | Ữ 1eee | Bel | BS | Ht | Lf | Vt | Ff | Cr | ALSO | Si |
1x | Dle | Ứ 1ee8 | Ự 1ef0 | Ỳ 1ef2 | Ỷ 1ef6 | Ỹ 1ef8 | Ý 00dd | Ỵ 1ef4 | KANN | Em | Sub | ESC | Fs | Gs | Rs | UNS |
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | Del |
8x | À 00C0 | Ả 1ea2 | Ã 00c3 | Á 00c1 | Ạ 1ea0 | Ặ 1eb6 | Ậ 1EAC | È 00C8 | Ẻ 1Eeba | Ẽ 1EBC | É 00C9 | Ẹ 1EB8 | Ệ 1ec6 | Ì 00cc | Ỉ 1ec8 | Ĩ 0128 |
9x | Í 00CD | Ị 1eca | Ò 00d2 | Ỏ 1ece | Õ 00d5 | Ó 00d3 | Ọ 1ECC | Ộ 1ed8 | Ờ 1edc | Ở 1de | Ỡ 1ee0 | Ớ 1eda | Ợ 1ee2 | Ù 00d9 | Ủ 1ee6 | Ũ 0168 |
Axt | NBSP | Ă 0102 | Â 00C2 | Ê 00ca | Ô 00D4 | Ơ 01a0 | Ư 01af | Đ 0110 | ă 0103 | â 00e2 | ê 00ea | ô 00F4 | ơ 01a1 | ư 01b0 | đ 0111 | Ằ 1eb0 |
BX | ◌̀ 0300 | ◌̉ 0309 | ◌̃ 0303 | ◌́ 0301 | ◌̣ 0323 | à 00e0 | ả 1ea3 | ã 00e3 | á 00e1 | ạ 1ea1 | Ẳ 1EB2 | ằ 1eb1 | ẳ 1eb3 | ẵ 1EB5 | ắ 1AF | Ẵ 1EB4 |
CX | Ắ 1eeae | Ầ 1ea6 | Ẩ 1ea8 | Ẫ 1eaa | Ấ 1ea4 | Ề 1ec0 | ặ 1eb7 | ầ 1ea7 | ẩ 1ea9 | ẫ 1Eav | ấ 1ea5 | ậ 1ad | è 00e8 | Ể 1ec2 | ẻ 1ebb | ẽ 1EBD |
Dx | é 00E9 | ẹ 1eb9 | ề 1ec1 | ể 1ec3 | ễ 1ec5 | ế 1EBF | ệ 1ec7 | ì 00ec | ỉ 1ec9 | Ễ 1ec4 | Ế 1eebe | Ồ 1ed2 | ĩ 0129 | í 00ed | ị 1ECB | ò 00F2 |
Ex | Ổ 1ed4 | ỏ 1ecf | õ 00F5 | ó 00F3 | ọ 1ecd | ồ 1ed3 | ổ 1ed5 | ỗ 1ed7 | ố 1ed1 | ộ 1ed9 | ờ 1edd | ở 1edf | ỡ 1ee1 | ớ 1edb | ợ 1ee3 | ù 00f9 |
Fx | Ỗ 1ed6 | ủ 1ee7 | ũ 0169 | ú 00fa | ụ 1ee5 | ừ 1eeb | ử 1eed | ữ 1eef | ứ 1ee9 | ự 1ef1 | ỳ 1ef3 | ỷ 1ef7 | ỹ 1ef9 | ý | ỵ 1ef5 | Ố 1ed0 |
Verweise
- ^ Sivonen, Henri (2014-09-26). "Änderungen der Charaktercodierung in M-C erfordern eine C-C-Aktion". Mozilla.dev.Apps.Thunderbird.
- ^ a b c d e "[Nachrichten] TCVN 5712: 1993 (VSCII) - Vietnamesischer Nationalstandard". 1993-06-02. Archiviert von das Original Am 2017-01-11.
- ^ a b Tcvn (1993). ISO-IR-180: Rechtsteil der VSCII-2-Code-Tabelle (PDF). Itcj/Ipsj.
- ^ a b c d e NGO, hoc dinh; Tran, Tubinh. "5. Warum vietnamesische Charset (Character Set - Codierung) Umwandlung?". Einige besondere Funktionen von Winvnkey.
- ^ Nguyen, Minh T. "Vietnamesische Konvertierungen (Vietnet/Viqr, VNI, VPS, Viscii, VNU, TCVN, Vietware, Unicode)".
- ^ Lunde, Ken (13. Januar 2009). "Kapitel 1: CJKV -Informationsverarbeitungsübersicht (§ sind viscii und vscii identisch? Was ist mit TCVN?)". CJKV -Informationsverarbeitung (2. Aufl.). p. 17. ISBN 978-0-596-51447-1.
- ^ "Unicode & Vietnamesische Legacy Character Codings". Vietnamesische Unicode -FAQs.
- ^ "Unicode & Vietnamesische Legacy Character Codings". Vietnamesische Unicode -FAQs.
TCVN3 ist nicht doppelter Byte, aber aufgrund der Art der Codierung werden Großbuchstaben (Vokale) einer separaten Kapitalschrift, die dem normalen Kleinbuchstaben ähnelt.
- ^ Lunde, Ken (13. Januar 2009). "Anhang L: Vietnamesische Charakter -Sets" (PDF). CJKV -Informationsverarbeitung (2. Aufl.). ISBN 978-0-596-51447-1.