VSCII

Vscii
Alias ​​(e) x-viet-tcvn5712[1]
Sprachen) Vietnamesisch, Englisch
Erstellt von Tcvn/TC1
Standard TCVN 5712: 1993
Einstufung 8 Bit SBCS;
Erweiterte ASCII (VSCII-2/-3)

Vscii (Vietnamesischer Standardcode für den Informationsaustausch), auch bekannt als TCVN 5712,[2] ISO-IR-180,[3] .Vn,[4] ABC[4] oder einfach das TCVN -Kodierungen,[4][5] ist ein Satz von drei eng verwandten Vietnamesischer Nationalstandard Charaktercodierungen zum Verwenden der vietnamesischen Sprache mit Computern, entwickelt vom TCVN Technischen Komitee für Informationstechnologie (TCVN/TC1) und erstmals 1993 verabschiedet (als TCVN 5712: 1993).[2]

Es sollte nicht mit dem ähnlich benannten Inoffiziellen verwechselt werden Viscii Codierung, das manchmal von vietnamesischen Sprechern in Übersee verwendet wurde.[4] Viscii sollte auch für stehen Vietnamesischer Standardcode für den Informationsaustausch, ist aber nicht mit VSCII verwandt.[6]

VSCII (TCVN) wurde im Norden von Vietnam ausgiebig verwendet Vni war im Süden beliebt.[4] Unicode und die Windows-1258 Die Code -Seite wird jetzt für praktisch alle vietnamesischen Computerdaten verwendet, aber Legacy -Dateien oder archivierte Nachrichten müssen möglicherweise konvertiert werden.

Codierungen

Alle drei Formen von VSCII halten die 95 druckbaren Zeichen von ASCII unverändert.

VSCII-3, auch bekannt als TCVN 5712-3, VN3 oder einfach TCVN3,[7] Enthält die wenigsten Aufgaben. Es ist ein erweiterte ASCII, weil es alle 128 Codes von ASCII unmodifiziert hält. Es gibt keine der von der zugute C0- und C1 -Kontrollcodes. Verglichen mit ASCIIEs fügt 75 Zeichen hinzu:

Die Tonmarken an Großbuchstaben werden in TCVN3 durch Wechsel zu einer All-Capital-Schriftart erreicht.[8]

VSCII-2Auch als TCVN 5712-2 und VN2 bekannt, ist ein Superet von VSCII-3. Es ist ein erweiterte ASCII, weil es alle 128 Codes von ASCII unmodifiziert hält. Es gibt keine der von der zugute C0- und C1 -Kontrollcodes, damit es entspricht mit ISO 2022 als 96-set.[2][3] Im Vergleich zu VSCII-3 fügt es hinzu (für insgesamt 96 Nicht-ASCII-Zeichen):

  • 16 Weitere Großbuchstaben mit vorgefertigten Tonmarken (für insgesamt 23 Nicht-ASCII-Großbuchstaben)
  • 5 Diakritik kombinieren zum Tonmarken, damit andere Kombinationen von Großbuchstaben und Tonmarken dargestellt werden können. Kombinieren Sie Markierungen folgen dem Basisbuchstaben[2] wie in Vni (anstatt sie vorzugehen wie in Ansel).

VSCII-1, auch bekannt als TCVN 5712-1 und VN1, ist eine Erweiterung von VSCII-2 und ist ein modifiziertes ASCII, da es 12 der 33 ersetzt Steuerzeichen mit vorkomponierten Zeichen. Im Vergleich zu VSCII-2 (für insgesamt 140 Nicht-ASCII-Zeichen):

  • Fügt 44 weitere vorgefertigte Großbuchstaben hinzu und bringt sie in die gleiche Anzahl wie der Kleinbuchstaben
  • Tut dies durch Ersetzen von 12 ASCII -Steuerzeichen und die Zuweisung von 32 grafischen Zeichen für den C1 -Steuerbereich, wodurch die Kompatibilität von ISO 2022 gebrochen wird

Die Konvertierung von VSCII-3 auf VSCII-2 oder VSCII-1 und die Konvertierung von VSCII-2 nach VSCII-1 ist nicht erforderlich, kann jedoch zu kleineren Dateien führen.

Die Konvertierung von VSCII-1 in VSCII-2 oder VSCII-3 und die Konvertierung von VSCII-2 zu VSCII-3 erfordern eine Ausdehnung einiger vorkomponierter Zeichen.

Zeichensatz

VSCII-1[2]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x Nul Ú
00da

1ee4
ETX
1eea

1ec

1eee
Bel BS Ht Lf Vt Ff Cr ALSO Si
1x Dle
1ee8

1ef0

1ef2

1ef6

1ef8
Ý
00dd

1ef4
KANN Em Sub ESC Fs Gs Rs UNS
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ Del
8x À
00C0

1ea2
Ã
00c3
Á
00c1

1ea0

1eb6

1EAC
È
00C8

1Eeba

1EBC
É
00C9

1EB8

1ec6
Ì
00cc

1ec8
Ĩ
0128
9x Í
00CD

1eca
Ò
00d2

1ece
Õ
00d5
Ó
00d3

1ECC

1ed8

1edc

1de

1ee0

1eda

1ee2
Ù
00d9

1ee6
Ũ
0168
Axt NBSP Ă
0102
Â
00C2
Ê
00ca
Ô
00D4
Ơ
01a0
Ư
01af
Đ
0110
ă
0103
â
00e2
ê
00ea
ô
00F4
ơ
01a1
ư
01b0
đ
0111

1eb0
BX ◌̀
0300
◌̉
0309
◌̃
0303
◌́
0301
◌̣
0323
à
00e0

1ea3
ã
00e3
á
00e1

1ea1

1EB2

1eb1

1eb3

1EB5

1AF

1EB4
CX
1eeae

1ea6

1ea8

1eaa

1ea4

1ec0

1eb7

1ea7

1ea9

1Eav

1ea5

1ad
è
00e8

1ec2

1ebb

1EBD
Dx é
00E9

1eb9

1ec1

1ec3

1ec5
ế
1EBF

1ec7
ì
00ec

1ec9

1ec4

1eebe

1ed2
ĩ
0129
í
00ed

1ECB
ò
00F2
Ex
1ed4

1ecf
õ
00F5
ó
00F3

1ecd

1ed3

1ed5

1ed7

1ed1

1ed9

1edd

1edf

1ee1

1edb

1ee3
ù
00f9
Fx
1ed6

1ee7
ũ
0169
ú
00fa

1ee5

1eeb

1eed

1eef

1ee9

1ef1

1ef3

1ef7

1ef9
ý
1ef5

1ed0
 VSCII-3
 Ergänzungen für VSCII-2
 Ergänzungen für VSCII-1[9]

Verweise

  1. ^ Sivonen, Henri (2014-09-26). "Änderungen der Charaktercodierung in M-C erfordern eine C-C-Aktion". Mozilla.dev.Apps.Thunderbird.
  2. ^ a b c d e "[Nachrichten] TCVN 5712: 1993 (VSCII) - Vietnamesischer Nationalstandard". 1993-06-02. Archiviert von das Original Am 2017-01-11.
  3. ^ a b Tcvn (1993). ISO-IR-180: Rechtsteil der VSCII-2-Code-Tabelle (PDF). Itcj/Ipsj.
  4. ^ a b c d e NGO, hoc dinh; Tran, Tubinh. "5. Warum vietnamesische Charset (Character Set - Codierung) Umwandlung?". Einige besondere Funktionen von Winvnkey.
  5. ^ Nguyen, Minh T. "Vietnamesische Konvertierungen (Vietnet/Viqr, VNI, VPS, Viscii, VNU, TCVN, Vietware, Unicode)".
  6. ^ Lunde, Ken (13. Januar 2009). "Kapitel 1: CJKV -Informationsverarbeitungsübersicht (§ sind viscii und vscii identisch? Was ist mit TCVN?)". CJKV -Informationsverarbeitung (2. Aufl.). p. 17. ISBN 978-0-596-51447-1.
  7. ^ "Unicode & Vietnamesische Legacy Character Codings". Vietnamesische Unicode -FAQs.
  8. ^ "Unicode & Vietnamesische Legacy Character Codings". Vietnamesische Unicode -FAQs. TCVN3 ist nicht doppelter Byte, aber aufgrund der Art der Codierung werden Großbuchstaben (Vokale) einer separaten Kapitalschrift, die dem normalen Kleinbuchstaben ähnelt.
  9. ^ Lunde, Ken (13. Januar 2009). "Anhang L: Vietnamesische Charakter -Sets" (PDF). CJKV -Informationsverarbeitung (2. Aufl.). ISBN 978-0-596-51447-1.

Externe Links