VISCII

Viscii
Mime / Iana Viscii
Sprachen) Vietnamesisch, Englisch
Erstellt von Viet-STD-Gruppe
Definitionen RFC 1456
Einstufung 8 Bit SBCS
Bezogen auf ASCII

Viscii ist ein inoffiziell definierter modifizierter modifizierter ASCII Zeichenkodierung zum Verwenden der vietnamesischen Sprache mit Computern. Es sollte nicht mit dem ähnlich benannten offiziell registrierten verwechselt werden Vscii Codierung. Viscii hält die 95 druckbaren Zeichen von ASCII unmodifiziert, ersetzt jedoch 6 der 33 Steuerzeichen durch druckbare Zeichen. Es fügt 128 hinzu Vorkomponierte Zeichen. Unicode und die Windows-1258 Die Code -Seite wird jetzt für praktisch alle vietnamesischen Computerdaten verwendet, aber Legacy VSCII- und VISCII -Dateien müssen möglicherweise konvertiert werden.

Geschichte und Benennung

Viscii wurde von der vietnamesischen Arbeitsgruppe (Viet-STD Group) entworfen[1] Unter der Leitung von Christopher Cuong T. Nguyen, Cuong M. Bui und Hoc D. Ngo mit Sitz in Silicon ValleyKalifornien im Jahr 1992, während sie mit dem Unicode-Konsortium zusammenarbeiteten, um vor komponierte vietnamesische Charaktere in den Unicode-Standard aufzunehmen. Viscii zusammen mit Viqr, wurde erstmals in einem zweisprachigen Bericht im September 1992 veröffentlicht, in dem es als "vietnamesischer Standardcode für Informationsaustausch" bezeichnet wurde.[2] In dem Bericht wurde eine Verbreitung der Computerverbrauch in Vietnam und das zunehmende Volumen der computergestützten Kommunikation zwischen Vietnamesen im Ausland festgestellt, dass vorhandene Anwendungen anhand von Lieferanten-spezifische Codierungen verwendeten, die nicht miteinander zusammenarbeiten konnten, und diese Standardisierung Zwischen Anbietern war daher notwendig. Die erfolgreiche Einbeziehung von komponierten und vorkomponierten Vietnamesen in Unicode 1.0 war das Ergebnis der Lehren aus der Entwicklung von 8-Bit-Viscii und 7-Bit-Viqr.[2]

Im nächsten Jahr, 1993, verabschiedete Vietnam TCVN 5712, sein erster nationaler Standard in der Informationstechnologie Domain.[3] Dies definierte eine Zeichenkodierung namens Vscii, die von der entwickelt worden waren Tcvn Technischer Ausschuss für Informationstechnologie (TCVN/TC1) und mit seinem Namen für den "vietnamesischen Standardcode für Informationsaustausch".[3] VSCII ist unvereinbar mit dem früher veröffentlichten Viscii und ansonsten nicht zu tun.[4] Im Gegensatz zu Viscii ist VSCII ein "vietnamesischer Standard" im Sinne von a Nationaler Standard.

Viscii und Viqr wurden als Informationsstatus genehmigt RFC 1456, der Viet-STD-Gruppe zugeschrieben und vom Mai 1993. Wie bei IETF RFCS, stellt RFC 1456 fest Usenetund dass es "kein Standardniveau angibt". Trotzdem nennt es weiterhin Viscii den "vietnamesischen Standardcode für Informationsaustausch" (der gleiche Name von VSCII).[5] Die Etiketten Viscii und csviscii sind mit dem registriert Iana Für Viscii unter Bezugnahme auf RFC 1456.[6] (Andererseits gibt es kein offizielles IANA -Label für TCVN 5712 / VSCII, obwohl x-viet-tcvn5712 wurde zuvor von unterstützt von Mozilla Firefox.[7]))

Entwurf

Ein traditionelles erweiterte ASCII Das Zeichensatz besteht aus dem ASCII -Set plus bis zu 128 Zeichen. Vietnamesisch benötigt 134 zusätzliche Buchstaben-diakritische Kombinationen, die sechs zu viele sind. Es gibt (kurz vor der Ablagerung der Tonmarke Unterstützung für Großbuchstaben, wie in VSCII-3) Im Wesentlichen vier verschiedene Möglichkeiten, um mit diesem Problem umzugehen:

  1. Verwenden Codierung der variablen Breite (ebenso wie UTF-8)
  2. Enthalten Kombination diakritischer Markierungen für Tonmarken (wie auch das VSCII-2 und Windows-1258) oder für Diakritika im Allgemeinen (wie auch Ansel und Vni)
  3. Ersetzen Sie eine ASCII -Interpunktion, vorzugsweise eine Interpunktion ISO 646 (ebenso wie VNI für dos)
  4. Ersetzen Sie mindestens sechs der Basis -ASCII Steuerzeichen (wie auch das VPS und VSCII-1)

Viscii ging für die letzte Option und ersetzte sechs der am wenigsten problematisch (z. B. am wenigsten, die von einer Anwendung anerkannt und speziell eingestellt wurden) C0 -Steuercodes (STX, ENQ, ACK, DC4, EM und RS) mit sechs der am wenigsten verwendeten Großbuchstaben-diacritischen Kombinationen.[2] Diese Option kann jedoch Programme verursachen, die diese Steuercodes bei der Behandlung von Viscii-Text zu Fehlfunktionen führen, aber weniger Komplikationen als die beiden anderen Optionen erzeugt (die Designer stellen fest, dass nicht8-Bit sauber Es wurde festgestellt, dass die Übertragung in der Praxis mehr Schwierigkeiten hat als die Wiederverwendung des Kontrollcharakters).[2] Dennoch haben Standorte von C0- oder C1 -Steuerzeichen und der für die verwendeten Codes Nicht bahnbrechender Raum in ISO-8859-1, Mac OS Roman und Oem-us wurden absichtlich Großbuchstaben zugeordnet, mit der Absicht, Kleinbuchstaben mit einer All-Capital-Schriftart zu verwenden, wenn grafische Zeichen für diese Codes nicht angezeigt werden konnten.[2]

Verwenden Sie jedoch alle erweiterten Codepunkte Für akzentuierte Buchstaben ließen sie keinen Raum, um nützliche Symbole, überschriften Nummern, gekrümmte Zitate, ordnungsgemäße Striche usw. hinzuzufügen, wie die meisten anderen erweiterten ASCII -Zeichensätze.

Die Lage der Charaktere folgt absichtlich hauptsächlich ISO-8859-1 wo sich zwischen den beiden Codeseiten (dem Großbuchstaben Õ als Ausnahme festgestellt werden), motiviert durch Bedenken hinsichtlich der Freundlichkeit von Nutzern.[2]

Die Unterstützung

Viscii wird teilweise von der unterstützt Trichlor -Softwaregruppe In Kalifornien, das verschiedene viscii-konforme Softwarepakete, Bibliotheken und Schriftarten für MS-DOS und Windows, Unix und Macintosh veröffentlicht hat. Viscii-konforme Software ist bei vielen verfügbar FTP -Websites.

Viscii wurde historisch als Codierung für ausgeschlossene Kodierung angeboten Email durch Mozilla Thunderbird. Es wurde auch von der von Christopher Cuong T. Nguyen erstellten Windows Vietnamesischen Keyboard -Software Winvnkey unterstützt und später durch verschiedene Windows -Versionen von Hoc D. NGO und anderen aufgerüstet.[8]

Viscii wurde hauptsächlich von vietnamesischen Sprechern in Übersee verwendet, mit Vscii (TCVN) in Nordvietnam und in Nordvietnam beliebter sein und Vni In Südvietnam beliebter sein.[9]

Zeichensatz

Viscii
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x Nul Soh
1EB2
ETX Eot
1EB4

1eaa
Bel BS Ht Lf Vt Ff Cr ALSO Si
1x Dle DC1 DC2 DC3
1ef6
Nak Syn ETB KANN
1ef8
Sub ESC Fs Gs
1ef4
UNS
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ Del
8x
1ea0

1eeae

1eb0

1eb6

1ea4

1ea6

1ea8

1EAC

1EBC

1EB8

1eebe

1ec0

1ec2

1ec4

1ec6

1ed0
9x
1ed2

1ed4

1ed6

1ed8

1ee2

1eda

1edc

1de

1eca

1ece

1ECC

1ec8

1ee6
Ũ
0168

1ee4

1ef2
Axt Õ
00d5

1AF

1eb1

1eb7

1ea5

1ea7

1ea9

1ad

1EBD

1eb9
ế
1EBF

1ec1

1ec3

1ec5

1ec7

1ed1
BX
1ed3

1ed5

1ed7

1ee0
Ơ
01a0

1ed9

1edd

1edf

1ECB

1ef0

1ee8

1eea

1ec
ơ
01a1

1edb
Ư
01af
CX À Á Â Ã
1ea2
Ă
0102

1eb3

1EB5
È É Ê
1Eeba
Ì Í Ĩ
0128

1ef3
Dx Đ
0110

1ee9
Ò Ó Ô
1ea1

1ef7

1eeb

1eed
Ù Ú
1ef9

1ef5
Ý
1ee1
ư
01b0
Ex à á â ã
1ea3
ă
0103

1eef

1Eav
è é ê
1ebb
ì í ĩ
0129

1ec9
Fx đ
0111

1ef1
ò ó ô õ
1ecf

1ecd

1ee5
ù ú ũ
0169

1ee7
ý
1ee3

1eee
 Unterschiede aus ISO-8859-1

Siehe auch

Verweise

  1. ^ Phung, Quang; NGO, hoc d.; Bui, Cuong. "Vietnamese-Standard-Arbeitsgruppe Homepage". Viet-STD-Gruppe. Abgerufen 2019-08-23.
  2. ^ a b c d e f Vietnamesische Charakter -Codierungs -Standardisierungsbericht - VISCII und VIQR 1.1 Charaktercodierungsspezifikationen (Technischer Bericht). Viet-STD-Gruppe. 1992.
  3. ^ a b "[Nachrichten] TCVN 5712: 1993 (VSCII) - Vietnamesischer Nationalstandard". 1993-06-02. Archiviert von das Original Am 2017-01-11.
  4. ^ Lunde, Ken (13. Januar 2009). "Kapitel 1: CJKV -Informationsverarbeitungsübersicht (§ sind viscii und vscii identisch? Was ist mit TCVN?)". CJKV -Informationsverarbeitung (2. Aufl.). p. 17. ISBN 978-0-596-51447-1.
  5. ^ Vietnamesische Standardisierung Arbeitsgruppe (Mai 1993). Konventionen zur Kodierung der vietnamesischen Sprache. Ietf. doi:10.17487/rfc1456. RFC 1456.
  6. ^ "Charaktersätze". Iana.
  7. ^ Sivonen, Henri (2014-09-26). "Änderungen der Charaktercodierung in M-C erfordern eine C-C-Aktion". Mozilla.dev.Apps.Thunderbird.
  8. ^ Sivonen, Henri (2014-09-26). "Änderungen der Charaktercodierung in M-C erfordern eine C-C-Aktion". Mozilla.dev.Apps.Thunderbird. Viscii und Armscii-8 sind in dem Sinne besonders, dass Thunderbird selbst (fehlgeleitet) diese Codierungen in der Benutzeroberfläche für die Auswahl der ausgehenden Charaktercodierung beim Komponieren einer Nachricht bereitstellte. Daher ist es möglich, dass es ein Thunderbird-Erbe von Viscii- und Armscii-8-E-Mail- und Usenet-Posts gibt.
  9. ^ NGO, hoc dinh; Tran, Tubinh. "5. Warum vietnamesische Charset (Character Set - Codierung) Umwandlung?". Einige besondere Funktionen von Winvnkey.

Weitere Lektüre

Externe Links