VISCII
Mime / Iana | Viscii |
---|---|
Sprachen) | Vietnamesisch, Englisch |
Erstellt von | Viet-STD-Gruppe |
Definitionen | RFC 1456 |
Einstufung | 8 Bit SBCS |
Bezogen auf | ASCII |
Viscii ist ein inoffiziell definierter modifizierter modifizierter ASCII Zeichenkodierung zum Verwenden der vietnamesischen Sprache mit Computern. Es sollte nicht mit dem ähnlich benannten offiziell registrierten verwechselt werden Vscii Codierung. Viscii hält die 95 druckbaren Zeichen von ASCII unmodifiziert, ersetzt jedoch 6 der 33 Steuerzeichen durch druckbare Zeichen. Es fügt 128 hinzu Vorkomponierte Zeichen. Unicode und die Windows-1258 Die Code -Seite wird jetzt für praktisch alle vietnamesischen Computerdaten verwendet, aber Legacy VSCII- und VISCII -Dateien müssen möglicherweise konvertiert werden.
Geschichte und Benennung
Viscii wurde von der vietnamesischen Arbeitsgruppe (Viet-STD Group) entworfen[1] Unter der Leitung von Christopher Cuong T. Nguyen, Cuong M. Bui und Hoc D. Ngo mit Sitz in Silicon ValleyKalifornien im Jahr 1992, während sie mit dem Unicode-Konsortium zusammenarbeiteten, um vor komponierte vietnamesische Charaktere in den Unicode-Standard aufzunehmen. Viscii zusammen mit Viqr, wurde erstmals in einem zweisprachigen Bericht im September 1992 veröffentlicht, in dem es als "vietnamesischer Standardcode für Informationsaustausch" bezeichnet wurde.[2] In dem Bericht wurde eine Verbreitung der Computerverbrauch in Vietnam und das zunehmende Volumen der computergestützten Kommunikation zwischen Vietnamesen im Ausland festgestellt, dass vorhandene Anwendungen anhand von Lieferanten-spezifische Codierungen verwendeten, die nicht miteinander zusammenarbeiten konnten, und diese Standardisierung Zwischen Anbietern war daher notwendig. Die erfolgreiche Einbeziehung von komponierten und vorkomponierten Vietnamesen in Unicode 1.0 war das Ergebnis der Lehren aus der Entwicklung von 8-Bit-Viscii und 7-Bit-Viqr.[2]
Im nächsten Jahr, 1993, verabschiedete Vietnam TCVN 5712, sein erster nationaler Standard in der Informationstechnologie Domain.[3] Dies definierte eine Zeichenkodierung namens Vscii, die von der entwickelt worden waren Tcvn Technischer Ausschuss für Informationstechnologie (TCVN/TC1) und mit seinem Namen für den "vietnamesischen Standardcode für Informationsaustausch".[3] VSCII ist unvereinbar mit dem früher veröffentlichten Viscii und ansonsten nicht zu tun.[4] Im Gegensatz zu Viscii ist VSCII ein "vietnamesischer Standard" im Sinne von a Nationaler Standard.
Viscii und Viqr wurden als Informationsstatus genehmigt RFC 1456, der Viet-STD-Gruppe zugeschrieben und vom Mai 1993. Wie bei IETF RFCS, stellt RFC 1456 fest Usenetund dass es "kein Standardniveau angibt". Trotzdem nennt es weiterhin Viscii den "vietnamesischen Standardcode für Informationsaustausch" (der gleiche Name von VSCII).[5] Die Etiketten Viscii
und csviscii
sind mit dem registriert Iana Für Viscii unter Bezugnahme auf RFC 1456.[6] (Andererseits gibt es kein offizielles IANA -Label für TCVN 5712 / VSCII, obwohl x-viet-tcvn5712
wurde zuvor von unterstützt von Mozilla Firefox.[7]))
Entwurf
Ein traditionelles erweiterte ASCII Das Zeichensatz besteht aus dem ASCII -Set plus bis zu 128 Zeichen. Vietnamesisch benötigt 134 zusätzliche Buchstaben-diakritische Kombinationen, die sechs zu viele sind. Es gibt (kurz vor der Ablagerung der Tonmarke Unterstützung für Großbuchstaben, wie in VSCII-3) Im Wesentlichen vier verschiedene Möglichkeiten, um mit diesem Problem umzugehen:
- Verwenden Codierung der variablen Breite (ebenso wie UTF-8)
- Enthalten Kombination diakritischer Markierungen für Tonmarken (wie auch das VSCII-2 und Windows-1258) oder für Diakritika im Allgemeinen (wie auch Ansel und Vni)
- Ersetzen Sie eine ASCII -Interpunktion, vorzugsweise eine Interpunktion ISO 646 (ebenso wie VNI für dos)
- Ersetzen Sie mindestens sechs der Basis -ASCII Steuerzeichen (wie auch das VPS und VSCII-1)
Viscii ging für die letzte Option und ersetzte sechs der am wenigsten problematisch (z. B. am wenigsten, die von einer Anwendung anerkannt und speziell eingestellt wurden) C0 -Steuercodes (STX, ENQ, ACK, DC4, EM und RS) mit sechs der am wenigsten verwendeten Großbuchstaben-diacritischen Kombinationen.[2] Diese Option kann jedoch Programme verursachen, die diese Steuercodes bei der Behandlung von Viscii-Text zu Fehlfunktionen führen, aber weniger Komplikationen als die beiden anderen Optionen erzeugt (die Designer stellen fest, dass nicht8-Bit sauber Es wurde festgestellt, dass die Übertragung in der Praxis mehr Schwierigkeiten hat als die Wiederverwendung des Kontrollcharakters).[2] Dennoch haben Standorte von C0- oder C1 -Steuerzeichen und der für die verwendeten Codes Nicht bahnbrechender Raum in ISO-8859-1, Mac OS Roman und Oem-us wurden absichtlich Großbuchstaben zugeordnet, mit der Absicht, Kleinbuchstaben mit einer All-Capital-Schriftart zu verwenden, wenn grafische Zeichen für diese Codes nicht angezeigt werden konnten.[2]
Verwenden Sie jedoch alle erweiterten Codepunkte Für akzentuierte Buchstaben ließen sie keinen Raum, um nützliche Symbole, überschriften Nummern, gekrümmte Zitate, ordnungsgemäße Striche usw. hinzuzufügen, wie die meisten anderen erweiterten ASCII -Zeichensätze.
Die Lage der Charaktere folgt absichtlich hauptsächlich ISO-8859-1 wo sich zwischen den beiden Codeseiten (dem Großbuchstaben Õ als Ausnahme festgestellt werden), motiviert durch Bedenken hinsichtlich der Freundlichkeit von Nutzern.[2]
Die Unterstützung
Viscii wird teilweise von der unterstützt Trichlor -Softwaregruppe In Kalifornien, das verschiedene viscii-konforme Softwarepakete, Bibliotheken und Schriftarten für MS-DOS und Windows, Unix und Macintosh veröffentlicht hat. Viscii-konforme Software ist bei vielen verfügbar FTP -Websites.
Viscii wurde historisch als Codierung für ausgeschlossene Kodierung angeboten Email durch Mozilla Thunderbird. Es wurde auch von der von Christopher Cuong T. Nguyen erstellten Windows Vietnamesischen Keyboard -Software Winvnkey unterstützt und später durch verschiedene Windows -Versionen von Hoc D. NGO und anderen aufgerüstet.[8]
Viscii wurde hauptsächlich von vietnamesischen Sprechern in Übersee verwendet, mit Vscii (TCVN) in Nordvietnam und in Nordvietnam beliebter sein und Vni In Südvietnam beliebter sein.[9]
Zeichensatz
Viscii | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Soh | Ẳ 1EB2 | ETX | Eot | Ẵ 1EB4 | Ẫ 1eaa | Bel | BS | Ht | Lf | Vt | Ff | Cr | ALSO | Si |
1x | Dle | DC1 | DC2 | DC3 | Ỷ 1ef6 | Nak | Syn | ETB | KANN | Ỹ 1ef8 | Sub | ESC | Fs | Gs | Ỵ 1ef4 | UNS |
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | Del |
8x | Ạ 1ea0 | Ắ 1eeae | Ằ 1eb0 | Ặ 1eb6 | Ấ 1ea4 | Ầ 1ea6 | Ẩ 1ea8 | Ậ 1EAC | Ẽ 1EBC | Ẹ 1EB8 | Ế 1eebe | Ề 1ec0 | Ể 1ec2 | Ễ 1ec4 | Ệ 1ec6 | Ố 1ed0 |
9x | Ồ 1ed2 | Ổ 1ed4 | Ỗ 1ed6 | Ộ 1ed8 | Ợ 1ee2 | Ớ 1eda | Ờ 1edc | Ở 1de | Ị 1eca | Ỏ 1ece | Ọ 1ECC | Ỉ 1ec8 | Ủ 1ee6 | Ũ 0168 | Ụ 1ee4 | Ỳ 1ef2 |
Axt | Õ 00d5 | ắ 1AF | ằ 1eb1 | ặ 1eb7 | ấ 1ea5 | ầ 1ea7 | ẩ 1ea9 | ậ 1ad | ẽ 1EBD | ẹ 1eb9 | ế 1EBF | ề 1ec1 | ể 1ec3 | ễ 1ec5 | ệ 1ec7 | ố 1ed1 |
BX | ồ 1ed3 | ổ 1ed5 | ỗ 1ed7 | Ỡ 1ee0 | Ơ 01a0 | ộ 1ed9 | ờ 1edd | ở 1edf | ị 1ECB | Ự 1ef0 | Ứ 1ee8 | Ừ 1eea | Ử 1ec | ơ 01a1 | ớ 1edb | Ư 01af |
CX | À | Á | Â | Ã | Ả 1ea2 | Ă 0102 | ẳ 1eb3 | ẵ 1EB5 | È | É | Ê | Ẻ 1Eeba | Ì | Í | Ĩ 0128 | ỳ 1ef3 |
Dx | Đ 0110 | ứ 1ee9 | Ò | Ó | Ô | ạ 1ea1 | ỷ 1ef7 | ừ 1eeb | ử 1eed | Ù | Ú | ỹ 1ef9 | ỵ 1ef5 | Ý | ỡ 1ee1 | ư 01b0 |
Ex | à | á | â | ã | ả 1ea3 | ă 0103 | ữ 1eef | ẫ 1Eav | è | é | ê | ẻ 1ebb | ì | í | ĩ 0129 | ỉ 1ec9 |
Fx | đ 0111 | ự 1ef1 | ò | ó | ô | õ | ỏ 1ecf | ọ 1ecd | ụ 1ee5 | ù | ú | ũ 0169 | ủ 1ee7 | ý | ợ 1ee3 | Ữ 1eee |
Siehe auch
- ASCII
- Vietnamesisch zitiertes lesbar (Viqr)
- Vietnamesischer Standardcode für den Informationsaustausch (VSCII)
- Windows-1258
Verweise
- ^ Phung, Quang; NGO, hoc d.; Bui, Cuong. "Vietnamese-Standard-Arbeitsgruppe Homepage". Viet-STD-Gruppe. Abgerufen 2019-08-23.
- ^ a b c d e f Vietnamesische Charakter -Codierungs -Standardisierungsbericht - VISCII und VIQR 1.1 Charaktercodierungsspezifikationen (Technischer Bericht). Viet-STD-Gruppe. 1992.
- ^ a b "[Nachrichten] TCVN 5712: 1993 (VSCII) - Vietnamesischer Nationalstandard". 1993-06-02. Archiviert von das Original Am 2017-01-11.
- ^ Lunde, Ken (13. Januar 2009). "Kapitel 1: CJKV -Informationsverarbeitungsübersicht (§ sind viscii und vscii identisch? Was ist mit TCVN?)". CJKV -Informationsverarbeitung (2. Aufl.). p. 17. ISBN 978-0-596-51447-1.
- ^ Vietnamesische Standardisierung Arbeitsgruppe (Mai 1993). Konventionen zur Kodierung der vietnamesischen Sprache. Ietf. doi:10.17487/rfc1456. RFC 1456.
- ^ "Charaktersätze". Iana.
- ^ Sivonen, Henri (2014-09-26). "Änderungen der Charaktercodierung in M-C erfordern eine C-C-Aktion". Mozilla.dev.Apps.Thunderbird.
- ^ Sivonen, Henri (2014-09-26). "Änderungen der Charaktercodierung in M-C erfordern eine C-C-Aktion". Mozilla.dev.Apps.Thunderbird.
Viscii und Armscii-8 sind in dem Sinne besonders, dass Thunderbird selbst (fehlgeleitet) diese Codierungen in der Benutzeroberfläche für die Auswahl der ausgehenden Charaktercodierung beim Komponieren einer Nachricht bereitstellte. Daher ist es möglich, dass es ein Thunderbird-Erbe von Viscii- und Armscii-8-E-Mail- und Usenet-Posts gibt.
- ^ NGO, hoc dinh; Tran, Tubinh. "5. Warum vietnamesische Charset (Character Set - Codierung) Umwandlung?". Einige besondere Funktionen von Winvnkey.
Weitere Lektüre
- Flohr, Guido (2016) [2006]. "Gebietsschale :: Recodedata :: Viscii - Konvertierungsroutinen für Viscii". CPAN libintl-perl. Archiviert vom Original am 2017-01-14. Abgerufen 2017-01-14.
- https://www.math.nmsu.edu/~mleiser/software/csets/viscii.txt
Externe Links
- RFC1456 - Konventionen zur Kodierung der vietnamesischen Sprache
- Vietnamesische Arbeitsgruppe Mit Sitz in Kalifornien
- Viet-STD-Bericht 1992
- Angiang -Software
- Viscii-konforme Software und Schriftarten für MS-DOS und Windows
- Viscii-konforme Software, Bibliotheken und Schriftarten für UNIX
- Winvnkey, Vietnamesischer Tastaturfahrer für Windows, die multinationale Zeichensets unterstützen, einschließlich viscii
- MacVnkey, Viscii-konforme Tastaturtreiber für Macintosh Classic