JIS X 0212
Sprachen) | Beabsichtigt, neben Jis x 0208 zum japanisch Unterstützung. Unterstützt keine Sprache für sich. |
---|---|
Standard | JIS X 0212: 1990 |
Aktueller Status | Unihan Quelle. Codierter Zeichen setzen sich nicht so weit verbreitet wie Jis x 0208, aber manchmal verwendet in EUC-JP.[1] |
Einstufung | Ergänzungspunkt, Charset, ISO 2022, DBCs, CJK -Codierung |
Erweitert | Jis x 0208 wenn zusammen verwendet |
Codierungsformate | EUC-JP ISO-2022-JP-1 |
gefolgt von | Jis x 0213 |
Andere verwandte Kodierungen (en) | KS x 1002 |
Jis x 0212 ist ein Japanischer Industriestandard Definieren eines codierten Zeichensatzes für die codierenden Zusatzzeichen für die Verwendung auf Japanisch. Dieser Standard soll ergänzen Jis x 0208 (Code Seite 952). Es ist nummeriert 953 oder 5049 Als IBM -Code -Seite (siehe unten).
Es ist einer der Quellstandards für Unicode's CJK Unified Ideographs.
Geschichte
1990 die Japanische Standardvereinigung (JSA) Veröffentlicht einen ergänzenden Zeichensatz Standard: JIS x 0212-1990 Code des ergänzenden japanischen Grafikzeichens für den Informationsaustausch (情報交換用漢字符号-補助漢字, Jōhō Kōkan'yō Kanji Fugō - Hojo Kanji). Dieser Standard sollte auf dem Bereich der im Haupt erhältlichen Zeichen bauen Jis x 0208 Zeichensatz und Mängeln in der Berichterstattung dieses Satzes.
Merkmale
Der Standard spezifizierte 6.067 Zeichen, bestehend aus:
- 21 griechische Charaktere mit Diakritik
- 26 osteuropäische Charaktere mit Diakritik (meistens kyrillisch)
- 198 Alphabetische Charaktere mit Diakritik
- 5.801 Kanji
Codierungen
Die folgenden Codierungen oder Einkapselungen werden verwendet, um die Verwendung von JIS X 0212 -Zeichen in Dateien usw. zu ermöglichen.
- in EUC-JP Die Zeichen werden durch drei Bytes dargestellt, wobei der erste 0x8f ist, die folgenden zwei im Bereich 0xa1 - 0x.
- in bestimmten Implementierungen der ISO 2022-basierend Jis codieren-einschließlich ISO-2022-JP-EXT, ISO-2022-JP-1 und ISO-2022-JP-2- Die Sequenz "ESC $ (D" wird verwendet, um JIS x 0212 Zeichen anzuzeigen.
Keine Verkapselung von JIS X 0212 -Zeichen im Populär Schicht jis Eine Codierung ist möglich, da Shift JIS nicht ausreichend nicht zugewiesener Coderaum für die Zeichen hat.
Implementierungen
JIS x 0212 heißt Code Seite 953 von IBM, einschließlich Anbieter -Erweiterungen.[2][3][4] Die Alternative Ccsid 5049 schließt diese Erweiterungen aus.[5]
Da JIS X 0212 -Zeichen nicht in Shift JIS codiert werden können, dem Codierungssystem, das traditionell die japanische Informationsverarbeitung dominiert hat, wurden nur wenige praktische Implementierungen des Zeichenssatzes stattgefunden. Wie oben erwähnt, kann es in EUC-JP codiert werden, das üblicherweise in UNIX/Linux-Systemen verwendet wird, und hier sind die meisten Implementierungen aufgetreten:
- In den frühen neunziger Jahren wurden grundlegende "BDF" -Schriftarten zur Verwendung in der Unix zusammengestellt X Fenstersystem;
- Für das WNN -System wurde eine IME -Konvertierungsdatei zusammengestellt;
- Die Antrag auf Kterm Console -Fenster wurde erweitert, um sie zu unterstützen.
- das EMACs und Jstevie Die Redakteure wurden erweitert, um es zu unterstützen.
Viele WWW -Browser wie Netscape/Mozilla/Feuerfuchs Familie, Oper usw. und verwandte Anwendungen wie z. Mozilla Thunderbird Unterstützen Sie die Anzeige von JIS X 0212-Zeichen in der EUC-JP-Codierung, jedoch jedoch Internet Explorer Hat keine Unterstützung für JIS x 0212 Zeichen. Moderne Terminalemulationspakete wie die Gnom -Terminal Unterstützen Sie auch JIS x 0212 Zeichen.
Zu den Anwendungen, die JIS X 0212 in der EUC -Codierung unterstützen, gehören:
- das xjdic Wörterbuchprogramm für UNIX/Linux;
- das Wwwjdic Japanischer Wörterbuchserver (jedoch als Internet Explorer Unterstützt die JIS X 0212-Erweiterungen in EUC nicht. Dieser Server sendet Bit-Capt-Grafiken für diese Zeichen, wenn sie im EUC-JP-Modus festgelegt sind.)
Jis x 0212 und unicode
Die Kanji in Jis x 0212 wurden als eine der Quellen für die Han -Vereinigung was zum einheitlichen Satz von führte CJK Charaktere in der Initial ISO 10646/Unicode Standard. Alle 5.801 Kanji wurden aufgenommen.
Die Zukunft
Abgesehen von den oben genannten Anwendungen ist der JIS X 0212 -Standard effektiv tot. 2.743 Kanji davon wurden später enthalten Jis x 0213 Standard. Langfristig wird sein Beitrag wahrscheinlich als 5.801 Kanji angesehen, in die in eingetragen wurde Unicode.
Siehe auch
Verweise
- Jis x 0212-1990 情報 交換 用 符号 符号 補助 漢字 漢字 日本 協会 協会 協会 東京 東京 (1990 年 10月 1 日 制定).(Dokument des japanischen Standards)
- Verständnis der japanischen Informationsverarbeitung, Ken Lunde, O'Reilly & Assoc. 1993
- CJKV Informationsverarbeitung, Ken Lunde, O'Reilly & Assoc. 1999, 2008.
- ^ Van Kesteren, Anne. "5. Indizes (§ Index JIS0212)". Codierungsstandard. Waswg.
- ^ "Code Seite 953 Informationsdokument". Archiviert von das Original Am 2016-03-17.
- ^ "CCSID 953 Informationsdokument". Archiviert von das Original am 2016-03-28.
- ^ Code Seite CPGID 00953 (PDF) (PDF), IBM
- ^ "CCSID 5049 Informationsdokument". Archiviert von das Original am 2016-03-27.
Externe Links
- JIS X 0212 Artikel über die japanische Wikipedia
- Kanjd212 Datenbankdokumentation
- JIS X 0212 Code -Tabelle
- Internationale Komponenten für Unicode (ICU), JISX-212.UCM