JIS X 0212

Jis x 0212
Sprachen) Beabsichtigt, neben Jis x 0208 zum japanisch Unterstützung. Unterstützt keine Sprache für sich.
Standard JIS X 0212: 1990
Aktueller Status Unihan Quelle. Codierter Zeichen setzen sich nicht so weit verbreitet wie Jis x 0208, aber manchmal verwendet in EUC-JP.[1]
Einstufung Ergänzungspunkt, Charset, ISO 2022, DBCs, CJK -Codierung
Erweitert Jis x 0208 wenn zusammen verwendet
Codierungsformate EUC-JP
ISO-2022-JP-1
gefolgt von Jis x 0213
Andere verwandte Kodierungen (en) KS x 1002

Jis x 0212 ist ein Japanischer Industriestandard Definieren eines codierten Zeichensatzes für die codierenden Zusatzzeichen für die Verwendung auf Japanisch. Dieser Standard soll ergänzen Jis x 0208 (Code Seite 952). Es ist nummeriert 953 oder 5049 Als IBM -Code -Seite (siehe unten).

Es ist einer der Quellstandards für Unicode's CJK Unified Ideographs.

Geschichte

1990 die Japanische Standardvereinigung (JSA) Veröffentlicht einen ergänzenden Zeichensatz Standard: JIS x 0212-1990 Code des ergänzenden japanischen Grafikzeichens für den Informationsaustausch (情報交換用漢字符号-補助漢字, Jōhō Kōkan'yō Kanji Fugō - Hojo Kanji). Dieser Standard sollte auf dem Bereich der im Haupt erhältlichen Zeichen bauen Jis x 0208 Zeichensatz und Mängeln in der Berichterstattung dieses Satzes.

Merkmale

Euler -Diagramm Vergleich von Repertoires von Jis x 0208, Jis x 0212, Jis x 0213, Windows-31Jdas Microsoft Standard Repertoire und Unicode.

Der Standard spezifizierte 6.067 Zeichen, bestehend aus:

  • 21 griechische Charaktere mit Diakritik
  • 26 osteuropäische Charaktere mit Diakritik (meistens kyrillisch)
  • 198 Alphabetische Charaktere mit Diakritik
  • 5.801 Kanji

Codierungen

Die folgenden Codierungen oder Einkapselungen werden verwendet, um die Verwendung von JIS X 0212 -Zeichen in Dateien usw. zu ermöglichen.

Keine Verkapselung von JIS X 0212 -Zeichen im Populär Schicht jis Eine Codierung ist möglich, da Shift JIS nicht ausreichend nicht zugewiesener Coderaum für die Zeichen hat.

Implementierungen

EUC-JP uses first byte 0x8F followed by two bytes in 0xA1–FE for JIS X 0212.
Windows code page 20932 uses a first byte in 0xA1–FE followed by a byte in 0x21–FE for JIS X 0212.
Codierung von JIS x 0212 in konformanten EUC-JP (links) und Windows-Code Seite 20932 (rechts).

JIS x 0212 heißt Code Seite 953 von IBM, einschließlich Anbieter -Erweiterungen.[2][3][4] Die Alternative Ccsid 5049 schließt diese Erweiterungen aus.[5]

Da JIS X 0212 -Zeichen nicht in Shift JIS codiert werden können, dem Codierungssystem, das traditionell die japanische Informationsverarbeitung dominiert hat, wurden nur wenige praktische Implementierungen des Zeichenssatzes stattgefunden. Wie oben erwähnt, kann es in EUC-JP codiert werden, das üblicherweise in UNIX/Linux-Systemen verwendet wird, und hier sind die meisten Implementierungen aufgetreten:

  • In den frühen neunziger Jahren wurden grundlegende "BDF" -Schriftarten zur Verwendung in der Unix zusammengestellt X Fenstersystem;
  • Für das WNN -System wurde eine IME -Konvertierungsdatei zusammengestellt;
  • Die Antrag auf Kterm Console -Fenster wurde erweitert, um sie zu unterstützen.
  • das EMACs und Jstevie Die Redakteure wurden erweitert, um es zu unterstützen.

Viele WWW -Browser wie Netscape/Mozilla/Feuerfuchs Familie, Oper usw. und verwandte Anwendungen wie z. Mozilla Thunderbird Unterstützen Sie die Anzeige von JIS X 0212-Zeichen in der EUC-JP-Codierung, jedoch jedoch Internet Explorer Hat keine Unterstützung für JIS x 0212 Zeichen. Moderne Terminalemulationspakete wie die Gnom -Terminal Unterstützen Sie auch JIS x 0212 Zeichen.

Zu den Anwendungen, die JIS X 0212 in der EUC -Codierung unterstützen, gehören:

  • das xjdic Wörterbuchprogramm für UNIX/Linux;
  • das Wwwjdic Japanischer Wörterbuchserver (jedoch als Internet Explorer Unterstützt die JIS X 0212-Erweiterungen in EUC nicht. Dieser Server sendet Bit-Capt-Grafiken für diese Zeichen, wenn sie im EUC-JP-Modus festgelegt sind.)

Jis x 0212 und unicode

Die Kanji in Jis x 0212 wurden als eine der Quellen für die Han -Vereinigung was zum einheitlichen Satz von führte CJK Charaktere in der Initial ISO 10646/Unicode Standard. Alle 5.801 Kanji wurden aufgenommen.

Die Zukunft

Abgesehen von den oben genannten Anwendungen ist der JIS X 0212 -Standard effektiv tot. 2.743 Kanji davon wurden später enthalten Jis x 0213 Standard. Langfristig wird sein Beitrag wahrscheinlich als 5.801 Kanji angesehen, in die in eingetragen wurde Unicode.

Siehe auch

Verweise

  • Jis x 0212-1990 情報 交換 用 符号 符号 補助 漢字 漢字 日本 協会 協会 協会 東京 東京 (1990 年 10月 1 日 制定).(Dokument des japanischen Standards)
  • Verständnis der japanischen Informationsverarbeitung, Ken Lunde, O'Reilly & Assoc. 1993
  • CJKV Informationsverarbeitung, Ken Lunde, O'Reilly & Assoc. 1999, 2008.
  1. ^ Van Kesteren, Anne. "5. Indizes (§ Index JIS0212)". Codierungsstandard. Waswg.
  2. ^ "Code Seite 953 Informationsdokument". Archiviert von das Original Am 2016-03-17.
  3. ^ "CCSID 953 Informationsdokument". Archiviert von das Original am 2016-03-28.
  4. ^ Code Seite CPGID 00953 (PDF) (PDF), IBM
  5. ^ "CCSID 5049 Informationsdokument". Archiviert von das Original am 2016-03-27.

Externe Links