ISO/IEC 10367

ISO/IEC 10367: 1991 ist ein Standard, der von entwickelt wurde von ISO/IEC JTC 1/SC 2,[1] Definition Grafische Zeichensätze zur Verwendung in Charaktercodierungen Implementierung der Ebenen 2 und 3 von ISO/IEC 4873[2] (im Gegensatz zu ISO/IEC 8859, was Zeichencodierungen auf Stufe 1 von ISO/IEC 4873 definiert.

Beziehung zu ISO/IEC 8859

Die Teile von ISO/IEC 8859 Definieren Sie vollständige Codierungen auf Stufe 1 von ISO/IEC 4873 (d. h. als staatenlos erweiterte ASCII Single-Byte Codierungen, reservieren die C1 -Bereich) und erlauben nicht die Verwendung mehrerer Teile zusammen. Für die Verwendung in den Ebenen 2 und 3 von ISO/IEC 4873 (d. H. Mit Schaltcodes für zusätzliche grafische Zeichensätze) sollten stattdessen iSO/IEC 8859 verwendet werden, die äquivalente Sätze aus ISO/IEC 10367 verwendet werden.[3]

ISO/IEC 10367: 1991 enthält ASCIIund setzt und setzt das Abpassen der G1 setzt Wird für die rechten Seiten (Nicht-ASCII-Teile) von ISO/IEC 6937 (verwendetItu t.51) und von ISO/IEC 8859 Teile 1 bis 9 (d. H. Die Teile, die ab 1991 existierten, als es veröffentlicht wurde), eine Reihe zusätzlicher römischer Zeichen, die einige dieser Teile ergänzen ).[2][4]

Ergänzende G3 Latin Set

ISO/IEC 10367 enthält die ISO-IR-154 Grafischer Satz, der die lateinischen Alphabets Nummer 1, 2 und 5 ergänzen soll (d. H.,, ISO-8859-1, ISO-8859-2 und ISO-8859-9).[4] Insbesondere ist es für die Verwendung als G3 in einem Profil von ISO/IEC 4873 vorgesehen, in dem die G1- und G2-Sets die rechte Seite von ISO-8859-2 und auch die von entweder ISO-8859-1 oder ISO enthalten -8859-9.[5] Diese Konfigurationen repräsentieren die gesamte ISO/IEC 6937 Repertoire (ITU T.51 Anhang A) ohne Nicht-Abstandscodes.[6]

Zum Beispiel würde der Buchstabe ĉ unter ISO/IEC 4873 Level 2 als codiert 0x8f 0x23 Wenn dieses Set enthalten ist.

Hervorgehende Zeichen erscheinen auch in ISO-8859-1 oder ISO-8859-9. Unter der aktuellen Ausgabe von ISO / IEC 4873 / ECMA-43 (wenn auch nicht frühere Ausgaben),[7] Zeichen müssen aus dem niedrigsten Arbeitssatz verwendet werden.[8]

ISO/IEC 10367 Ergänzende G3 Latin Set[5]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax Ā Ĉ Ċ Ė Ē Ĝ
3x/bx ā ĉ ċ ð ė ē ĝ
4x/cx Ğ Ġ Ģ Ĥ Ħ Ĩ İ Ī Į IJ Ĵ Ķ Ļ Ŀ Ņ
5x/dx Ŋ Ō Œ Ŗ Ŝ Ŧ Þ Ũ Ŭ Ū Ų Ŵ Ý Ŷ Ÿ
6x/ex ğ ġ ģ ĥ ħ ĩ ı ī į ij ĵ ķ ļ ŀ ņ
7x/fx ĸ ŋ ō œ ŗ ŝ ŧ þ ũ ŭ ū ų ŵ ý ŷ ʼn
 Auch in ISO-8859-1
 Auch in ISO-8859-9

Box Zeichnungsset

Das Folgende zeigt den Box -Zeichnungssatz von ISO/IEC 10367, das für registriert ist ISO/IEC 2022 benutzen als ISO-IR-155. Es verwendet nicht das 0x20/a0 oder 0x7f/ff Positionen, ist jedoch dennoch als 96-Charakter-Set registriert.[9]

Perl Libintl enthält einen "ISO_10367-Box" -Codec. Dies codiert/decodert ASCII über GL und die ISO-IR-155-Box-Zeichnung über GR mit einigen Abweichungen. Insbesondere enthält es doppelt ausgekleidete Box-Drawing-Zeichen Anstelle von schweren Zeichen und ersetzt den oberen halben Block (▀) bei 0xCB durch a private Gebrauchcharakter U+E019, dokumentiert als "Einheitsraum B".[10]

ISO/IEC 10367 Box Zeichnungssatz[9]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax
3x/bx
4x/cx
5x/dx
6x/ex
7x/fx

Verweise

  1. ^ ISO/IEC JTC 1/SC 2 (1991). "Informationstechnologie-standardisierte codierte Grafikzeichen für die Verwendung in 8-Bit-Codes". ISO. ISO/IEC 10367: 1991.
  2. ^ a b Van Wingen, Johan W (1999). "8. Codeerweiterung, ISO 2022 und 2375, ISO 4873 und 10367". Zeichensätze. Briefe, Token und Codes. Ternea. Archiviert von das Original am 2020-08-01.
  3. ^ ISO/IEC JTC 1/SC 2 (1998-02-12). Abschließender Text von Dis 8859-10, Informationstechnologie-8-Bit-Single-Byte-Coded Grafikzeichen-Sets-Teil 10: Lateinischer Alphabet Nr. 6 (PDF). ISO/IEC FDIS 8859-10: 1998, JTC1/SC2 N2992, WG3 N415.
  4. ^ a b "8 -Bit -Zeichensätze - ISO/IEC 10367". Leitfaden zur Verwendung von Zeichensätzen in Europa. DKUUG.
  5. ^ a b ECMA (1990-03-01). Ergänzungssatz für lateinische Alphabete 1, 2 und 5 (PDF). Itcj/Ipsj. ISO-IR-154.
  6. ^ ISO/IEC JTC 1/SC 2/WG 3 (1998-04-15). "Anhang E: Alternative codierte Darstellung des Repertoires ohne diakritische Markierungen". WD 6937, codierter Grafikzeichen für Textkommunikation - Lateinisches Alphabet (PDF). p. 37. JTC1/SC2/N454.
  7. ^ ECMA (1991). "Hauptunterschiede zwischen der zweiten Ausgabe (1985) und der vorliegenden (dritten) Ausgabe dieses ECMA -Standards". ECMA-43: 8-Bit-codierte Zeichensatzstruktur und -regeln (PDF) (ECMA -Standard) (3. Aufl.). p. 23.
  8. ^ ECMA (1991). "Einzigartige Codierung von Zeichen". ECMA-43: 8-Bit-codierte Zeichensatzstruktur und -regeln (PDF) (ECMA -Standard) (3. Aufl.). p. 10.
  9. ^ a b ISO/IEC/JTC1/SC2/WG3 (1990-04-16). Grundlegende Box-Drawings-Set (PDF). Itcj/Ipsj. ISO-IR-155.
  10. ^ Flohr, Guido. "Conversion -Routinen für ISO_10367_Box". libintl-perl. Locale :: Recodedata :: ISO_10367_Box.