ISO/IEC 10367
ISO/IEC 10367: 1991 ist ein Standard, der von entwickelt wurde von ISO/IEC JTC 1/SC 2,[1] Definition Grafische Zeichensätze zur Verwendung in Charaktercodierungen Implementierung der Ebenen 2 und 3 von ISO/IEC 4873[2] (im Gegensatz zu ISO/IEC 8859, was Zeichencodierungen auf Stufe 1 von ISO/IEC 4873 definiert.
Beziehung zu ISO/IEC 8859
Die Teile von ISO/IEC 8859 Definieren Sie vollständige Codierungen auf Stufe 1 von ISO/IEC 4873 (d. h. als staatenlos erweiterte ASCII Single-Byte Codierungen, reservieren die C1 -Bereich) und erlauben nicht die Verwendung mehrerer Teile zusammen. Für die Verwendung in den Ebenen 2 und 3 von ISO/IEC 4873 (d. H. Mit Schaltcodes für zusätzliche grafische Zeichensätze) sollten stattdessen iSO/IEC 8859 verwendet werden, die äquivalente Sätze aus ISO/IEC 10367 verwendet werden.[3]
ISO/IEC 10367: 1991 enthält ASCIIund setzt und setzt das Abpassen der G1 setzt Wird für die rechten Seiten (Nicht-ASCII-Teile) von ISO/IEC 6937 (verwendetItu t.51) und von ISO/IEC 8859 Teile 1 bis 9 (d. H. Die Teile, die ab 1991 existierten, als es veröffentlicht wurde), eine Reihe zusätzlicher römischer Zeichen, die einige dieser Teile ergänzen ).[2][4]
Ergänzende G3 Latin Set
ISO/IEC 10367 enthält die ISO-IR-154 Grafischer Satz, der die lateinischen Alphabets Nummer 1, 2 und 5 ergänzen soll (d. H.,, ISO-8859-1, ISO-8859-2 und ISO-8859-9).[4] Insbesondere ist es für die Verwendung als G3 in einem Profil von ISO/IEC 4873 vorgesehen, in dem die G1- und G2-Sets die rechte Seite von ISO-8859-2 und auch die von entweder ISO-8859-1 oder ISO enthalten -8859-9.[5] Diese Konfigurationen repräsentieren die gesamte ISO/IEC 6937 Repertoire (ITU T.51 Anhang A) ohne Nicht-Abstandscodes.[6]
Zum Beispiel würde der Buchstabe ĉ unter ISO/IEC 4873 Level 2 als codiert 0x8f 0x23
Wenn dieses Set enthalten ist.
Hervorgehende Zeichen erscheinen auch in ISO-8859-1 oder ISO-8859-9. Unter der aktuellen Ausgabe von ISO / IEC 4873 / ECMA-43 (wenn auch nicht frühere Ausgaben),[7] Zeichen müssen aus dem niedrigsten Arbeitssatz verwendet werden.[8]
ISO/IEC 10367 Ergänzende G3 Latin Set[5] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x/ax | Ā | Ĉ | Ċ | Ė | Ē | Ĝ | ‘ | “ | ™ | ← | ↑ | → | ↓ | |||
3x/bx | ā | ĉ | ċ | ð | ė | ē | ĝ | ’ | ” | ♪ | ⅛ | ⅜ | ⅝ | ⅞ | ||
4x/cx | Ğ | Ġ | Ģ | Ĥ | Ħ | Ĩ | İ | Ī | Į | IJ | Ĵ | Ķ | Ļ | Ŀ | Ņ | |
5x/dx | — | Ŋ | Ō | Œ | Ŗ | Ŝ | Ŧ | Þ | Ũ | Ŭ | Ū | Ų | Ŵ | Ý | Ŷ | Ÿ |
6x/ex | Ω | ğ | ġ | ģ | ĥ | ħ | ĩ | ı | ī | į | ij | ĵ | ķ | ļ | ŀ | ņ |
7x/fx | ĸ | ŋ | ō | œ | ŗ | ŝ | ŧ | þ | ũ | ŭ | ū | ų | ŵ | ý | ŷ | ʼn |
Box Zeichnungsset
Das Folgende zeigt den Box -Zeichnungssatz von ISO/IEC 10367, das für registriert ist ISO/IEC 2022 benutzen als ISO-IR-155. Es verwendet nicht das 0x20/a0 oder 0x7f/ff Positionen, ist jedoch dennoch als 96-Charakter-Set registriert.[9]
Perl Libintl enthält einen "ISO_10367-Box" -Codec. Dies codiert/decodert ASCII über GL und die ISO-IR-155-Box-Zeichnung über GR mit einigen Abweichungen. Insbesondere enthält es doppelt ausgekleidete Box-Drawing-Zeichen Anstelle von schweren Zeichen und ersetzt den oberen halben Block (▀) bei 0xCB durch a private Gebrauchcharakter U+E019, dokumentiert als "Einheitsraum B".[10]
ISO/IEC 10367 Box Zeichnungssatz[9] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x/ax | ||||||||||||||||
3x/bx | ||||||||||||||||
4x/cx | ┃ | ━ | ┏ | ┓ | ┗ | ┛ | ┣ | ┫ | ┳ | ┻ | ╋ | ▀ | ▄ | █ | ▪ | |
5x/dx | │ | ─ | ┌ | ┐ | └ | ┘ | ├ | ┤ | ┬ | ┴ | ┼ | ░ | ▒ | ▓ | ||
6x/ex | ||||||||||||||||
7x/fx |
Verweise
- ^ ISO/IEC JTC 1/SC 2 (1991). "Informationstechnologie-standardisierte codierte Grafikzeichen für die Verwendung in 8-Bit-Codes". ISO. ISO/IEC 10367: 1991.
- ^ a b Van Wingen, Johan W (1999). "8. Codeerweiterung, ISO 2022 und 2375, ISO 4873 und 10367". Zeichensätze. Briefe, Token und Codes. Ternea. Archiviert von das Original am 2020-08-01.
- ^ ISO/IEC JTC 1/SC 2 (1998-02-12). Abschließender Text von Dis 8859-10, Informationstechnologie-8-Bit-Single-Byte-Coded Grafikzeichen-Sets-Teil 10: Lateinischer Alphabet Nr. 6 (PDF). ISO/IEC FDIS 8859-10: 1998, JTC1/SC2 N2992, WG3 N415.
- ^ a b "8 -Bit -Zeichensätze - ISO/IEC 10367". Leitfaden zur Verwendung von Zeichensätzen in Europa. DKUUG.
- ^ a b ECMA (1990-03-01). Ergänzungssatz für lateinische Alphabete 1, 2 und 5 (PDF). Itcj/Ipsj. ISO-IR-154.
- ^ ISO/IEC JTC 1/SC 2/WG 3 (1998-04-15). "Anhang E: Alternative codierte Darstellung des Repertoires ohne diakritische Markierungen". WD 6937, codierter Grafikzeichen für Textkommunikation - Lateinisches Alphabet (PDF). p. 37. JTC1/SC2/N454.
- ^ ECMA (1991). "Hauptunterschiede zwischen der zweiten Ausgabe (1985) und der vorliegenden (dritten) Ausgabe dieses ECMA -Standards". ECMA-43: 8-Bit-codierte Zeichensatzstruktur und -regeln (PDF) (ECMA -Standard) (3. Aufl.). p. 23.
- ^ ECMA (1991). "Einzigartige Codierung von Zeichen". ECMA-43: 8-Bit-codierte Zeichensatzstruktur und -regeln (PDF) (ECMA -Standard) (3. Aufl.). p. 10.
- ^ a b ISO/IEC/JTC1/SC2/WG3 (1990-04-16). Grundlegende Box-Drawings-Set (PDF). Itcj/Ipsj. ISO-IR-155.
- ^ Flohr, Guido. "Conversion -Routinen für ISO_10367_Box". libintl-perl. Locale :: Recodedata :: ISO_10367_Box.