ISO-IR-1111

Koi8-e (1986)
Alias ​​(e) ISO-IR-1111
Sprachen) Russisch, Belarussisch, mazedonisch, serbisch, ukrainisch (teilweise)
Standard ECMA-113: 1986
Einstufung Erweiterte ASCII, Koi
Erweitert KOI8-B
gefolgt von ECMA-113: 1988 (ISO-8859-5)
Andere verwandte Kodierungen (en) Koi8-f

ISO-IR-1111[1] oder Koi8-e[2] ist ein 8-Bit-Zeichensatz. Es ist eine multinationale Erweiterung von KOI-8 zum Belarussisch, mazedonisch, serbisch, und ukrainisch (außer Ґґ was hinzugefügt wird zu Koi8-f). Der Name "ISO-IR-1111" bezieht sich auf seine Registrierungsnummer in der ISO-IR Registrierung und bezeichnet es als ein Set verwendbar mit ISO/IEC 2022.

Es wurde durch die erste (1986) Ausgabe von ECMA-113 definiert,[3] Welches ist das ECMA International Standard entsprechend ISO/IEC 8859-5und als solches entspricht auch einer Entwurfsversion von ISO-8859-5 von 1987.[4] Die veröffentlichten Ausgaben von ISO/IEC 8859-5 entsprechen stattdessen nachfolgenden Ausgaben von ECMA-113, die eine andere Codierung definieren.[5]

Benennung von Verwirrung

ISO-IR-1111, die Ausgabe von ECMA-113 von 1985 (auch "ecma-cyrillisch" oder "kOI8-e" genannt), basierte auf der Ausgabe von 19768 von 19748 (d. H. KOI-8). 1987 wurde ECMA-113 neu gestaltet.[5] Diese neueren Ausgaben von ECMA-113 sind gleichbedeutend mit ISO-8859-5,[5][6] und folge nicht dem KOI -Layout. Diese Verwirrung hat zu einem gemeinsamen Missverständnis geführt, dass ISO-8859-5 in GOST 19768-74 definiert wurde.[6]

Möglicherweise als eine weitere Folge davon, RFC 1345 fälschlicherweise einen anderen Codepage unter den Namen "ISO-IR-1111" und "ecma-cyrillisch" auflistet, ähnelt ISO-8859-5 mit nachgeordneten Zeilen und teilweise kompatibel mit Windows-1251.[7][6] Aufgrund der Bedenken, dass bestehende Implementierungen die Definition von RFC 1345 für diese beiden Etiketten verwenden könnten, wurde vorgeschlagen, dass die Iana zusätzlich erkennen KOI8-E Als Etikett für ECMA-113: 1985 Inhalt,[7] und die Iana listet derzeit dieses Etikett als Alias ​​auf.[2]

Zeichensatz

Die folgende Tabelle zeigt die ISO-IR-1111-Codierung. Jedes Zeichen wird mit seinem Äquivalent gezeigt Unicode Codepunkt.

ISO-IR-1111
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x
Axt NBSP ђ
0452
ѓ
0453
ё
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045a
ћ
045b
ќ
045c
SCHÜCHTERN ў
045e
џ
045f
BX
2116
Ђ
0402
Ѓ
0403
Ё
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040a
Ћ
040b
Ќ
040c
¤
00A4
Ў
040e
Џ
040f
CX ю
044e
а
0430
б
0431
ц
0446
д
0434
е
0435
ф
0444
г
0433
х
0445
и
0438
й
0439
к
043a
л
043b
м
043c
н
043d
о
043e
Dx п
043f
я
044f
р
0440
с
0441
т
0442
у
0443
ж
0436
в
0432
ь
044c
ы
044b
з
0437
ш
0448
э
044d
щ
0449
ч
0447
ъ
044a
Ex Ю
042e
А
0410
Б
0411
Ц
0426
Д
0414
Е
0415
Ф
0424
Г
0413
Х
0425
И
0418
Й
0419
К
041a
Л
041b
М
041c
Н
041d
О
041e
Fx П
041f
Я
042f
Р
0420
С
0421
Т
0422
У
0423
Ж
0416
В
0412
Ь
042c
Ы
042b
З
0417
Ш
0428
Э
042d
Щ
0429
Ч
0427
Ъ
042a

Erweiterte und modifizierte Versionen

Eine modifizierte Version namens Koi8 Unified oder Koi8-f wurde in Software verwendet, die von Fingertip -Software hergestellt wurde, und fügte das Hinzufügen des Hinzufügens Ґ in seinem Koi8-u Ort (Austausch der weicher Bindestrich und die Universelles Währungszeichen) und Hinzufügen einiger grafischer Zeichen in die C1 -Kontrollcodes Gebiet, hauptsächlich aus KOI8-R und Windows-1251.[4][6][8][9]

Falsche RFC 1345 -Codeseite

RFC 1345s "ecma-cyrillisch"
Sprachen) Russisch, Belarussisch, mazedonisch, serbisch
Standard RFC 1345
Einstufung Erweiterte ASCII
Transformationen / codiert ISO-IR-1111
Andere verwandte Kodierungen (en) ISO-8859-5, Windows-1251

RFC 1345 Fehlend eine andere Code-Seite unter dem Namen ISO-IR-1111 auflistet und dieselben kyrillischen Zeichen, jedoch mit einem anderen Layout, codiert. Es ähnelt einer Mischung von Windows-1251 und ISO-8859-5.[7] Insbesondere die Zeile A_ entspricht ISO-8859-5, Zeilen c_ bis F_ entsprechen Windows-1251[6] (Äquivalent zu den Zeilen B_ bis E_ von ISO-8859-5) und entspricht der Zeile F_ von ISO-8859-5 mit Ausnahme der Zeile F_ von ISO-8859-5 fast § durch a ersetzt werden ¤.

Bestimmte Codes ähneln ISO-IR-1111 mit umgedrehter Buchstabe, was möglicherweise zur Verwirrung beigetragen hat. Die Mehrheit unterscheidet sich und ist unten gezeigt.

Code-Seite fälschlicherweise "ISO-IR-1111" oder "ecma-cyrillisch" in RFC 1345
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
Axt NBSP Ё Ђ Ѓ Є Ѕ І Ї Ј Љ Њ Ћ Ќ SCHÜCHTERN Ў Џ
BX ё ђ ѓ є ѕ і ї ј љ њ ћ ќ ¤ ў џ
CX А Б В Г Д Е Ж З И Й К Л М Н О П
Dx Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
Ex а б в г д е ж з и й к л м н о п
Fx р с т у ф х ц ч ш щ ъ ы ь э ю я
 Abweichung von ISO-IR-111 (ohne Abweichungen nur für den Fall)

Siehe auch

Verweise

  1. ^ ECMA (1. August 1985). Rechte Teil des kyrillischen Alphabets (PDF). Itcj/Ipsj. ISO-IR-111.
  2. ^ a b "Charaktersätze". Iana.
  3. ^ ECMA-113. 8-Bit-Single-Byte-codierte grafische Zeichensätze-lateinisches/kyrillisches Alphabet (1. Aufl., Juni 1986)
  4. ^ a b Czyborra, Roman (1998-11-30) [1998-05-25]. "Die kyrillische Charset -Suppe". Archiviert von das Original Am 2016-12-03. Abgerufen 2016-12-03.
  5. ^ a b c ECMA-113. 8-Bit-Single-Byte-codierte grafische Zeichensätze-lateinisches/kyrillisches Alphabet (2. Aufl., Juni 1988)
  6. ^ a b c d e Nechayev, Valentin (2013) [2001]. "Überprüfung des 8-Bit-Cyrillic Codings-Universums". Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05.
  7. ^ a b c Sokolov, Michael (2003-04-05). "Ecma-Cyrillic alias ISO-IR-111 Wund". Ietf Charsets Mailingliste.
  8. ^ "Koi8 Unified". Fingerspitzensoftware. Archiviert von das Original Am 1998-01-09. Abgerufen 2020-02-11.
  9. ^ Leiser, Mark (2008) [1998-03-05]. "KOI8 Unified Cyrillic to Unicode 2.1 Mapping -Tabelle". Abteilung für mathematische Wissenschaften, New Mexico State University. Abgerufen 2020-05-02.