ISO-IR-1111
Alias (e) | ISO-IR-1111 |
---|---|
Sprachen) | Russisch, Belarussisch, mazedonisch, serbisch, ukrainisch (teilweise) |
Standard | ECMA-113: 1986 |
Einstufung | Erweiterte ASCII, Koi |
Erweitert | KOI8-B |
gefolgt von | ECMA-113: 1988 (ISO-8859-5) |
Andere verwandte Kodierungen (en) | Koi8-f |
ISO-IR-1111[1] oder Koi8-e[2] ist ein 8-Bit-Zeichensatz. Es ist eine multinationale Erweiterung von KOI-8 zum Belarussisch, mazedonisch, serbisch, und ukrainisch (außer Ґґ was hinzugefügt wird zu Koi8-f). Der Name "ISO-IR-1111" bezieht sich auf seine Registrierungsnummer in der ISO-IR Registrierung und bezeichnet es als ein Set verwendbar mit ISO/IEC 2022.
Es wurde durch die erste (1986) Ausgabe von ECMA-113 definiert,[3] Welches ist das ECMA International Standard entsprechend ISO/IEC 8859-5und als solches entspricht auch einer Entwurfsversion von ISO-8859-5 von 1987.[4] Die veröffentlichten Ausgaben von ISO/IEC 8859-5 entsprechen stattdessen nachfolgenden Ausgaben von ECMA-113, die eine andere Codierung definieren.[5]
Benennung von Verwirrung
ISO-IR-1111, die Ausgabe von ECMA-113 von 1985 (auch "ecma-cyrillisch" oder "kOI8-e" genannt), basierte auf der Ausgabe von 19768 von 19748 (d. H. KOI-8). 1987 wurde ECMA-113 neu gestaltet.[5] Diese neueren Ausgaben von ECMA-113 sind gleichbedeutend mit ISO-8859-5,[5][6] und folge nicht dem KOI -Layout. Diese Verwirrung hat zu einem gemeinsamen Missverständnis geführt, dass ISO-8859-5 in GOST 19768-74 definiert wurde.[6]
Möglicherweise als eine weitere Folge davon, RFC 1345 fälschlicherweise einen anderen Codepage unter den Namen "ISO-IR-1111" und "ecma-cyrillisch" auflistet, ähnelt ISO-8859-5 mit nachgeordneten Zeilen und teilweise kompatibel mit Windows-1251.[7][6] Aufgrund der Bedenken, dass bestehende Implementierungen die Definition von RFC 1345 für diese beiden Etiketten verwenden könnten, wurde vorgeschlagen, dass die Iana zusätzlich erkennen KOI8-E
Als Etikett für ECMA-113: 1985 Inhalt,[7] und die Iana listet derzeit dieses Etikett als Alias auf.[2]
Zeichensatz
Die folgende Tabelle zeigt die ISO-IR-1111-Codierung. Jedes Zeichen wird mit seinem Äquivalent gezeigt Unicode Codepunkt.
ISO-IR-1111 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Axt | NBSP | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | ѕ 0455 | і 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045a | ћ 045b | ќ 045c | SCHÜCHTERN | ў 045e | џ 045f |
BX | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040a | Ћ 040b | Ќ 040c | ¤ 00A4 | Ў 040e | Џ 040f |
CX | ю 044e | а 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | й 0439 | к 043a | л 043b | м 043c | н 043d | о 043e |
Dx | п 043f | я 044f | р 0440 | с 0441 | т 0442 | у 0443 | ж 0436 | в 0432 | ь 044c | ы 044b | з 0437 | ш 0448 | э 044d | щ 0449 | ч 0447 | ъ 044a |
Ex | Ю 042e | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041a | Л 041b | М 041c | Н 041d | О 041e |
Fx | П 041f | Я 042f | Р 0420 | С 0421 | Т 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042c | Ы 042b | З 0417 | Ш 0428 | Э 042d | Щ 0429 | Ч 0427 | Ъ 042a |
Erweiterte und modifizierte Versionen
Eine modifizierte Version namens Koi8 Unified oder Koi8-f wurde in Software verwendet, die von Fingertip -Software hergestellt wurde, und fügte das Hinzufügen des Hinzufügens Ґ in seinem Koi8-u Ort (Austausch der weicher Bindestrich und die Universelles Währungszeichen) und Hinzufügen einiger grafischer Zeichen in die C1 -Kontrollcodes Gebiet, hauptsächlich aus KOI8-R und Windows-1251.[4][6][8][9]
Falsche RFC 1345 -Codeseite
Sprachen) | Russisch, Belarussisch, mazedonisch, serbisch |
---|---|
Standard | RFC 1345 |
Einstufung | Erweiterte ASCII |
Transformationen / codiert | ISO-IR-1111 |
Andere verwandte Kodierungen (en) | ISO-8859-5, Windows-1251 |
RFC 1345 Fehlend eine andere Code-Seite unter dem Namen ISO-IR-1111 auflistet und dieselben kyrillischen Zeichen, jedoch mit einem anderen Layout, codiert. Es ähnelt einer Mischung von Windows-1251 und ISO-8859-5.[7] Insbesondere die Zeile A_ entspricht ISO-8859-5, Zeilen c_ bis F_ entsprechen Windows-1251[6] (Äquivalent zu den Zeilen B_ bis E_ von ISO-8859-5) und entspricht der Zeile F_ von ISO-8859-5 mit Ausnahme der Zeile F_ von ISO-8859-5 fast § durch a ersetzt werden ¤.
Bestimmte Codes ähneln ISO-IR-1111 mit umgedrehter Buchstabe, was möglicherweise zur Verwirrung beigetragen hat. Die Mehrheit unterscheidet sich und ist unten gezeigt.
Code-Seite fälschlicherweise "ISO-IR-1111" oder "ecma-cyrillisch" in RFC 1345 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | NBSP | Ё | Ђ | Ѓ | Є | Ѕ | І | Ї | Ј | Љ | Њ | Ћ | Ќ | SCHÜCHTERN | Ў | Џ |
BX | № | ё | ђ | ѓ | є | ѕ | і | ї | ј | љ | њ | ћ | ќ | ¤ | ў | џ |
CX | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
Dx | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
Ex | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
Fx | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
Siehe auch
Verweise
- ^ ECMA (1. August 1985). Rechte Teil des kyrillischen Alphabets (PDF). Itcj/Ipsj. ISO-IR-111.
- ^ a b "Charaktersätze". Iana.
- ^ ECMA-113. 8-Bit-Single-Byte-codierte grafische Zeichensätze-lateinisches/kyrillisches Alphabet (1. Aufl., Juni 1986)
- ^ a b Czyborra, Roman (1998-11-30) [1998-05-25]. "Die kyrillische Charset -Suppe". Archiviert von das Original Am 2016-12-03. Abgerufen 2016-12-03.
- ^ a b c ECMA-113. 8-Bit-Single-Byte-codierte grafische Zeichensätze-lateinisches/kyrillisches Alphabet (2. Aufl., Juni 1988)
- ^ a b c d e Nechayev, Valentin (2013) [2001]. "Überprüfung des 8-Bit-Cyrillic Codings-Universums". Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05.
- ^ a b c Sokolov, Michael (2003-04-05). "Ecma-Cyrillic alias ISO-IR-111 Wund". Ietf Charsets Mailingliste.
- ^ "Koi8 Unified". Fingerspitzensoftware. Archiviert von das Original Am 1998-01-09. Abgerufen 2020-02-11.
- ^ Leiser, Mark (2008) [1998-03-05]. "KOI8 Unified Cyrillic to Unicode 2.1 Mapping -Tabelle". Abteilung für mathematische Wissenschaften, New Mexico State University. Abgerufen 2020-05-02.