ISO/IEC 8859-5

ISO-8859-5
Alias ​​(e) ISO-IR-144, Cyrillic, Csiolatincyrillic[1]
Sprachen) Russisch, bulgarisch, Belarussisch, mazedonisch, serbisch, ukrainisch (teilweise)
Standard ISO/IEC 8859-5,
ECMA-113 (seit 1988 Ausgabe)
Einstufung Erweiterte ASCII, ISO 8859
Erweitert US-Ascii, ISO-IR-153
Bezogen auf Hauptcode -Seite[2]
Erweiterungen IBM-915
Vorausgegangen von ECMA-113: 1986 (ISO-IR-1111)
Andere verwandte Kodierungen (en) IBM-1124

ISO/IEC 8859-5: 1999, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 5: lateinisches/kyrillisches Alphabet, ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen, Erstausgabe, veröffentlicht 1988. Es wird informell als als bezeichnet Lateinisch/kyrillisch. Es wurde entwickelt, um Sprachen mit einem abzudecken Kyrillisches Alphabet wie zum Beispiel bulgarisch, Belarussisch, Russisch, serbisch und mazedonisch wurde aber nie weit verbreitet. Es wäre auch für nutzbar gewesen ukrainisch in dem Sovietunion von 1933 bis 1990, aber es fehlt dem Ukrainischer Brief Ge, ґ, was in erforderlich ist in Ukrainische Orthographie vor und seit und in dieser Zeit außerhalb der sowjetischen Ukraine. Infolgedessen erstellt IBM Code Seite 1124.

ISO-8859-5 ist der Iana Bevorzugter Charset -Name für diesen Standard, wenn er mit dem ergänzt ist C0- und C1 -Kontrollcodes aus ISO/IEC 6429.

Die 8-Bit-Codierungen KOI8-R und Koi8-u, CP866, und auch Windows-1251 werden weitaus häufiger verwendet. Im Kontrast zu Windows-1252 und ISO 8859-1Windows-1251 ist nicht eng mit ISO 8859-5 verwandt. Das Windows -Code -Seite für ISO-8859-5 ist Code Seite 28595 a.k.a. Windows-28595.[3]

Das Unicode Hauptkyrillikblock Verwendet ein Layout, das auf ISO-8859-5 basiert.

Codepage -Layout

Unterschiede aus ISO 8859-1 werden mit seinem gezeigt Unicode Äquivalenter Codepunkt.

ISO/IEC 8859-5
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x
Axt NBSP Ё
0401
Ђ
0402
Ѓ
0403
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040a
Ћ
040b
Ќ
040c
SCHÜCHTERN Ў
040e
Џ
040f
BX А
0410
Б
0411
В
0412
Г
0413
Д
0414
Е
0415
Ж
0416
З
0417
И
0418
Й
0419
К
041a
Л
041b
М
041c
Н
041d
О
041e
П
041f
CX Р
0420
С
0421
Т
0422
У
0423
Ф
0424
Х
0425
Ц
0426
Ч
0427
Ш
0428
Щ
0429
Ъ
042a
Ы
042b
Ь
042c
Э
042d
Ю
042e
Я
042f
Dx а
0430
б
0431
в
0432
г
0433
д
0434
е
0435
ж
0436
з
0437
и
0438
й
0439
к
043a
л
043b
м
043c
н
043d
о
043e
п
043f
Ex р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044a
ы
044b
ь
044c
э
044d
ю
044e
я
044f
Fx
2116
ё
0451
ђ
0452
ѓ
0453
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045a
ћ
045b
ќ
045c
§
00A7
ў
045e
џ
045f

Geschichte und verwandte Codeseiten

Der ECMA-113-Standard entsprach der ISO-8859-5 seit seiner zweiten Ausgabe.[4] seine erste Ausgabe (ISO-IR-1111) eine Erweiterung der früheren KOI-8 (definiert von GOST 19768-74), das die russischen Buchstaben auf die gleiche Weise wie ihre römischen ASCII-Äquivalente nach Möglichkeit darstellt. Der erste Entwurf von ISO-8859-5 (DIS-8859-5: 1987) folgte ISO-IR-111, wurde jedoch überarbeitet[4] nach GOST 19768-74 wurde ersetzt[5] durch das neue ISO-IR-153 1987, der die russischen Briefe in alphabetische Reihenfolge erneut arrangierte (mit Ausnahme von ё).[5][6] ISO-IR-153 enthält die russischen Buchstaben, einschließlich ё, und nicht brechens Raum und weicher Bindestrich, während der volle kyrillische Satz von ISO-8859-5 auch ISO-IR-144 bezeichnet wird.[7]

Möglicherweise als Folge dieser Verwirrung, RFC 1345 fälschlicherweise Listen Noch eine Codeseite Als "ISO-IR-111" kombinieren Sie den Buchstabenauftrag und die Fallreihenfolge von ISO-8859-5 mit der Zeilenordnung von ISO-IR-111 (und folglich in der Praxis kompatibel, sondern in der Praxis, aber teilweise kompatibel[2] mit Windows-1251).[8][2]

IBM Code Seite 915 ist eine Erweiterung von ISO/IEC 8859-5, die einige hinzufügen semigraphisch und andere Symbole in der C1 Bereich. IBM Code Seite 1124 ist meistens identisch mit ISO-8859-5, ersetzt aber ѓ durch ґ für ukrainisch verwenden.

ISO-IR-200, "Uralisches ergänzendes kyrillisches Set",[9] wurde 1998 von Everson Gunn Teoranta registriert (was Michael Everson war ein Direktor von vor der Gründung von Everype in 2001),[10] und ändert einige der nicht-russischen Buchstaben, um die zu unterstützen Kildin Sami, Komi und Nenets Sprachen, nicht von ISO-8859-5 selbst unterstützt. Michael Everson stellte ebenfalls vor Mac OS Barents kyrillisch Für die gleichen Sprachen unter klassischem Mac OS.

ISO-IR 200[9] (Unterschiede von ISO-8859-5)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
Axt NBSP Ё Ӈ
04c7
Ӓ
04d2
Ӭ
04ec
Ҍ
048c
І Ӧ
04e6
Ҋ
048a
Ӆ
04c5
Ӊ
04c9
«
00ab
Ӎ
04CD
SCHÜCHTERN Ҏ
048e
ʼ
02bc
Fx ё ӈ
04c8
ӓ
04d3
ӭ
04ed
ҍ
048d
і ӧ
04e7
ҋ
048B
ӆ
04c6
ӊ
04ca
»
00BB
ӎ
04ce
§ ҏ
048f
ˮ
02ee

ISO-IR-201, "Wolgaic Supplementary Cyrillic Set",[11] wurde ähnlich von Everson Gunn Teoranta eingeführt, um die zu unterstützen Chuvash, Komi, Mari und Udmurt Sprachen, im Titel gesprochen Republiken Russlands.

ISO-IR 201[11] (Unterschiede von ISO-8859-5)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
Axt NBSP Ё Ӑ
04d0
Ӓ
04d2
Ӗ
04d6
Ҫ
04aa
І Ӧ
04e6
Ӥ
04e4
Ӝ
04dc
Ҥ
04a4
Ӹ
04f8
Ӟ
04de
SCHÜCHTERN Ӱ
04f0
Ӵ
04f4
Fx ё ӑ
04d1
ӓ
04d3
ӗ
04d7
ҫ
04AB
і ӧ
04e7
ӥ
04e5
ӝ
04dd
ҥ
04a5
ӹ
04f9
ӟ
04df
§ ӱ
04f1
ӵ
04f5

Verweise

  1. ^ Zeichensätze, Internet zugewiesene Zahlen Autorität (IANA), 2018-12-12.
  2. ^ a b c Nechayev, Valentin (2013) [2001]. "Überprüfung des 8-Bit-Cyrillic Codings-Universums". Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05.
  3. ^ Code -Seitenkennungen.
  4. ^ a b ECMA-113. 8-Bit-Single-Byte-codierte grafische Zeichensätze-lateinisches/kyrillisches Alphabet (2. Aufl., Juni 1988)
  5. ^ a b Czyborra, Roman (1998-11-30) [1998-05-25]. "Die kyrillische Charset -Suppe". Archiviert von das Original Am 2016-12-03. Abgerufen 2016-12-03.
  6. ^ http://czyborra.com/charets/gost19768-87.txt.gz
  7. ^ "ISO-IR-144" (PDF). 1. Mai 1988.
  8. ^ Sokolov, Michael (2003-04-05). "Ecma-Cyrillic alias ISO-IR-111 Wund". Ietf Charsets Mailingliste.
  9. ^ a b "ISO-IR 200: Uralisches ergänzendes kyrillisches Set" (PDF).
  10. ^ Gunn, Marion; Everson, Michael (2001-09-20). "Everson Gunn Teoranta (EGT) & Everson Typografie". Unicode Mail -Listenarchiv. Unicode -Konsortium.
  11. ^ a b "ISO-IR 201: Wolgaic Supplementary Cyrillic Set" (PDF).

Externe Links

  • ISO/IEC 8859-5: 1999
  • Standard ECMA-113: 8-Bit-Single-Byte-codierte grafische Zeichensätze-lateinisches/kyrillisches Alphabet 3. Ausgabe (Dezember 1999)
  • ISO-IR 144 Kyrillischer Teil des lateinischen/kyrillischen Alphabets (1. Mai 1988 aus ISO 8859-5 2. Version)