KOI8-U

Koi8-u
Sprachen) ukrainisch, Russisch, bulgarisch
Einstufung 8 Bit Koi, erweiterte ASCII
Erweitert KOI8-B
Bezogen auf KOI8-R
Andere verwandte Kodierungen (en) Koi8-ru, Koi8-f

Koi8-u (RFC 2319) ist ein 8-Bit Zeichenkodierung, entworfen, um abzudecken ukrainisch, was a verwendet kyrillisch Alphabet. Es basiert auf KOI8-R, was abdeckt Russisch und bulgarischersetzt aber acht Box -Zeichenzeichen durch vier ukrainische Buchstaben Ґ, Є, І, und Ї sowohl im oberen als auch im unteren Fall.

Koi8-ru ist eng verwandt, fügt aber hinzu für Belarussisch. In beiden Koi8-e, mit Ausnahme von ґ, der zugesetzt wird zu Koi8-f.

Im Microsoft Windows, Koi8-u wird mit der Code-Seite Nummer 21866 zugewiesen. in IBM, KOI8-U wird Code-Seite/ zugewiesen/Ccsid 1168.[1][2][3]

Koi8 bleibt viel häufiger verwendet als ISO 8859-5, was nie wirklich eingehalten hat. Eine weitere häufige kyrillische Charaktercodierung ist Windows-1251. In Zukunft könnten beide schließlich weichen Unicode.

Koi8 steht für Kod Obmena Informatsiey, 8 -Bit (Russisch: Код Обмена Информацией, 8 бит) was "Code for Information Exchange, 8 Bit" bedeutet.

Die KOI8-Charakter-Sets haben das Eigentum, dass die russischen kyrillischen Buchstaben eher in der pseudo-römischen Ordnung als in der natürlichen kyrillischen alphabetischen Reihenfolge wie in ISO 8859-5 sind. Obwohl dies unnatürlich erscheint, hat es die nützliche Eigenschaft, dass der Text bei der Umkehrung der Transliteration eines gewöhnlichen ASCII-Terminals immer noch gelesen (oder zumindest entschlüsselt) werden kann, wenn das achte Bit entfernt wird. Zum Beispiel wird " Russkij Tekst ("Russischer Text") Wenn das 8. Bit abgezogen wird.

Zeichensatz

Die folgende Tabelle zeigt die KOI8-U-Kodierung.[1][4] Jedes Zeichen wird mit seinem Äquivalent gezeigt Unicode Codepunkt.

Koi8-u
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
2500

2502

250c

2510

2514

2518

251c

2524

252c

2534

253c

2580

2584

2588

258c

2590
9x
2591

2592

2593

2320

25A0

2219

221a

2248

2264

2265
NBSP
2321
°
00B0
²
00B2
·
00B7
÷
00f7
Axt
2550

2551

2552
ё
0451
є
0454

2554
і
0456
ї
0457

2557

2558

2559

255a

255b
ґ
0491

255d

255e
BX
255f

2560

2561
Ё
0401
Є
0404

2563
І
0406
Ї
0407

2566

2567

2568

2569

256a
Ґ
0490

256c
©
00A9
CX ю
044e
а
0430
б
0431
ц
0446
д
0434
е
0435
ф
0444
г
0433
х
0445
и
0438
й
0439
к
043a
л
043b
м
043c
н
043d
о
043e
Dx п
043f
я
044f
р
0440
с
0441
т
0442
у
0443
ж
0436
в
0432
ь
044c
ы
044b
з
0437
ш
0448
э
044d
щ
0449
ч
0447
ъ
044a
Ex Ю
042e
А
0410
Б
0411
Ц
0426
Д
0414
Е
0415
Ф
0424
Г
0413
Х
0425
И
0418
Й
0419
К
041a
Л
041b
М
041c
Н
041d
О
041e
Fx П
041f
Я
042f
Р
0420
С
0421
Т
0422
У
0423
Ж
0416
В
0412
Ь
042c
Ы
042b
З
0417
Ш
0428
Э
042d
Щ
0429
Ч
0427
Ъ
042a
 Unterschiede mit KOI8-R (Nicht-russische Buchstaben)

Obwohl RFC 2319 besagt, dass das Zeichen 0x95 U+2219 (∙) sein sollte, kann es auch U+2022 (•) sein, um dem Kugelscharakter in zu entsprechen Windows-1251.

Einige Referenzen haben einen Tippfehler und geben falsch an, dass das Zeichen 0xB4 U+0403 ist und nicht das richtige U+0404. Dieser Tippfehler ist in Anhang A von RFC 2319 vorhanden (die Tabelle im Haupttext des RFC enthält jedoch die richtige Zuordnung).

Siehe auch

Verweise

  1. ^ a b "SBCS -Code -Seiteninformationen - CPGID: 01168 / Name: Ukrainisch KOI8 -U". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. IBM. C-H 3-3220-050. Archiviert vom Original am 2017-02-18. Abgerufen 2017-02-18. [1] [2]
  2. ^ "CCSID-Informationsdokument; CCSID 1168; KOI8-U". IBM. Archiviert vom Original am 2017-02-18. Abgerufen 2017-02-18.
  3. ^ Internationale Komponenten für Unicode (ICU), IBM-1168_P100-2002.ucm, 2002-12-03
  4. ^ Very, Philippe; Richter, Helmut (2016-01-04) [2008-10-13]. "Koi8-u.txt". 2.0. Abgerufen 2016-12-09.{{}}: CS1 Wartung: URL-Status (Link)

Weitere Lektüre

Externe Links