KOI8-R

KOI8-R
Alias ​​(e) CP878 (Codepage 878)
Sprachen) Russisch, bulgarisch
Einstufung 8 Bit Koi, erweiterte ASCII
Erweitert KOI8-B
Bezogen auf KOI-8
Andere verwandte Kodierungen (en) Koi8-u, Koi8-ru

KOI8-R (RFC 1489) ist ein 8-Bit Zeichenkodierung, abgeleitet von der KOI-8 Codierung durch den Programmierer Andrei Chernov im Jahr 1993 und so konzipiert, dass er bedeckt ist Russisch, was a verwendet kyrillisch Alphabet. KOI8-R basierte auf Russischer Morsecode, was aus a geschaffen wurde phonetisch Version von Latein Morse-Code. Infolgedessen befinden sich russische kyrillische Buchstaben eher in pseudo-römischer Reihenfolge als in der normalen kyrillischen alphabetischen Reihenfolge. Obwohl dies unnatürlich erscheint, ist der Text bei ASCII teilweise lesbar und kann in syntaktisch korrektes konvertiert werden KOI7. Zum Beispiel " Russkij Tekst ("Russischer Text").

Koi8 steht für Kod Obmena Informatsiey, 8 -Bit (Russisch: Код Обмена Информацией, 8 бит) was "Code for Information Exchange, 8 Bit" bedeutet. Im Microsoft WindowsKOI8-R wird mit der Code-Seite Nummer 20866 zugewiesen. in IBM, KOI8-R wird Code Seite 878 zugewiesen.[1][2] Koi8-R bedeckt auch bulgarisch, wurde aber seitdem nicht zu diesem Zweck nicht verwendet CP1251 wurde akzeptiert. Die Verwendung dieser älteren Codeseiten wird durch ersetzt durch Unicode als häufigere Art, Cyrillic zusammen mit anderen Sprachen darzustellen.

Unicode wird bevorzugt KOI-8 und seine Varianten oder andere kyrillische Kodierungen in modernen Anwendungen, insbesondere im Internet, machen UTF-8 Die dominante Kodierung für Webseiten. (Zur weiteren Diskussion über die vollständige Berichterstattung von Unicode von 436 kyrillischen Buchstaben/Codepunkten, einschließlich für Altes kyrillischund wie Single-Byte-Charakter-Codierungen, wie z. Windows-1251 und Koi8 -Varianten können dies nicht bereitstellen, siehe Cyrillic Script in Unicode.))

Zeichensatz

Die folgende Tabelle zeigt die KOI8-R-Kodierung. Jedes Zeichen wird mit seinem Äquivalent gezeigt Unicode Codepunkt.

KOI8-R[3][4][5][6]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
2500

2502

250c

2510

2514

2518

251c

2524

252c

2534

253c

2580

2584

2588

258c

2590
9x
2591

2592

2593

2320

25A0

2219

221a

2248

2264

2265
NBSP
2321
°
00B0
²
00B2
·
00B7
÷
00f7
Axt
2550

2551

2552
ё
0451

2553

2554

2555

2556

2557

2558

2559

255a

255b

255c

255d

255e
BX
255f

2560

2561
Ё
0401

2562

2563

2564

2565

2566

2567

2568

2569

256a

256b

256c
©
00A9
CX ю
044e
а
0430
б
0431
ц
0446
д
0434
е
0435
ф
0444
г
0433
х
0445
и
0438
й
0439
к
043a
л
043b
м
043c
н
043d
о
043e
Dx п
043f
я
044f
р
0440
с
0441
т
0442
у
0443
ж
0436
в
0432
ь
044c
ы
044b
з
0437
ш
0448
э
044d
щ
0449
ч
0447
ъ
044a
Ex Ю
042e
А
0410
Б
0411
Ц
0426
Д
0414
Е
0415
Ф
0424
Г
0413
Х
0425
И
0418
Й
0419
К
041a
Л
041b
М
041c
Н
041d
О
041e
Fx П
041f
Я
042f
Р
0420
С
0421
Т
0422
У
0423
Ж
0416
В
0412
Ь
042c
Ы
042b
З
0417
Ш
0428
Э
042d
Щ
0429
Ч
0427
Ъ
042a

Siehe auch

Verweise

  1. ^ "SBCS -Code -Seiteninformationen - CPGID: 00878 / Name: Russisches Internet KOI8 -R". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. IBM. C-H 3-3220-050. Archiviert vom Original am 2017-02-18. Abgerufen 2017-02-18.
  2. ^ "CCSID-Informationsdokument; CCSID 878; KOI8-R Cyrillic". IBM. Abgerufen 2017-02-18.
  3. ^ Richter, Helmut (2016-01-04) [1999-08-18]. "Koi8-r.txt". 2.0. Abgerufen 2016-12-09.
  4. ^ Code Seite CPGID 00878 (PDF) (PDF), IBM
  5. ^ Code Seite CPGID 00878 (TXT), IBM
  6. ^ Internationale Komponenten für Unicode (ICU), IBM-878_P100-1996.UCM, 2002-12-03

Weitere Lektüre

Externe Links