KOI8-R
Alias (e) | CP878 (Codepage 878) |
---|---|
Sprachen) | Russisch, bulgarisch |
Einstufung | 8 Bit Koi, erweiterte ASCII |
Erweitert | KOI8-B |
Bezogen auf | KOI-8 |
Andere verwandte Kodierungen (en) | Koi8-u, Koi8-ru |
KOI8-R (RFC 1489) ist ein 8-Bit Zeichenkodierung, abgeleitet von der KOI-8 Codierung durch den Programmierer Andrei Chernov im Jahr 1993 und so konzipiert, dass er bedeckt ist Russisch, was a verwendet kyrillisch Alphabet. KOI8-R basierte auf Russischer Morsecode, was aus a geschaffen wurde phonetisch Version von Latein Morse-Code. Infolgedessen befinden sich russische kyrillische Buchstaben eher in pseudo-römischer Reihenfolge als in der normalen kyrillischen alphabetischen Reihenfolge. Obwohl dies unnatürlich erscheint, ist der Text bei ASCII teilweise lesbar und kann in syntaktisch korrektes konvertiert werden KOI7. Zum Beispiel " Russkij Tekst ("Russischer Text").
Koi8 steht für Kod Obmena Informatsiey, 8 -Bit (Russisch: Код Обмена Информацией, 8 бит) was "Code for Information Exchange, 8 Bit" bedeutet. Im Microsoft WindowsKOI8-R wird mit der Code-Seite Nummer 20866 zugewiesen. in IBM, KOI8-R wird Code Seite 878 zugewiesen.[1][2] Koi8-R bedeckt auch bulgarisch, wurde aber seitdem nicht zu diesem Zweck nicht verwendet CP1251 wurde akzeptiert. Die Verwendung dieser älteren Codeseiten wird durch ersetzt durch Unicode als häufigere Art, Cyrillic zusammen mit anderen Sprachen darzustellen.
Unicode wird bevorzugt KOI-8 und seine Varianten oder andere kyrillische Kodierungen in modernen Anwendungen, insbesondere im Internet, machen UTF-8 Die dominante Kodierung für Webseiten. (Zur weiteren Diskussion über die vollständige Berichterstattung von Unicode von 436 kyrillischen Buchstaben/Codepunkten, einschließlich für Altes kyrillischund wie Single-Byte-Charakter-Codierungen, wie z. Windows-1251 und Koi8 -Varianten können dies nicht bereitstellen, siehe Cyrillic Script in Unicode.))
Zeichensatz
Die folgende Tabelle zeigt die KOI8-R-Kodierung. Jedes Zeichen wird mit seinem Äquivalent gezeigt Unicode Codepunkt.
KOI8-R[3][4][5][6] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | ─ 2500 | │ 2502 | ┌ 250c | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251c | ┤ 2524 | ┬ 252c | ┴ 2534 | ┼ 253c | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258c | ▐ 2590 |
9x | ░ 2591 | ▒ 2592 | ▓ 2593 | ⌠ 2320 | ■ 25A0 | ∙ 2219 | √ 221a | ≈ 2248 | ≤ 2264 | ≥ 2265 | NBSP | ⌡ 2321 | ° 00B0 | ² 00B2 | · 00B7 | ÷ 00f7 |
Axt | ═ 2550 | ║ 2551 | ╒ 2552 | ё 0451 | ╓ 2553 | ╔ 2554 | ╕ 2555 | ╖ 2556 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255a | ╛ 255b | ╜ 255c | ╝ 255d | ╞ 255e |
BX | ╟ 255f | ╠ 2560 | ╡ 2561 | Ё 0401 | ╢ 2562 | ╣ 2563 | ╤ 2564 | ╥ 2565 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256a | ╫ 256b | ╬ 256c | © 00A9 |
CX | ю 044e | а 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | й 0439 | к 043a | л 043b | м 043c | н 043d | о 043e |
Dx | п 043f | я 044f | р 0440 | с 0441 | т 0442 | у 0443 | ж 0436 | в 0432 | ь 044c | ы 044b | з 0437 | ш 0448 | э 044d | щ 0449 | ч 0447 | ъ 044a |
Ex | Ю 042e | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041a | Л 041b | М 041c | Н 041d | О 041e |
Fx | П 041f | Я 042f | Р 0420 | С 0421 | Т 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042c | Ы 042b | З 0417 | Ш 0428 | Э 042d | Щ 0429 | Ч 0427 | Ъ 042a |
Siehe auch
- KOI8-B, eine Ableitung von KOI8-R mit nur der implementierten Buchstabenuntermenge
- Koi8-u, eine andere abgeleitete Kodierung, die hinzugefügt wird ukrainisch Figuren
- Koi -Charakter -Codierungen
- Relcom
- Windows-1251, eine weitere gemeinsame kyrillische Charakterkodierung
Verweise
- ^ "SBCS -Code -Seiteninformationen - CPGID: 00878 / Name: Russisches Internet KOI8 -R". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. IBM. C-H 3-3220-050. Archiviert vom Original am 2017-02-18. Abgerufen 2017-02-18.
- ^ "CCSID-Informationsdokument; CCSID 878; KOI8-R Cyrillic". IBM. Abgerufen 2017-02-18.
- ^ Richter, Helmut (2016-01-04) [1999-08-18]. "Koi8-r.txt". 2.0. Abgerufen 2016-12-09.
- ^ Code Seite CPGID 00878 (PDF) (PDF), IBM
- ^ Code Seite CPGID 00878 (TXT), IBM
- ^ Internationale Komponenten für Unicode (ICU), IBM-878_P100-1996.UCM, 2002-12-03
Weitere Lektüre
- Flohr, Guido; Kuss, Gabor; Chernov, Andrey A. (2016) [2006]. "Lokale :: Recodedata :: Koi8_R - Konvertierungsroutinen für KOI8 -R". CPAN libintl-perl. 1.0. Archiviert vom Original am 2017-01-15. Abgerufen 2017-01-15.
- Kostis, Kosta. "KOI8-R (Russian u*ix Codierung, auch von RELCOM verwendet)". 1.20. Archiviert vom Original am 2017-01-16. Abgerufen 2017-01-16.
- RFC1489
- "KOI8-R (RFC 1489)". Kermit. Universität von Columbia. Abgerufen 2020-06-24.
- Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, bur; Fowler, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; Van Wingen, Johan W. (1993-03-13). "Cyrillic Coding FAQ Version 1.3". 1.3. Abgerufen 2020-06-24.
Externe Links
- Universeller kyrillischer Decoder, ein Online -Programm, mit dem sich die Wiederherstellung erholen kann kyrillisch Texte mit zerbrochenem Koi8-R oder anderen Charaktercodierungen.
- "Die Heimat des KOI8-R seit 1995". 1995. Abgerufen 2016-12-05.
- Czyborra, Roman (1998-11-30) [1998-05-25]. "Die kyrillische Charset -Suppe". Archiviert vom Original am 2016-12-03. Abgerufen 2016-12-03.
- Hohlov, yu. E. "Cyrillic Information Repräsentation in elektronischer Form - Zeichensatz (Code -Seite) Tabellen". Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05.
- Nechayev, Valentin (2013) [2001]. "Überprüfung des 8-Bit-Cyrillic Codings-Universums". Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05.