Koi -Charakter -Codierungen
Koi (Кои) ist eine Familie von mehreren Codeseiten für die Cyrillic Drehbuch. Der Name steht für KOd oBmena informatsiey (Russisch: Код об & mal инфор & цией) was "Code für Informationsaustausch" bedeutet.
Ein besonderes Merkmal der KOI-Code-Seiten ist, dass der Text im linken links von Menschen lesbar bleibt bisschen wird abgezogen, sollte es versehentlich Geräte oder Software durchlaufen, die nur mit 7 -bit -Charakteren umgehen kann. Dies ist darauf zurückzuführen, dass die Zeichen in einer speziellen Reihenfolge platziert werden (128 Codepoints abgesehen von dem lateinischen Buchstaben, dem sie am ähnlichsten klingen), der jedoch nicht der alphabetischen Reihenfolge in jeder Sprache entspricht, die in kyrillisch geschrieben ist und die Verwendung von erfordert Nachschlagetabellen aufführen Sortierung.
Diese Kodierungen werden abgeleitet von ASCII auf der Basis einer Entsprechung zwischen lateinisch und kyrillisch (nahezu phonetisch), die bereits in verwendet wurde Russischer Dialekt des Morsecode und in MTK-2 Telegraphencode. Die ersten 26 Zeichen von а (0xe1) in KOI8-R sind а, б, ц, д, е, ф, г, х, и, й, к, л, м, н, о, я, р, С, т, у, ж, в, ь, ы, з.
KOI-7
Das ursprüngliche Koi-Encoding (1967) war eine 7-Bit-Code-Seite mit dem Namen KOI-7 (Кои-7), die keine Kleinbuchstaben enthielt. In KOI-7 werden die Codes der 31 oder 32 russischen Briefe gemäß den lateinischen Briefen angeordnet. Andere Codepunkte sind die gleichen wie in ASCII (jedoch die Dollarzeichen $ (Codepunkt 24verhexen) kann durch die ersetzt werden Universelles Währungszeichen ¤).
KOI-8
KOI-8 (Кои-8), standardisiert 1974 von GOST 19768, ist ein 8-Bit Erweiterungen von ASCII.[1][2] Ursprünglich enthielt es nur 32 Kleinbuchstaben und 31 russische Buchstaben in Großbuchstaben.
Spätere Derivate von KOI-8 bilden die Familie der Codierungen, die unterschiedlich bekannt als KOI8, Koi 8 und KOI-8.
Die Familienmitglieder sind:
- KOI8-B (mit Ёё und Ъ)[1]
- KOI8-R / Koi8-Russland zum Russisch und bulgarisch (RFC 1489).[3]
- Koi8-u / Koi8-Ukraine zum ukrainisch (RFC 2319).[3]
- Koi8-ru zum ukrainisch, Belorussian und Russisch.[4][5][6][7][8]
- KOI8-T zum Tajik.[9]
- KOI8-C, auch Koi8-Ca, ein Vorschlag für Kaukasus und Zentralasien; kaum jemals benutzt worden.[10]
- ISO-IR-1111 / Koi8-e[11] (ECMA-113 (1. Aufl., 1986),[12] Mehrsprachiger für slawische Sprachen).
- Koi8-f, Koi-8 Unified. Enthält die Buchstabenzuweisungen von Koi8-U und Koi8-E mit einer Teilmenge der Pseudografie von KOI8-R.[13][14]
- KOI8-K1 "Cyrillic-1" (definiert in CSN 36 9103, St. Sev 358-88)
- Koi8-o (ehemals Koi8-C) für Alte russische Orthographie.[15]
Zusätzlich, GOST R 34.303-92 definiert "koi-8 v1", das ist ISO-IR-153und "koi-8 n1" und "koi-8 n2", die Varianten von sind Code Seite 866.[16] Diese folgen nicht dem KOI-8-Layout.
Dkoi
Dkoi ist ein Ebcdic-basierte Codierung in verwendet in Es evm Mainframes. Es wurde nach mehreren Maßstäben definiert: GOST 19768-74 / St Sev 358-76, St Sev 358-88 / GOST 19768-93, CSN 36 9103.[17]
Es gibt zwei Varianten:
- DKOI K1 (Дкои к1), jeder kyrillische Buchstaben erhält seinen eigenen Codepunkt.
- DKOI K2 (Дкои к2), einige kyrillische Buchstaben (а, в, е, к, н, н, о, р, с, т, а, а, о, р,, у, х) werden mit visuell identisch zusammengeführt Lateinische Buchstaben.
Lateinische Varianten
Einige Kodierungen werden KOI genannt, definieren aber lateinische Alphabete:
- KOI8-CS[18] / KOI8-CS2[17] zum Tschechisch und slowakisch (Čsn (tschechischer technischer Standard) 369103, entwickelt von der Comecon. Dieser kodierte lateinisch mit Diakritik, wie in tschechisch und slowakisch als kyrillisch verwendet, aber die Grundidee war gleich - der Text sollte mit dem 8 -ten -Bit lesbar bleiben, also z. Č wurde c usw.).
- KOI8-L2 "Latin-2" (definiert in CSN 36 9103), ISO IR 139[19] (fast identisch mit ISO 8859-2 (1987), hat aber das Dollar Zeichen und das Währungszeichen ausgetauscht)
- DKOI CS2 (definiert in CSN 36 9103)[17]
- DKOI L2 (definiert in CSN 36 9103)[17]
Verweise
- ^ a b Czyborra, Roman (1998-11-30) [1998-05-25]. "Die kyrillische Charset -Suppe". Archiviert vom Original am 2016-12-03. Abgerufen 2016-12-03.
- ^ Flohr, Guido; Chernov, Andrey A. (2016) [2006]. "Lokale :: Recodedata :: Koi_8 - Konvertierungsroutinen für KOI -8". CPAN libintl-perl. 1.0. Archiviert vom Original am 2017-01-15. Abgerufen 2017-01-15.
- ^ a b Da Cruz, Frank (2010-04-02). "Kermit und MIME-Charakter-Set-Namen". Das Kermit -Projekt. Universität von Columbia, New York, USA. Archiviert vom Original am 2016-12-03. Abgerufen 2016-12-02.
- ^ Yuri Demchenko. Registrierung eines ukrainischen kyrillischen Charakters KOI8-RU (als Erweiterung der russischen Koi8-R und ISO-IR-111) (Internetentwurf). 1997. (abgelaufen).
- ^ Flohr, Guido (2016) [2006]. "Lokale :: Recodedata :: Koi8_ru - Konvertierungsroutinen für Koi8 -ru". CPAN libintl-perl. Archiviert vom Original am 2017-01-15. Abgerufen 2017-01-15.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01167 / Name: Belarusian / Ukrainian KOI8 -RU". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. IBM. C-H 3-3220-050. Archiviert vom Original am 2017-02-18. Abgerufen 2017-02-18. [1] [2]
- ^ "CCSID-Informationsdokument; CCSID 1167; KOI8-RU". IBM. Archiviert vom Original am 2017-02-18. Abgerufen 2017-02-18.
- ^ Leiser, Mark (2008) [1999-12-20]. "Koi8-Ru belorusianische/ukrainische Kyrillik zu Unicode 2.1 Mapping-Tabelle". Abteilung für Mathematische Wissenschaften, New Mexico State University. Archiviert von das Original Am 2017-02-19. Abgerufen 2017-02-18.
- ^ Flohr, Guido; Davis, Michael (2016) [2006]. "Lokale :: Recodedata :: Koi8_T - Konvertierungsroutinen für Koi8 -T". CPAN libintl-perl. Archiviert vom Original am 2017-01-15. Abgerufen 2017-01-15.
- ^ Diskussion
- ^ "Iana -Charakter setzt".
- ^ ECMA-113. 8-Bit-Single-Byte-codierte grafische Zeichensätze-lateinisches/kyrillisches Alphabet (1. Aufl., Juni 1986)
- ^ "Cyrillic Codings (Charsets). Kleine Beschreibung".
- ^ Leiser, Mark (2008) [1998-03-05]. "KOI8 Unified Cyrillic to Unicode 2.1 Mapping -Tabelle". Abteilung für Mathematische Wissenschaften, New Mexico State University. Archiviert von das Original Am 2017-02-19. Abgerufen 2017-02-18.
- ^ Serge Winitzki. Erweiterter kyrillischer Charakter Set KOI8-C (Internet Draft). 2002. (abgelaufen).
- ^ (auf Russisch) Гост р 34.303-92. Наборы 8-битных кодированых сizin лолов. 8- битный код о & siviert и о бработки ин & рацциAS. = 8-Bit-codierte Zeichensätze. 8-Bit-Code für Informationsaustausch.
- ^ a b c d Petrlik, Lukas (1996-06-19). "Der tschechische und slowakische Charakter -Coding -Chaos erklärten". CS-Codings-Faq. 1.10. Archiviert vom Original am 2016-06-21. Abgerufen 2016-06-21.
- ^ "Archivierte Kopie". Archiviert von das Original Am 2011-03-21. Abgerufen 2011-04-19.
{{}}
: CS1 Wartung: Archiviertes Kopie als Titel (Link) - ^ ISO-IR-139
Weitere Lektüre
- Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, bur; Fowler, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; Van Wingen, Johan W. (1993-03-13). "Cyrillic Coding FAQ Version 1.3". 1.3. Abgerufen 2017-02-18.
- "Kodierungen und Zeichenensätze" [Codierungen und Zeichensätze]. Robotron Technik (Virtual Computer Museum) (auf Deutsch).2016-11-29.ASCII-Code / Koi-Code. Abgerufen 2017-02-21.
Externe Links
- "Die Heimat des KOI8-R seit 1995". 1995. Abgerufen 2016-12-05.
- Hohlov, yu. E. "Cyrillic Information Repräsentation in elektronischer Form - Zeichensatz (Code -Seite) Tabellen". Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05.
- Nechayev, Valentin (2013) [2001]. "Überprüfung des 8-Bit-Cyrillic Codings-Universums". Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05.