Windows-1251

Windows-1251
Mime / Iana Windows-1251
Alias ​​(e) CP1251 (Codepage 1251)
Sprachen) Russisch, ukrainisch, Belarussisch, bulgarisch, Serbisch kyrillisch, Bosnisch -kyrillisch, mazedonisch, Rusyn, Englisch
Erstellt von Microsoft
Standard Waswg Codierungsstandard
Einstufung erweiterte ASCII, Windows-125x
Andere verwandte Kodierungen (en) Amiga-1251, KZ-1048,
RFC 1345s "ecma-cyrillisch"

Windows-1251 ist ein 8-Bit Zeichenkodierung, entwickelt, um Sprachen abzudecken, die die verwenden Cyrillic Drehbuch wie zum Beispiel Russisch, ukrainisch, Belarussisch, bulgarisch, Serbisch kyrillisch, mazedonisch und andere Sprachen.

Es ist die zweitreichste Einzelbyte-Charakter-Codierung der Welt und die am häufigsten verwendete Personen, die Cyrillic unterstützen. Ab März 2022, 0,5% aller Websites Verwenden Sie Windows-1251.[1][2] Es wird jedoch von 7,8% der russischen (.ru) Websites verwendet.[3][4][5] Wo es die zweitbeliebteste Wahl nach UTF-8 ist. In Linux wird die Codierung als CP1251 bezeichnet.[6] IBM Verwendet Code Seite 1251 (Ccsid 1251 und Eurozeichen Erweitert CCSID 5347) für Windows-1251.[7][8][9][10][11][12][13]

Windows-1251 und KOI8-R (oder es ukrainisch Variante Koi8-u) werden viel häufiger verwendet als ISO 8859-5 (was "von weniger als 0,1% der Websites verwendet wird").[14] Im Kontrast zu Windows-1252 und ISO 8859-1Windows-1251 ist nicht eng mit ISO 8859-5 verwandt.

Unicode wird Windows-1251 oder anderen kyrillischen Kodierungen in modernen Anwendungen, insbesondere im Internet, bevorzugt UTF-8 Die dominante Kodierung für Webseiten. (Zur weiteren Diskussion über die vollständige Berichterstattung von Unicode von 436 kyrillischen Buchstaben/Codepunkten, einschließlich für Altes kyrillischund wie Single-Byte-Zeichen-Codierungen wie Windows-1251 und KOI8-Rkann dies nicht bereitstellen, siehe Cyrillic Script in Unicode.))

Zeichensatz

Die folgende Tabelle zeigt Windows-1251. Jeder Charakter wird mit seinem dargestellt Unicode Äquivalent und seines ALT -Code.

Windows-1251[15]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x Nul Soh Stx ETX Eot Enq Ack Bel BS Ht Lf Vt Ff Cr ALSO Si
1x Dle DC1 DC2 DC3 DC4 Nak Syn ETB KANN Em Sub ESC Fs Gs Rs UNS
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ Del
8x Ђ Ѓ ѓ Љ Њ Ќ Ћ Џ
9x ђ љ њ ќ ћ џ
Axt NBSP Ў ў Ј ¤ Ґ ¦ § Ё © Є « ¬ SCHÜCHTERN ® Ї
BX ° ± І і ґ µ · ё є » ј Ѕ ѕ ї
CX А Б В Г Д Е Ж З И Й К Л М Н О П
Dx Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
Ex а б в г д е ж з и й к л м н о п
Fx р с т у ф х ц ч ш щ ъ ы ь э ю я
 Unterschiede aus Windows-1252

Kasachische Variante

Eine veränderte Version von Windows-1251 wurde in standardisiert Kasachstan Als kasachischer Standard -STRK1048 und durch das Etikett bekannt KZ-1048. Es unterscheidet sich in den unten gezeigten Zeilen:

KZ-1048 (STRK1048-2002)[16]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
8x Ђ Ѓ ѓ Љ Њ Қ Һ Џ
9x ђ љ њ қ һ џ
Axt NBSP Ұ ұ Ә ¤ Ө ¦ § Ё © Ғ « ¬ SCHÜCHTERN ® Ү
BX ° ± І і ө µ · ё ғ » ә Ң ң ү
 Unterschiede zu Windows-1251

Amiga -Variante

Amiga-1251
Mime / Iana Amiga-1251
Alias ​​(e) AMI1251
Sprachen) Englisch, Russisch
Einstufung erweiterte ASCII
Bezogen auf Windows-1251, ISO-8859-1, ISO-8859-15

Russisch Amiga OS Systeme verwendeten eine Version von Code Seite 1251, die Windows-1251 für die entspricht Russische Untergruppe der kyrillischen Buchstaben, aber ansonsten folgt meistens ISO-8859-1. Diese Version ist bekannt als Amiga-1251,[17] unter welchem ​​Namen ist es mit dem registriert Iana.[18]

Amiga-1251[17]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
8x Xxx Xxx BPH NBH Ind Nel SSA ESA HTS Htj VTS PLD Plu Ri SS2 SS3
9x DCS PU1 PU2 Sts CCH MW SPA EPA SOS Xxx Sci CSI St OSC PM APC
Axt NBSP ¡ ¢ £ [a] ¥ ¦ § Ё © [b] « ¬ SCHÜCHTERN ® ¯
BX ° ± ² ³ ´ µ · ё ¹ º » ¼ ½ ¾ ¿
 Anders von Windows-1251 bis zu ISO-8859-1 entspricht
 Anders als sowohl Windows-1251 als auch ISO-8859-1
  1. ^ Matching ISO-8859-15; an einem anderen Ort als in Windows-1251
  2. ^ In Windows-1251 vorhanden, aber an einem anderen Ort (fehlt in ISO-8859-1/15)

Verweise

  1. ^ "Historische Trends bei der Verwendung von Charaktercodings, März 2022". Abgerufen 2022-03-16.
  2. ^ "Häufig gestellte Fragen".
  3. ^ "Verteilung von Charaktercodierungen auf Websites, die .RU verwenden". w3techs.com. Abgerufen 2022-03-30.
  4. ^ "Verteilung von Charaktercodierungen auf Websites, die Russisch verwenden". w3techs.com. Abgerufen 2021-10-07.
  5. ^ "Verteilung von Charaktercodierungen auf Websites, die die russische Föderation verwenden". w3techs.com. Abgerufen 2021-11-05.
  6. ^ "CP1251 (7) - Linux Manual Page". Man7.org. Abgerufen 2018-07-01.
  7. ^ "Code Seite 1251 Informationsdokument". Archiviert von das Original Am 2016-03-03.
  8. ^ "CCSID 1251 Informationsdokument". Archiviert von das Original Am 2014-11-29.
  9. ^ "CCSID 5347 Informationsdokument". Archiviert von das Original Am 2014-11-29.
  10. ^ Code Seite CPGID 01251 (PDF) (PDF), IBM
  11. ^ Code Seite CPGID 01251 (TXT), IBM
  12. ^ Internationale Komponenten für Unicode (ICU), IBM-1251_P100-1995.UCM, 2002-12-03
  13. ^ Internationale Komponenten für Unicode (ICU), IBM-5347_P100-1998.UCM, 2002-12-03
  14. ^ "Verwendungsstatistik von Charaktercodierungen für Websites". w3techs.com. Archiviert vom Original am 2012-05-30.
  15. ^ Steele, Shawn (1998). CP1251 zu Unicode -Tabelle. Unicode -Konsortium. Cp1251.txt.
  16. ^ Whistler, Ken (2007). KZ-1048 bis Unicode. Unicode -Konsortium. KZ1048.txt.
  17. ^ a b Malyshev, Michael (2003). "Amiga-1251 zu Unicode Table". Registrierung von New Charset [Amiga-1251]. Iana.
  18. ^ "Charaktersätze". Iana.

Weitere Lektüre

  • Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, bur; Fowler, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; Van Wingen, Johan W. (1993-03-13). "Cyrillic Coding FAQ Version 1.3". Abgerufen 2020-06-24.

Externe Links