Windows-1251
Mime / Iana | Windows-1251 |
---|---|
Alias (e) | CP1251 (Codepage 1251) |
Sprachen) | Russisch, ukrainisch, Belarussisch, bulgarisch, Serbisch kyrillisch, Bosnisch -kyrillisch, mazedonisch, Rusyn, Englisch |
Erstellt von | Microsoft |
Standard | Waswg Codierungsstandard |
Einstufung | erweiterte ASCII, Windows-125x |
Andere verwandte Kodierungen (en) | Amiga-1251, KZ-1048, RFC 1345s "ecma-cyrillisch" |
Windows-1251 ist ein 8-Bit Zeichenkodierung, entwickelt, um Sprachen abzudecken, die die verwenden Cyrillic Drehbuch wie zum Beispiel Russisch, ukrainisch, Belarussisch, bulgarisch, Serbisch kyrillisch, mazedonisch und andere Sprachen.
Es ist die zweitreichste Einzelbyte-Charakter-Codierung der Welt und die am häufigsten verwendete Personen, die Cyrillic unterstützen. Ab März 2022[aktualisieren], 0,5% aller Websites Verwenden Sie Windows-1251.[1][2] Es wird jedoch von 7,8% der russischen (.ru) Websites verwendet.[3][4][5] Wo es die zweitbeliebteste Wahl nach UTF-8 ist. In Linux wird die Codierung als CP1251 bezeichnet.[6] IBM Verwendet Code Seite 1251 (Ccsid 1251 und Eurozeichen Erweitert CCSID 5347) für Windows-1251.[7][8][9][10][11][12][13]
Windows-1251 und KOI8-R (oder es ukrainisch Variante Koi8-u) werden viel häufiger verwendet als ISO 8859-5 (was "von weniger als 0,1% der Websites verwendet wird").[14] Im Kontrast zu Windows-1252 und ISO 8859-1Windows-1251 ist nicht eng mit ISO 8859-5 verwandt.
Unicode wird Windows-1251 oder anderen kyrillischen Kodierungen in modernen Anwendungen, insbesondere im Internet, bevorzugt UTF-8 Die dominante Kodierung für Webseiten. (Zur weiteren Diskussion über die vollständige Berichterstattung von Unicode von 436 kyrillischen Buchstaben/Codepunkten, einschließlich für Altes kyrillischund wie Single-Byte-Zeichen-Codierungen wie Windows-1251 und KOI8-Rkann dies nicht bereitstellen, siehe Cyrillic Script in Unicode.))
Zeichensatz
Die folgende Tabelle zeigt Windows-1251. Jeder Charakter wird mit seinem dargestellt Unicode Äquivalent und seines ALT -Code.
Windows-1251[15] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Soh | Stx | ETX | Eot | Enq | Ack | Bel | BS | Ht | Lf | Vt | Ff | Cr | ALSO | Si |
1x | Dle | DC1 | DC2 | DC3 | DC4 | Nak | Syn | ETB | KANN | Em | Sub | ESC | Fs | Gs | Rs | UNS |
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | Del |
8x | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Љ | ‹ | Њ | Ќ | Ћ | Џ |
9x | ђ | ‘ | ’ | “ | ” | • | – | — | ™ | љ | › | њ | ќ | ћ | џ | |
Axt | NBSP | Ў | ў | Ј | ¤ | Ґ | ¦ | § | Ё | © | Є | « | ¬ | SCHÜCHTERN | ® | Ї |
BX | ° | ± | І | і | ґ | µ | ¶ | · | ё | № | є | » | ј | Ѕ | ѕ | ї |
CX | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
Dx | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
Ex | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
Fx | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
Kasachische Variante
Eine veränderte Version von Windows-1251 wurde in standardisiert Kasachstan Als kasachischer Standard -STRK1048 und durch das Etikett bekannt KZ-1048
. Es unterscheidet sich in den unten gezeigten Zeilen:
KZ-1048 (STRK1048-2002)[16] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
8x | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Љ | ‹ | Њ | Қ | Һ | Џ |
9x | ђ | ‘ | ’ | “ | ” | • | – | — | ™ | љ | › | њ | қ | һ | џ | |
Axt | NBSP | Ұ | ұ | Ә | ¤ | Ө | ¦ | § | Ё | © | Ғ | « | ¬ | SCHÜCHTERN | ® | Ү |
BX | ° | ± | І | і | ө | µ | ¶ | · | ё | № | ғ | » | ә | Ң | ң | ү |
Amiga -Variante
Mime / Iana | Amiga-1251 |
---|---|
Alias (e) | AMI1251 |
Sprachen) | Englisch, Russisch |
Einstufung | erweiterte ASCII |
Bezogen auf | Windows-1251, ISO-8859-1, ISO-8859-15 |
Russisch Amiga OS Systeme verwendeten eine Version von Code Seite 1251, die Windows-1251 für die entspricht Russische Untergruppe der kyrillischen Buchstaben, aber ansonsten folgt meistens ISO-8859-1. Diese Version ist bekannt als Amiga-1251,[17] unter welchem Namen ist es mit dem registriert Iana.[18]
Amiga-1251[17] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
8x | Xxx | Xxx | BPH | NBH | Ind | Nel | SSA | ESA | HTS | Htj | VTS | PLD | Plu | Ri | SS2 | SS3 |
9x | DCS | PU1 | PU2 | Sts | CCH | MW | SPA | EPA | SOS | Xxx | Sci | CSI | St | OSC | PM | APC |
Axt | NBSP | ¡ | ¢ | £ | €[a] | ¥ | ¦ | § | Ё | © | №[b] | « | ¬ | SCHÜCHTERN | ® | ¯ |
BX | ° | ± | ² | ³ | ´ | µ | ¶ | · | ё | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
- ^ Matching ISO-8859-15; an einem anderen Ort als in Windows-1251
- ^ In Windows-1251 vorhanden, aber an einem anderen Ort (fehlt in ISO-8859-1/15)
Verweise
- ^ "Historische Trends bei der Verwendung von Charaktercodings, März 2022". Abgerufen 2022-03-16.
- ^ "Häufig gestellte Fragen".
- ^ "Verteilung von Charaktercodierungen auf Websites, die .RU verwenden". w3techs.com. Abgerufen 2022-03-30.
- ^ "Verteilung von Charaktercodierungen auf Websites, die Russisch verwenden". w3techs.com. Abgerufen 2021-10-07.
- ^ "Verteilung von Charaktercodierungen auf Websites, die die russische Föderation verwenden". w3techs.com. Abgerufen 2021-11-05.
- ^ "CP1251 (7) - Linux Manual Page". Man7.org. Abgerufen 2018-07-01.
- ^ "Code Seite 1251 Informationsdokument". Archiviert von das Original Am 2016-03-03.
- ^ "CCSID 1251 Informationsdokument". Archiviert von das Original Am 2014-11-29.
- ^ "CCSID 5347 Informationsdokument". Archiviert von das Original Am 2014-11-29.
- ^ Code Seite CPGID 01251 (PDF) (PDF), IBM
- ^ Code Seite CPGID 01251 (TXT), IBM
- ^ Internationale Komponenten für Unicode (ICU), IBM-1251_P100-1995.UCM, 2002-12-03
- ^ Internationale Komponenten für Unicode (ICU), IBM-5347_P100-1998.UCM, 2002-12-03
- ^ "Verwendungsstatistik von Charaktercodierungen für Websites". w3techs.com. Archiviert vom Original am 2012-05-30.
- ^ Steele, Shawn (1998). CP1251 zu Unicode -Tabelle. Unicode -Konsortium. Cp1251.txt.
- ^ Whistler, Ken (2007). KZ-1048 bis Unicode. Unicode -Konsortium. KZ1048.txt.
- ^ a b Malyshev, Michael (2003). "Amiga-1251 zu Unicode Table". Registrierung von New Charset [Amiga-1251]. Iana.
- ^ "Charaktersätze". Iana.
Weitere Lektüre
- Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, bur; Fowler, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; Van Wingen, Johan W. (1993-03-13). "Cyrillic Coding FAQ Version 1.3". Abgerufen 2020-06-24.
Externe Links
- Windows 1251 Referenzdiagramm
- Iana Charset Name Registrierung
- Unicode -Zuordnungen von Windows 1251 mit "Best Fit"
- Universeller kyrillischer Decoder, ein Online -Programm, das dazu beitragen kann, sich unlesbar zu erholen Kyrillische Texte mit zerbrochenem Windows-1251 oder anderen Charaktercodierungen.