Windows-1256
Mime / Iana | Windows-1256 |
---|---|
Alias (e) | CP1256 (Codepage 1256) |
Sprachen) | Arabisch, persisch, Urdu, Englisch, Französisch (außer Großbuchstaben mit Diakritik) |
Erstellt von | Microsoft |
Standard | Waswg Codierungsstandard |
Einstufung | erweiterte ASCII, Windows-125x |
Windows-1256 ist ein Codepage untergebracht Microsoft Windows schreiben Arabisch und andere Sprachen, die verwenden Arabische Schrift, wie zum Beispiel persisch und Urdu.
Diese Code -Seite ist nicht kompatibel mit ISO-8859-6 und Makkarabisch Codierungen.
Windows-1256 codiert alle abstrakt Einzelbuchstaben des grundlegenden arabischen Alphabets, nicht jede konkrete visuelle Form von isolierten, anfänglichen, medialen, endgültigen oder ligaturierten Buchstabenformvarianten (d. H. Es codiert Zeichen, nicht Glyphen). Die arabischen Buchstaben im C0-FF-Bereich befinden sich in der arabischen alphabetischen Reihenfolge, aber einige lateinische Zeichen sind zwischen ihnen durchsetzt. Das sind ein paar Windows-1252 Lateinische Zeichen verwendet für FranzösischDa diese europäische Sprache in ehemaligen französischen Kolonien in Nordafrika wie z. B. historische Relevanz hat Marokko und Algerien. Dies ermöglichte es, bei der Verwendung von Windows 1256 ohne Codes-Page-Schalter abgemischt zu werden (es wurden jedoch keine Buchstaben mit einer Codeseitenschaltung vorliegen (es wurden jedoch nicht enthalten).
IBM Verwendet Code Seite 1256 (Ccsid 1256, Eurozeichen Erweiterte CCSID 5352 und das weitere erweiterte CCSID 9448) für Windows-1256.[1][2][3][4]
Unicode wird in modernen Anwendungen gegenüber Windows 1256 bevorzugt, insbesondere im Internet; das bedeutet das Dominante UTF-8 Codierung für Webseiten (siehe auch Arabische Schrift in UnicodeFür die vollständige Abdeckung, im Gegensatz zu z. Windows 1256 oder ISO-8859-6 das bedeckt keine Extras). Weniger als 0,1% aller Webseiten verwenden Windows-1256 im September 2019.[5][6]
Zeichensatz
Seit dem Original Codepage Links 9 Werte (Bytes), die in der ursprünglichen Spezifikation als "nicht verwendet" markiert sind,[7] Diese Bytes wurden später für zusätzliche Zeichen verwendet, die für die benötigt wurden PERSO-ARABISCHE SCHRIPT (für die persisch und Urdu Sprachen) und die Eurozeichen.[8]
Die folgende Tabelle zeigt die erweiterte Version von Windows-1256. Jeder Charakter wird mit seinem dargestellt Unicode Äquivalent und sein Dezimalcode.
Hier wird jeder arabische Buchstaben in isolierter Form dargestellt. Die tatsächlichen Formen der Buchstaben in arabischen Wörtern werden durch eine Kombination aus Softwaregeln und geeigneten Schriftunterstützung erzeugt.
Windows-1256[8][9][10][11][12][13][14] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Soh | Stx | ETX | Eot | Enq | Ack | Bel | BS | Ht | Lf | Vt | Ff | Cr | ALSO | Si |
1x | Dle | DC1 | DC2 | DC3 | DC4 | Nak | Syn | ETB | KANN | Em | Sub | ESC | Fs | Gs | Rs | UNS |
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | Del |
8x | € | پ | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | ٹ | ‹ | Œ | چ | ژ | ڈ |
9x | گ | ‘ | ’ | “ | ” | • | – | — | ک | ™ | ڑ | › | œ | Zwnj | Zwj | ں |
Axt | NBSP | ، | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ھ | « | ¬ | SCHÜCHTERN | ® | ¯ |
BX | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | ؛ | » | ¼ | ½ | ¾ | ؟ |
CX | ہ | ء | آ | أ | ؤ | إ | ئ | ا | ب | ة | ت | ث | ج | ح | خ | د |
Dx | ذ | ر | ز | س | ش | ص | ض | × | ط | ظ | ع | غ | ـ | ف | ق | ك |
Ex | à | ل | â | م | ن | ه | و | ç | è | é | ê | ë | ى | ي | î | ï |
Fx | ً | ٌ | ٍ | َ | ô | ُ | ِ | ÷ | ّ | ù | ْ | û | ü | LRM | Rlm | ے |
Siehe auch
Verweise
- ^ "Code Seite 1256 Informationsdokument". Archiviert von das Original Am 2016-03-03.
- ^ "CCSID 1256 Informationsdokument". Archiviert von das Original am 2016-03-27.
- ^ "CCSID 5352 Informationsdokument". Archiviert von das Original Am 2014-11-29.
- ^ "CCSID 9448 Informationsdokument". Archiviert von das Original Am 2014-11-29.
- ^ "Historische Trends bei der Verwendung von Charaktercodierungen für Websites, September 2019". w3techs.com.
- ^ "Häufig gestellte Fragen". w3techs.com.
- ^ Archivierte Docs. "Code Seite 1256 Windows Arabic". docs.microsoft.com.
- ^ a b "CP1256 zu Unicode Tabelle" (PDF). www.unicode.org. Abgerufen 2019-05-31.
- ^ Unicode -Zuordnungen von Windows 1256 mit "Best Fit"
- ^ Code Seite CPGID 01256 (PDF) (PDF), IBM
- ^ Code Seite CPGID 01256 (TXT), IBM
- ^ Internationale Komponenten für Unicode (ICU), IBM-1256_P110-1997.UCM, 2002-12-03
- ^ Internationale Komponenten für Unicode (ICU), IBM-5352_P100-1998.UCM, 2002-12-03
- ^ Internationale Komponenten für Unicode (ICU), IBM-9448_X100-2005.UCM, 2005-11-15