Windows-1256

Windows-1256
Mime / Iana Windows-1256
Alias ​​(e) CP1256 (Codepage 1256)
Sprachen) Arabisch, persisch, Urdu, Englisch, Französisch (außer Großbuchstaben mit Diakritik)
Erstellt von Microsoft
Standard Waswg Codierungsstandard
Einstufung erweiterte ASCII, Windows-125x

Windows-1256 ist ein Codepage untergebracht Microsoft Windows schreiben Arabisch und andere Sprachen, die verwenden Arabische Schrift, wie zum Beispiel persisch und Urdu.

Diese Code -Seite ist nicht kompatibel mit ISO-8859-6 und Makkarabisch Codierungen.

Windows-1256 codiert alle abstrakt Einzelbuchstaben des grundlegenden arabischen Alphabets, nicht jede konkrete visuelle Form von isolierten, anfänglichen, medialen, endgültigen oder ligaturierten Buchstabenformvarianten (d. H. Es codiert Zeichen, nicht Glyphen). Die arabischen Buchstaben im C0-FF-Bereich befinden sich in der arabischen alphabetischen Reihenfolge, aber einige lateinische Zeichen sind zwischen ihnen durchsetzt. Das sind ein paar Windows-1252 Lateinische Zeichen verwendet für FranzösischDa diese europäische Sprache in ehemaligen französischen Kolonien in Nordafrika wie z. B. historische Relevanz hat Marokko und Algerien. Dies ermöglichte es, bei der Verwendung von Windows 1256 ohne Codes-Page-Schalter abgemischt zu werden (es wurden jedoch keine Buchstaben mit einer Codeseitenschaltung vorliegen (es wurden jedoch nicht enthalten).

IBM Verwendet Code Seite 1256 (Ccsid 1256, Eurozeichen Erweiterte CCSID 5352 und das weitere erweiterte CCSID 9448) für Windows-1256.[1][2][3][4]

Unicode wird in modernen Anwendungen gegenüber Windows 1256 bevorzugt, insbesondere im Internet; das bedeutet das Dominante UTF-8 Codierung für Webseiten (siehe auch Arabische Schrift in UnicodeFür die vollständige Abdeckung, im Gegensatz zu z. Windows 1256 oder ISO-8859-6 das bedeckt keine Extras). Weniger als 0,1% aller Webseiten verwenden Windows-1256 im September 2019.[5][6]

Zeichensatz

Seit dem Original Codepage Links 9 Werte (Bytes), die in der ursprünglichen Spezifikation als "nicht verwendet" markiert sind,[7] Diese Bytes wurden später für zusätzliche Zeichen verwendet, die für die benötigt wurden PERSO-ARABISCHE SCHRIPT (für die persisch und Urdu Sprachen) und die Eurozeichen.[8]

Die folgende Tabelle zeigt die erweiterte Version von Windows-1256. Jeder Charakter wird mit seinem dargestellt Unicode Äquivalent und sein Dezimalcode.

Hier wird jeder arabische Buchstaben in isolierter Form dargestellt. Die tatsächlichen Formen der Buchstaben in arabischen Wörtern werden durch eine Kombination aus Softwaregeln und geeigneten Schriftunterstützung erzeugt.

Windows-1256[8][9][10][11][12][13][14]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x Nul Soh Stx ETX Eot Enq Ack Bel BS Ht Lf Vt Ff Cr ALSO Si
1x Dle DC1 DC2 DC3 DC4 Nak Syn ETB KANN Em Sub ESC Fs Gs Rs UNS
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ Del
8x پ ƒ ˆ ٹ Œ چ ژ ڈ
9x گ ک ڑ œ Zwnj Zwj ں
Axt NBSP ، ¢ £ ¤ ¥ ¦ § ¨ © ھ « ¬ SCHÜCHTERN ® ¯
BX ° ± ² ³ ´ µ · ¸ ¹ ؛ » ¼ ½ ¾ ؟
CX ہ ء آ أ ؤ إ ئ ا ب ة ت ث ج ح خ د
Dx ذ ر ز س ش ص ض × ط ظ ع غ ـ ف ق ك
Ex à ل â م ن ه و ç è é ê ë ى ي î ï
Fx ً ٌ ٍ َ ô ُ ِ ÷ ّ ù ْ û ü LRM Rlm ے
 Unterschiede aus Windows-1252

Siehe auch

Verweise

  1. ^ "Code Seite 1256 Informationsdokument". Archiviert von das Original Am 2016-03-03.
  2. ^ "CCSID 1256 Informationsdokument". Archiviert von das Original am 2016-03-27.
  3. ^ "CCSID 5352 Informationsdokument". Archiviert von das Original Am 2014-11-29.
  4. ^ "CCSID 9448 Informationsdokument". Archiviert von das Original Am 2014-11-29.
  5. ^ "Historische Trends bei der Verwendung von Charaktercodierungen für Websites, September 2019". w3techs.com.
  6. ^ "Häufig gestellte Fragen". w3techs.com.
  7. ^ Archivierte Docs. "Code Seite 1256 Windows Arabic". docs.microsoft.com.
  8. ^ a b "CP1256 zu Unicode Tabelle" (PDF). www.unicode.org. Abgerufen 2019-05-31.
  9. ^ Unicode -Zuordnungen von Windows 1256 mit "Best Fit"
  10. ^ Code Seite CPGID 01256 (PDF) (PDF), IBM
  11. ^ Code Seite CPGID 01256 (TXT), IBM
  12. ^ Internationale Komponenten für Unicode (ICU), IBM-1256_P110-1997.UCM, 2002-12-03
  13. ^ Internationale Komponenten für Unicode (ICU), IBM-5352_P100-1998.UCM, 2002-12-03
  14. ^ Internationale Komponenten für Unicode (ICU), IBM-9448_X100-2005.UCM, 2005-11-15

Externe Links