ISO/IEC 8859-6

ISO-8859-6 (ASMO 708)
Mime / Iana ISO-8859-6
Alias ​​(e) ISO-IR-127, ECMA-114, ASMO-708, Arabisch, Csiolatinarabic[1]
Standard ASMO 708, ECMA-114, ISO/IEC 8859-6
Einstufung erweiterte ASCII, ISO 8859
Erweiterungen OEM-708, Mac OS Arabisch (fast)
Vorausgegangen von ASMO 449
Andere verwandte Kodierungen (en) Windows-1256 (Inkompatibel, bewegt mehrere Buchstaben)

ISO/IEC 8859-6: 1999, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 6: Latein/arabisches Alphabet, ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen, Erstausgabe, veröffentlicht 1987. Es wird informell als als bezeichnet Latein/Arabisch. Es wurde entwickelt, um abzudecken Arabisch. Nur nominale Buchstaben sind codiert, keine vorverlagten Formen der Buchstaben, sodass für die Anzeige eine Formungsverarbeitung erforderlich ist. Es enthält nicht die zusätzlichen Buchstaben, die erforderlich sind, um die meisten arabisch-skriptischen Sprachen als Arabisch selbst zu schreiben (wie Persisch, Urdu usw.).

ISO-8859-6 ist der Iana Bevorzugter Charset -Name für diesen Standard, wenn er mit dem ergänzt ist C0- und C1 -Kontrollcodes aus ISO/IEC 6429. Der Text ist also in logischer Reihenfolge, also Bidi Für die Anzeige ist die Verarbeitung erforderlich. Nominell ISO-8859-6 (Code Seite 28596) ist für "visuelle Ordnung" und ISO-8859-6-I (Code Seite 38596) ist für logische Reihenfolge. Aber in der Praxis und erforderlich für HTML- und XML -Dokumente, ISO-8859-6 steht auch für logische Bestelltext. Es gibt auch ISO-8859-6-e Was angeblich erfordert, dass die Direktionalität explizit mit speziellen Kontrollfiguren angegeben wird; Diese letztere Variante ist in der Praxis nicht genutzt. IBM hat zugewiesen Codepage/Ccsid 1089 zu ISO 8859-6.[2][3] Es ist eine Emulation für ihre AIX Betriebssystem.

ISO-8859-6 ist jetzt technologisch veraltet,[4] und Unicode wird in modernen Anwendungen bevorzugt, insbesondere im Internet; das bedeutet das Dominante UTF-8 Codierung für Webseiten (siehe auch Arabische Schrift in UnicodeFür die vollständige Abdeckung, im Gegensatz zu z. ISO-8859-6 oder Windows 1256 das bedeckt keine Extras). 0,1% aller Webseiten verwenden ISO-8859-6.[5][6]

Geschichte

ASMO 708 wurde vom inzwischen nicht mehr existierenden Start entwickelt Arabische Standardisierung und Metrologieorganisation[7] 1986 als 8-Bit-Standard für arabischsprachige Länder. Das Design dieses Charakterssatzes wurde vom vorherigen 7-Bit-Standard inspiriert- ASMO 449 -Aber es ist nicht einfach das 7-Bit-Zeichen, das in den oberen Teil bewegt wurde; Es gibt einige Unterschiede.

ASMO 708 ist a bidirektional Zeichensatz. Der untere Teil des Zeichensatzes unterscheidet sich vom Standard ISO 646 in den Ziffern und in einigen Interpunktion. Abhängig vom Kontext (ob sich die Zahlen innerhalb des lateinischen Skripts oder im arabischen Skript befinden) werden die Ziffern entweder als lateinische Ziffern oder als arabische Ziffern gerendert. Abhängig vom Kontext werden symmetrische Interpunktionsmarkierungen umgekehrt, d. H. Wenn es eine Eröffnungszeichenzeichen gibt, wird die Form gemäß der Richtung des Skripts unterschiedlich gerendert.

Der obere Teil des Charakters hat nur die arabischen Buchstaben, die arabische Interpunktion, die sich von der lateinischen Interpunktion unterscheidet, sowie wenige andere Zeichen.

ASMO 708 wurde in enger Zusammenarbeit entwickelt[8] mit ECMA, das es als seine eigene annahm ECMA-114 Standard im Jahr 1986. Es wurde auch als genehmigt ISO -Standard wie ISO 8859-6.[9] Es war auch in der registriert Internationales Register der codierten Zeichensätze wie Ir 127[10] 1986.

Beziehung zu anderen Charaktersätzen

Einige andere Zeichensätze beziehen sich auf ASMO 708:

  • ASMO 708/Französisch 1[11] fügt französische Unterkoffer hinzu.
  • Französisch 1/ASMO 708[11] Fügt französische Unterkoffer in ihren ISO 8859-1-Codepunkten hinzu und Verstöße die arabischen;
  • ISO/IR 167[12] fügt französische und deutsche Charaktere hinzu;
  • Microsoft Code Seite 708Für MS-DOS fügt französische Zeichen in ihren typischen Codepunkten aus Code Seite 437 hinzu und fügt Box-Drawing-Zeichen hinzu.
  • Sowohl Microsoft Code Seite 710 (transparentes Arabisch) als auch Microsoft's Code Seite 720 (Transparentes ASMO) Fügen Sie für MS-DOs französische Zeichen in ihren typischen Codepunkten aus Code Seite 437 hinzu, aber jedoch Verstöße Die arabischen Zeichen, mit denen die Box-Zeichnungszeichen von Code Seite 437 in ihren ursprünglichen Codepunkten befinden können;
  • Microsoft Windows 1256 fügt französische Unterkoffer in ihren Füßen hinzu Windows 1252 Codepunkte und Verstöße die arabischen;

Codediagramm

ISO/IEC 8859-6[13][14][15][16]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ %/٪ & ' ( ) */٭ + , - . /
3x 0/٠ 1/١ 2/٢ 3/٣ 4/٤ 5/٥ 6/٦ 7/٧ 8/٨ 9/٩ : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x
Axt NBSP ¤ ، SCHÜCHTERN
BX ؛ ؟
CX ء آ أ ؤ إ ئ ا ب ة ت ث ج ح خ د
Dx ذ ر ز س ش ص ض ط ظ ع غ
Ex ـ ف ق ك ل م ن ه و ى ي ◌ً ◌ٌ ◌ٍ ◌◌ ◌ُ
Fx ◌ِ ◌ّ ◌ْ

Codewerte 0xEB - 0xf2 werden zugewiesen Charaktere kombinieren.

Siehe auch

Verweise

  1. ^ Zeichensätze, Internet zugewiesene Zahlen Autorität (IANA), 2018-12-12
  2. ^ "Code Seite 1089 Informationsdokument". Archiviert von das Original Am 2016-03-17.
  3. ^ "CCSID 1089 Informationsdokument". Archiviert von das Original am 2016-03-27.
  4. ^ Computing und der Koran - einige Vorbehalte, 2007, Thomas Milo
  5. ^ "Nutzungsstatistik von ISO-8859-6 für Websites, Januar 2019". w3techs.com. Abgerufen 2019-01-17.
  6. ^ "Häufige Fragen gestellt".
  7. ^ Le Codage Informatique de l’ Écritor Arabe: d’asmo 449 à unicode et iso/cei 10646
  8. ^ Standard ECMA-114
  9. ^ ISO/IEC 8859-6: 1999
  10. ^ "Rechte Teil des lateinischen/arabischen Alphabets" (PDF). Archiviert von das Original (PDF) Am 2016-12-21. Abgerufen 2017-02-20.
  11. ^ a b Referenzhandbuch von Printronix ACA Emulationsprogrammiererin
  12. ^ Arabisch/Französisch/Deutsch Set
  13. ^ "ISO 8859-6: 1999 zu Unicode". 1999-07-27.
  14. ^ Code Seite CPGID 01089 (PDF) (PDF), IBM
  15. ^ Code Seite CPGID 01089 (TXT), IBM
  16. ^ Internationale Komponenten für Unicode (ICU), IBM-1089_P100-1995.UCM, 2002-12-03

Externe Links