ISO/IEC 8859-8

ISO-8859-8: Latein/Hebräisch
Mime / Iana ISO-8859-8
Alias ​​(e) ISO-IR-138, Hebräisch, csiolatinHebräisch[1]
Sprachen) hebräisch, Englisch
Standard ISO/IEC 8859-8, ECMA-121, SI 1311
Einstufung erweiterte ASCII, ISO 8859
Bezogen auf Dec Hebräisch (8-Bit), ISO/IEC 8859-1
Andere verwandte Kodierungen (en) Windows-1255

ISO/IEC 8859-8, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 8: Latein/Hebräisch Alphabet, ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen. ISO/IEC 8859-8: 1999 Ab 1999 repräsentiert die zweite und aktuelle Revision, die der ersten Ausgabe vorausgeht ISO/IEC 8859-8: 1988 1988. Es wird informell als als bezeichnet Latein/Hebräisch. ISO/IEC 8859-8 deckt alle ab Hebräische Briefe, aber nein Hebräische Vokalzeichen. IBM zugewiesen Codepage 916 (Ccsids 916 und 5012).[2][3][4] Dieser Charakter -Set wurde auch von übernommen von Israelischer Standard SI1311: 2002 mit einigen Erweiterungen.

ISO-8859-8 ist der Iana Bevorzugter Charset -Name für diesen Standard, wenn er mit dem ergänzt ist C0- und C1 -Kontrollcodes aus ISO/IEC 6429. Der Text ist (normalerweise) in logischer Reihenfolge so Bidi Für die Anzeige ist die Verarbeitung erforderlich. Nominell ISO-8859-8 (Code Seite 28598) ist für „visuelle Ordnung“ und ISO-8859-8-I (Code Seite 38598) ist für logische Reihenfolge. Aber normalerweise in der Praxis und erforderlich für XML -Dokumente, ISO-8859-8 steht auch für logische Bestelltext. Das Waswg Codierungsstandard verwendet von HTML5 Behandelt ISO-8859-8 und ISO-8859-8-I als unterschiedliche Kodierungen mit der gleichen Zuordnung aufgrund des Einflusses auf die Layout -Richtung, stellt jedoch fest, dass dies nicht mehr zu gilt ISO-8859-6 (Arabisch), nur zu ISO-8859-8.[5]

Es gibt auch ISO-8859-8-e Was angeblich erfordert, dass die Direktionalität explizit mit speziellen Kontrollfiguren angegeben wird; Diese letztere Variante ist in der Praxis nicht genutzt.

Das Microsoft Windows Code -Seite für Hebräisch, Windows-1255ist meistens eine Erweiterung von ISO/IEC 8859-8 ohne C1-Kontrollen, mit Ausnahme des Auslassens des doppelten Unterstrichs und des Austauschs des generischen Währungszeichens (¤) mit dem Sheqel Zeichen (₪). Es fügt Unterstützung für die Unterstützung Vokalpunkte als Kombination von Charakteren und einige zusätzliche Zeichensetzung.

Über ein Jahrzehnt nach der Veröffentlichung dieses Standards, Unicode ist vorgezogen, zumindest für das Internet[6] (Bedeutung UTF-8, die dominante Codierung für Webseiten). ISO-8859-8 wird von weniger als 0,1% der Websites verwendet.[7]

Code -Seitenlayout

ISO/IEC 8859-8[8][9][10][11]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x
Axt NBSP ¢ £ ¤ ¥ ¦ § ¨ © × « ¬ SCHÜCHTERN ® ¯
BX ° ± ² ³ ´ µ · ¸ ¹ ÷ » ¼ ½ ¾
CX
Dx
Ex א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן
Fx נ ס ע ף פ ץ צ ק ר ש ת LRM Rlm
 Anders als beidem Dec Hebräisch (8-Bit) und ISO-8859-1.

FD ist links nach rechts (U+200e) und Fe ist rechts nach links (U+200F), wie in einer neueren Änderung als ISO/IEC 8859-8: 1999 angegeben.

2002 israelische Standardverlängerungen

Israeli Standard SI1311: 2002 Übereinstimmung mit ISO/IEC 8859-8: 1999 mit Ausnahme einer Reihe zusätzlicher Charakterzuweisungen für die Eurozeichen, Neues Schekel Zeichen und fortgeschrittener explizite bidirektionale Formatierung.[12]

SI1311: 2002[12]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
Dx Lro Rlo PDF
Ex א ב ג ד ה ו ז ח ט י ך כ ל ם מ ן
Fx נ ס ע ף פ ץ צ ק ר ש ת Lre RLE LRM Rlm
 Fehlen von ISO/IEC 8859-8: 1999, hinzugefügt in SI1311: 2002.

Siehe auch

Verweise

  1. ^ Zeichensätze, Internet zugewiesene Zahlen Autorität (IANA), 2018-12-12
  2. ^ "Code Seite 916 Informationsdokument". Archiviert von das Original Am 2017-02-16.
  3. ^ "CCSID 916 Informationsdokument". Archiviert von das Original Am 2014-11-29.
  4. ^ "CCSID 5012 Informationsdokument". Archiviert von das Original am 2016-03-27.
  5. ^ Van Kesteren, Anne. "9. Legacy Single-Byte Codings". Codierungsstandard. Waswg. Hinweis: ISO-8859-8 und ISO-8859-8-I sind unterschiedliche Codierungsnamen, da ISO-8859-8 Einfluss auf die Layout-Richtung hat. Und obwohl dies historisch gesehen bei ISO-8859-6 und "ISO-8859-6-I"Auch das ist nicht mehr wahr.
  6. ^ John, Nicholas A. (2013). "Die Konstruktion des mehrsprachigen Internets: Unicode, Hebräisch und Globalisierung". Journal of Computer-vermittelter Kommunikation. 18 (3): 321–338. doi:10.1111/jcc4.12015. ISSN 1083-6101. Hintergrund: Das Problem des Hebräischen und des Internets
  7. ^ "Nutzungsstatistik von ISO-8859-8 für Websites, Januar 2019". w3techs.com. Abgerufen 2019-01-17.
  8. ^ Code Seite CPGID 00916 (PDF) (PDF), IBM
  9. ^ Code Seite CPGID 00916 (TXT), IBM
  10. ^ Internationale Komponenten für Unicode (ICU), IBM-916_P100-1995.UCM, 2002-12-03
  11. ^ Internationale Komponenten für Unicode (ICU), IBM-5012_P100-1999.UCM, 2002-12-03
  12. ^ a b Standards Institution Israels. ISO-IR-234: Latein/hebräisches Zeichen für 8-Bit-Codes (PDF). Itcj/Ipsj.

Externe Links