ISO/IEC 8859-8
Mime / Iana | ISO-8859-8 |
---|---|
Alias (e) | ISO-IR-138, Hebräisch, csiolatinHebräisch[1] |
Sprachen) | hebräisch, Englisch |
Standard | ISO/IEC 8859-8, ECMA-121, SI 1311 |
Einstufung | erweiterte ASCII, ISO 8859 |
Bezogen auf | Dec Hebräisch (8-Bit), ISO/IEC 8859-1 |
Andere verwandte Kodierungen (en) | Windows-1255 |
ISO/IEC 8859-8, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 8: Latein/Hebräisch Alphabet, ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen. ISO/IEC 8859-8: 1999 Ab 1999 repräsentiert die zweite und aktuelle Revision, die der ersten Ausgabe vorausgeht ISO/IEC 8859-8: 1988 1988. Es wird informell als als bezeichnet Latein/Hebräisch. ISO/IEC 8859-8 deckt alle ab Hebräische Briefe, aber nein Hebräische Vokalzeichen. IBM zugewiesen Codepage 916 (Ccsids 916 und 5012).[2][3][4] Dieser Charakter -Set wurde auch von übernommen von Israelischer Standard SI1311: 2002 mit einigen Erweiterungen.
ISO-8859-8 ist der Iana Bevorzugter Charset -Name für diesen Standard, wenn er mit dem ergänzt ist C0- und C1 -Kontrollcodes aus ISO/IEC 6429. Der Text ist (normalerweise) in logischer Reihenfolge so Bidi Für die Anzeige ist die Verarbeitung erforderlich. Nominell ISO-8859-8 (Code Seite 28598) ist für „visuelle Ordnung“ und ISO-8859-8-I (Code Seite 38598) ist für logische Reihenfolge. Aber normalerweise in der Praxis und erforderlich für XML -Dokumente, ISO-8859-8 steht auch für logische Bestelltext. Das Waswg Codierungsstandard verwendet von HTML5 Behandelt ISO-8859-8 und ISO-8859-8-I als unterschiedliche Kodierungen mit der gleichen Zuordnung aufgrund des Einflusses auf die Layout -Richtung, stellt jedoch fest, dass dies nicht mehr zu gilt ISO-8859-6 (Arabisch), nur zu ISO-8859-8.[5]
Es gibt auch ISO-8859-8-e Was angeblich erfordert, dass die Direktionalität explizit mit speziellen Kontrollfiguren angegeben wird; Diese letztere Variante ist in der Praxis nicht genutzt.
Das Microsoft Windows Code -Seite für Hebräisch, Windows-1255ist meistens eine Erweiterung von ISO/IEC 8859-8 ohne C1-Kontrollen, mit Ausnahme des Auslassens des doppelten Unterstrichs und des Austauschs des generischen Währungszeichens (¤) mit dem Sheqel Zeichen (₪). Es fügt Unterstützung für die Unterstützung Vokalpunkte als Kombination von Charakteren und einige zusätzliche Zeichensetzung.
Über ein Jahrzehnt nach der Veröffentlichung dieses Standards, Unicode ist vorgezogen, zumindest für das Internet[6] (Bedeutung UTF-8, die dominante Codierung für Webseiten). ISO-8859-8 wird von weniger als 0,1% der Websites verwendet.[7]
Code -Seitenlayout
ISO/IEC 8859-8[8][9][10][11] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Axt | NBSP | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | × | « | ¬ | SCHÜCHTERN | ® | ¯ | |
BX | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | ÷ | » | ¼ | ½ | ¾ | |
CX | ||||||||||||||||
Dx | ‗ | |||||||||||||||
Ex | א | ב | ג | ד | ה | ו | ז | ח | ט | י | ך | כ | ל | ם | מ | ן |
Fx | נ | ס | ע | ף | פ | ץ | צ | ק | ר | ש | ת | LRM | Rlm |
FD ist links nach rechts (U+200e) und Fe ist rechts nach links (U+200F), wie in einer neueren Änderung als ISO/IEC 8859-8: 1999 angegeben.
2002 israelische Standardverlängerungen
Israeli Standard SI1311: 2002 Übereinstimmung mit ISO/IEC 8859-8: 1999 mit Ausnahme einer Reihe zusätzlicher Charakterzuweisungen für die Eurozeichen, Neues Schekel Zeichen und fortgeschrittener explizite bidirektionale Formatierung.[12]
SI1311: 2002[12] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Dx | € | ₪ | Lro | Rlo | ‗ | |||||||||||
Ex | א | ב | ג | ד | ה | ו | ז | ח | ט | י | ך | כ | ל | ם | מ | ן |
Fx | נ | ס | ע | ף | פ | ץ | צ | ק | ר | ש | ת | Lre | RLE | LRM | Rlm |
Siehe auch
- 8-Bit Dec Hebräisch (ähnliche Dec -Code -Seite)
- Code Seite 1255 (ähnliche Windows -Code -Seite)
- SI 960
- 7-Bit Dec Hebräisch
Verweise
- ^ Zeichensätze, Internet zugewiesene Zahlen Autorität (IANA), 2018-12-12
- ^ "Code Seite 916 Informationsdokument". Archiviert von das Original Am 2017-02-16.
- ^ "CCSID 916 Informationsdokument". Archiviert von das Original Am 2014-11-29.
- ^ "CCSID 5012 Informationsdokument". Archiviert von das Original am 2016-03-27.
- ^ Van Kesteren, Anne. "9. Legacy Single-Byte Codings". Codierungsstandard. Waswg.
Hinweis: ISO-8859-8 und ISO-8859-8-I sind unterschiedliche Codierungsnamen, da ISO-8859-8 Einfluss auf die Layout-Richtung hat. Und obwohl dies historisch gesehen bei ISO-8859-6 und "ISO-8859-6-I"Auch das ist nicht mehr wahr.
- ^ John, Nicholas A. (2013). "Die Konstruktion des mehrsprachigen Internets: Unicode, Hebräisch und Globalisierung". Journal of Computer-vermittelter Kommunikation. 18 (3): 321–338. doi:10.1111/jcc4.12015. ISSN 1083-6101.
Hintergrund: Das Problem des Hebräischen und des Internets
- ^ "Nutzungsstatistik von ISO-8859-8 für Websites, Januar 2019". w3techs.com. Abgerufen 2019-01-17.
- ^ Code Seite CPGID 00916 (PDF) (PDF), IBM
- ^ Code Seite CPGID 00916 (TXT), IBM
- ^ Internationale Komponenten für Unicode (ICU), IBM-916_P100-1995.UCM, 2002-12-03
- ^ Internationale Komponenten für Unicode (ICU), IBM-5012_P100-1999.UCM, 2002-12-03
- ^ a b Standards Institution Israels. ISO-IR-234: Latein/hebräisches Zeichen für 8-Bit-Codes (PDF). Itcj/Ipsj.
Externe Links
- ISO/IEC 8859-8: 1999
- Überarbeitungen der ECMA Standard:
- Standard ECMA-121-8-Bit-Single-Byte-Coded-Grafik-Zeichensätze-Latein/hebräisches Alphabet (PDF) (1 ed.). Europäische Computerherstellervereinigung (ECMA). Juli 1987. Archiviert (PDF) vom Original am 2017-02-15. Abgerufen 2016-02-15.
- Standard ECMA-121-8-Bit-Single-Byte-Coded-Grafik-Zeichensätze-Latein/hebräisches Alphabet (PDF) (2 ed.). Europäische Computerherstellervereinigung (ECMA). Dezember 2000. Archiviert (PDF) vom Original am 2017-02-15. Abgerufen 2016-02-15. ([1])
- Israelischer Standard SI1311: 2002 (Hebräisch)
- ISO-IR-Registrierungen:
- Von ECMA-121: 1987 und folgenden ISO/IEC 8859-8: 1988: Europäische Computerherstellervereinigung (1987-07-31). ISO-IR-138: Latein/hebräisches Alphabet (PDF). Itcj/Ipsj.
- Folgendes ISO/IEC 8859-8: 1999 und ECMA-121: 2000: Standards Institution Israels (1998-05-01). ISO-IR-198: Latein/hebräisches Alphabet (PDF). Itcj/Ipsj.
- Aus SI 1311: 2002: Standards Institution Israels (2004-07-20). ISO-IR-234: Latein/hebräisches Zeichen für 8-Bit-Codes (PDF). Itcj/Ipsj.