ISO-8859-8-I

ISO-8859-8-I ist der Iana Charset Name für die Zeichenkodierung ISO/IEC 8859-8 verwendet zusammen mit den Kontrollcodes von ISO/IEC 6429 für den C0 (00–1f verhexen) und c1 (80–9f) Teile. Die Zeichen sind in logischer Reihenfolge.

Escape -Sequenzen (von ISO/IEC 6429 oder ISO/IEC 2022) sind nicht zu interpretieren. Die meisten Anwendungen interpretieren nur die Kontrollcodes für Lf, Cr, und Ht. Einige Anwendungen interpretieren auch Vt, Ff, und Nel (in C1). Sehr wenige Anwendungen interpretieren die anderen C0- und C1 -Kontrollcodes.

ISO-8859-8 ist manchmal in logischer Reihenfolge (Html, Xml) und manchmal in visueller (links nach rechts) Reihenfolge (einfacher Text ohne Markup). Das Waswg Codierungsstandard verwendet von HTML5 Behandelt ISO-8859-8 und ISO-8859-8-I als unterschiedliche Kodierungen mit der gleichen Zuordnung aufgrund des Einflusses auf die Layout -Richtung, stellt jedoch fest, dass dies nicht mehr zu gilt ISO-8859-6 (Arabisch), nur zu ISO-8859-8.[1]

Die logische Reihenfolge für diesen Charset erfordert Bidi Verarbeitung zur Anzeige.

Das Microsoft Windows Code -Seite für Hebräisch, Windows-1255verwendet logische Reihenfolge und fügt Unterstützung für die Unterstützung für Vokalpunkte als Kombination von Charakteren und einige zusätzliche Zeichensetzung. Es ist meistens eine Erweiterung von ISO-8859-8-I Ohne C1 -Kontrollen, mit Ausnahme des Auslassens des doppelten Unterstrichs und des Austauschs des universellen Währungszeichens (¤) mit dem Sheqel Zeichen (₪).

Verweise

  1. ^ Van Kesteren, Anne. "9. Legacy Single-Byte Codings". Codierungsstandard. Waswg. Hinweis: ISO-8859-8 und ISO-8859-8-I sind unterschiedliche Codierungsnamen, da ISO-8859-8 Einfluss auf die Layout-Richtung hat. Und obwohl dies historisch gesehen bei ISO-8859-6 und "ISO-8859-6-I"Auch das ist nicht mehr wahr.