ISO/IEC 8859-9

ISO/IEC 8859-9
Mime / Iana ISO-8859-9
Alias ​​(e) ISO-IR-148, Latin5, L5, Csiolatin5[1]
Standard TS 5881, ECMA-128, ISO/IEC 8859
Einstufung ISO 8859 (erweiterte ASCII, ISO 4873 Level 1)
Erweitert US-Ascii
Bezogen auf ISO/IEC 8859-1
Vorausgegangen von ISO/IEC 8859-3
Andere verwandte Kodierungen (en) Windows-1254

ISO/IEC 8859-9: 1999, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 9: Lateinisches Alphabet Nr. 5, ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen, Erstausgabe 1989 veröffentlicht. Es ist bezeichnet ECMA-128 durch ECMA International und TS 5881 als türkischer Standard.[2] Es wird informell als als bezeichnet als Latin-5 oder Türkisch. Es wurde entwickelt, um die abzudecken türkische Spracheals nützlicher als die ISO/IEC 8859-3 Codierung. Es ist identisch mit ISO/IEC 8859-1 mit Ausnahme des Austauschs von sechs isländischen Zeichen (Ðd, Ýý, ÞÞ) mit Zeichen, die im türkischen Alphabet einzigartig sind (Ğg, İ, ı, Şs).

ISO-8859-9 ist der Iana Bevorzugter Charset -Name für diesen Standard, wenn er mit dem ergänzt ist C0- und C1 -Kontrollcodes aus ISO/IEC 6429. In modernen Anwendungen Unicode und UTF-8 sind bevorzugt; Autoren neuer Webseiten und der Designer neuer Protokolle werden zur Verwendung angewiesen UTF-8 stattdessen.[3] Seit August 2019 verwenden 0,1% aller Webseiten ISO-8859-9,[4][5] während 1,9% der Webseiten in der Türkei die Verwendung von ISO-8859-9 deklarieren.[6] Allerdings die Waswg Codierungsstandard, das die Zeichencodierungen angibt, die in zulässig sind HTML5 und welche konformen Browser unterstützen müssen,[7] erfordert, dass Webseiten, die als ISO-8859-9 gekennzeichnet sind Windows-1254,[3] das unterscheidet sich von ISO-8859-9 durch Verwendung der CR -Bereich Welches ISO-8859-9 reserviert für C1 -Kontrollcodes Für zusätzliche grafische Zeichen stattdessen (analog zur Beziehung zwischen ISO-8859-1 und Windows-1252).

Microsoft hat zugewiesen Code Seite 28599 a.k.a. Windows-28599 zu ISO-8859-9 in Windows. IBM hat zugewiesen Code Seite 920 (Ccsid 920) bis ISO-8859-9.[8][9] Es wird veröffentlicht von ECMA International wie ECMA-128.[10]

Codepage -Layout

Unterschiede aus ISO-8859-1 Lassen Sie die Unicode -Codepunktnummer unter dem Zeichen unter dem Zeichen stehen.

ISO/IEC 8859-9[11][12][13]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x
Axt NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SCHÜCHTERN ® ¯
BX ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
CX À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ğ
011e
Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü İ
0130
Ş
015e
ß
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ğ
011f
ñ ò ó ô õ ö ÷ ø ù ú û ü ı
0131
ş
015f
ÿ

Siehe auch

Verweise

  1. ^ Zeichensätze, Internet zugewiesene Zahlen Autorität (IANA), 2018-12-12
  2. ^ "Latin-5: Eine Liste der CCSIDs des Latin-5-Clients und des Servers, zu denen auch die Türkei gehört". IBM. Archiviert von das Original am 2022-02-13.
  3. ^ a b Van Kesteren, Anne. "Namen und Etiketten". Codierungsstandard. Waswg.
  4. ^ "Historische Trends bei der Verwendung von Charaktercodierungen für Websites". w3techs.com.
  5. ^ "Häufig gestellte Fragen". w3techs.com.
  6. ^ "Verteilung von Charaktercodierungen auf Websites, die den Truthahn verwenden". w3techs.com.
  7. ^ "8.2.2.3. Charaktercodierungen". HTML 5.1 2. Auflage. W3c. Benutzeragenten müssen die im Codierungsstandard von Whatwg definierten Codierungen unterstützen, einschließlich, aber nicht beschränkt auf […]
  8. ^ "Code Seite 920 Informationsdokument". Archiviert von das Original Am 2017-01-16.
  9. ^ "CCSID 920 Informationsdokument". Archiviert von das Original am 2016-03-27.
  10. ^ Standard ECMA-128: 8-Bit-Single-Byte-codierte Grafikzeichen-Sets-Lateinisches Alphabet Nr. 5 (2. Aufl.). 1999. Diese ECMA-Veröffentlichung ist auch als ISO 8859-9 genehmigt.
  11. ^ Code Seite CPGID 00920 (PDF) (PDF), IBM
  12. ^ Code Seite CPGID 00920 (TXT), IBM
  13. ^ Internationale Komponenten für Unicode (ICU), IBM-920_P100-1995.UCM, 2002-12-03

Externe Links