ISO/IEC 8859-15

ISO/IEC 8859-15: 1999
Mime / Iana ISO-8859-15
Alias ​​(e) Latin-9, Latin-0
Standard ISO/IEC 8859
Einstufung ISO 8859 (erweiterte ASCII, ISO 4873 Level 1)
Erweitert US-Ascii
Bezogen auf ISO-8859-1
Vorausgegangen von ISO-8859-1

ISO/IEC 8859-15: 1999, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 15: Lateinisches Alphabet Nr. 9, ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen, Erstausgabe 1999 veröffentlicht. Es wird informell als als bezeichnet als Latin-9 (und für eine Weile Latin-0). Das ist vergleichbar mit ISO 8859-1und somit auch für „westeuropäische“ Sprachen bestimmt, ersetzt aber einige weniger häufige Symbole durch die Eurozeichen und einige Briefe, die als notwendig erachtet wurden:[1]

A4 A6 A8 B4 B8 BC Bd SEIN
8859-1 ¤ ¦ ¨ ´ ¸ ¼ ½ ¾
8859-15 Š š Ž ž Œ œ Ÿ

ISO-8859-15 ist der Iana Bevorzugter Charset -Name für diesen Standard, wenn er mit dem ergänzt ist C0- und C1 -Kontrollcodes aus ISO/IEC 6429.

Microsoft hat zugewiesen Code Seite 28605 a.k.a. Windows-28605 zu ISO-8859-15. IBM hat zugewiesen Code Seite 923 (Ccsid 923) bis ISO 8859-15.[2][3]

Alle druckbaren Zeichen von ISO/IEC 8859-1 und ISO/IEC 8859-15 sind ebenfalls in Windows-1252. Seit Oktober 2016 verwenden weniger als 0,1% (tatsächlich weniger als 0,02%) aller Websites ISO-8859-15.[4][5]

Geschichte

Der Kenner ISO 8859-15 wurde für die vorgeschlagen Sami -Sprachen 1996, was schließlich abgelehnt wurde, aber als verabschiedet wurde ISO-IR 197.[6][7][8]

Ein Vorschlag namens ISO 8859-0 wurde 1997 gemacht, um 4 nicht verwendete oder selten verwendet zu ersetzen ISO 8859-1 Figuren (¤, ¨, ´, und ¸) mit , Œ, œ, und Ÿ.[9] wurde notwendig, wenn die Euro wurde vorgestellt. Œ und œ sind französische Ligaturen und Ÿ wird benötigt, damit französischer Text von niedrigerer Fall in All-Caps und wieder ohne Verlust umgewandelt werden kann. Ironischerweise waren die letzten drei bereits in anwesend Dez's Multinationaler Charaktersatz (MCS) 1983 ein Charakter -Set, aus dem aus ECMA-94 (1985) und ISO-8859-1 (1987) wurden abgeleitet. Da ihre ursprünglichen CodePoints jetzt von anderen Zeichen besetzt waren, mussten weniger logische CodePoints für ihre Wiedereinführung ausgewählt werden.

Der gleiche Vorschlag empfahl auch, 6 weitere Zeichen zu ersetzen (¢, ¦, ±, ¼, ½, ¾) mit "einigen anderen Zeichen, die maximal Sprachen abdecken".[9] Für das Euro -Zeichen wollten einige das Plus -Minus -Zeichen anstelle des Währungszeichens ersetzen. Das Währungszeichen wird in einigen Anwendungen als verwendet Feldabscheider und in einigen anderen, um subtotal anzuzeigen. Es gab starke Opposition. Eine Person sagte: "Das vorgeschlagene«+-»ist kein angemessener Fall-Back, da diese Sequenz, obwohl sie selten verwendet werden, bereits eine feste mathematische Bedeutung hat, ganz anders als« ± »; und selbst wenn ein Leser das beabsichtigte ableiten würde Bedeutung «±», aus dem Kontext, «+-» anstelle von «±» wird die Æsthetischen Gefühle eines Physikers mindestens genauso wie «oe» anstelle einer O-e-Ligatur a Frankophones .. "verletzen."[10] Am Ende die ± und ¢ wurden nicht ersetzt. Schließlich wurden vier Zeichen ausgewählt: Š, š, Ž, und ž, die verwendet werden in finnisch und estnisch für die Transliteration von Russisch Lehnwörter und Namen. Der Vorschlag wurde in ISO 8859-15 umbenannt.[wenn?]

Es gab Versuche, ISO 8859-15 zum Standardcharakter für 8-Bit-Kommunikation zu machen, aber es war nie in der Lage, das beliebte ISO 8859-1 zu ersetzen. Es wurde einige Verwendung als Standardzeichen für die Textkonsole- und Terminalprogramme unter Linux festgestellt, wenn das Euro -Zeichen erforderlich war, aber die Verwendung von Full Unicode war nicht praktisch, aber das wurde seitdem durch ersetzt UTF-8.

Berichterstattung

ISO 8859-15 codiert das, was es als "bezieht"Lateinisches Alphabet nein. 9 ". Dieses Zeichensatz wird im gesamten Bereich verwendet Amerika, Westeuropa, Ozeanienund vieles von Afrika. Es wird auch häufig in den meisten Standard-Romanisierungen ostasiatischer Sprachen verwendet.

Jedes Zeichen wird als einzelner Acht-Bit-Codewert codiert. Diese Codewerte können in nahezu jedem Datenaustauschsystem verwendet werden, um in den folgenden Sprachen zu kommunizieren:

Moderne Sprachen mit vollständiger Berichterstattung über ihr Alphabet
Anmerkungen
  1. ^ Vollständige Unterstützung mit Ausnahme von ǿ/ǿ fehlt. Ǿ/ǿ kann auf Kosten einer verstärkten Unklarheit durch Ø/Ø ersetzt werden.
  2. ^ Üblicherweise mit nahezu vollständiger Berichterstattung über das niederländische Alphabet als das fehlende IJ, ij Sollte immer als Zwei-Charakter-IJ oder IJ in elektronischer Form dargestellt werden.
  3. ^ USA und moderne Briten.
  4. ^ Neu Orthographie.
  5. ^ Grundlegende klassische Orthographie.
  6. ^ Grundlegende klassische Orthographie.
  7. ^ Rumi Drehbuch.
  8. ^ Bokmål und Nynorsk.
  9. ^ Europäer und Brasilianer.

Abdeckung von Interpunktionszeichen und Apostrophes

Für einige oben aufgeführte Sprachen die richtige typografische Sprachen Anführungszeichen fehlen, da nur «,», "und 'enthalten sind.

Außerdem bietet diese Codierung nicht das richtige Zeichen für den Apostroph und orientierte einzelne hohe Anführungszeichen, obwohl einige Texte den Grabakzent und den akuten Akzent des Abstands verwenden /9-förmige Anführungszeichen oder Apostrophes (und dies funktioniert zuverlässig mit einigen Schriftstilen, bei denen alle diese Zeichen als schrägige Keilglyphen angezeigt werden).

Codepage -Layout

Unterschiede aus ISO-8859-1 Lassen Sie den Unicode -Codepunkt unter dem Zeichen angezeigt.

ISO/IEC 8859-15[11][12][13]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x
1x
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x
Axt NBSP ¡ ¢ £
20AC
¥ Š
0160
§ š
0161
© ª « ¬ SCHÜCHTERN ® ¯
BX ° ± ² ³ Ž
017d
µ · ž
017e
¹ º » Œ
0152
œ
0153
Ÿ
0178
¿
CX À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

Aliase

ISO 8859-15 hat auch die folgenden, ansprechenden Aliase:

Siehe auch

Verweise

  1. ^ "ISO-8859-15". Iana. Abgerufen 8. März 2016.
  2. ^ "Code Seite 923 Informationsdokument". Archiviert von das Original 2013-02-28.
  3. ^ "CCSID 923 Informationsdokument". Archiviert von das Original Am 2014-12-01.
  4. ^ "Historische Trends bei der Verwendung von Charaktercodings, November 2018". w3techs.com.
  5. ^ "Häufig gestellte Fragen". w3techs.com.
  6. ^ Tieke vertritt die finnische Standardvereinigung SFS (1999-12-07). SAMI Zusätzliche Latein -Set Nr. 2 (PDF). Itcj/Ipsj. ISO-IR-209.
  7. ^ Everson, Michael. "Vorgeschlagener ISO 8859-15". Abgerufen 26. Februar 2017.
  8. ^ Everson, Michael. "Vorgeschlagener ISO 8859-14 (später 15)". Abgerufen 26. Februar 2017.
  9. ^ a b Everson, Michael. "Vorgeschlagener ISO 8859-0 (später 15)". Abgerufen 26. Februar 2017.
  10. ^ Stolz, Otto (11. Juli 1997). "Re: Neuer Entwurf ISO 8859-0". Unicode Mail -Liste (Mailingliste).
  11. ^ Code Seite CPGID 00923 (PDF) (PDF), IBM
  12. ^ Code Seite CPGID 00923 (TXT), IBM
  13. ^ Internationale Komponenten für Unicode (ICU), IBM-923_P100-1998.UCM, 2002-12-03
  14. ^ Baird, Cathy;Chiba, Dan;Chu, Winson;Fan, Jessica;Ho, Claire;Gesetz, Simon;Lee, Geoff;Linsley, Peter;Matsuda, Keni;Oscroft, Tamzin;Takeda, Shige;Tanaka, Linus;Tozawa, Makoto;Trute, Barry;Tsujimoto, Mayumi;Wu, Ying;Yau, Michael;Yu, tim;Wang, Chao;Wong, Simon;Zhang, Weiran;Zheng, Lei;Zhu, Yan;Moore, Valarie (2002) [1996]."Anhang A: Gebietsschemasdaten". Oracle9i -Datenbank Globalisierung Support Guide (PDF) (Release 2 (9.2) ed.). Oracle Corporation. Oracle A96529-01. Archiviert (PDF) vom Original am 2017-02-14. Abgerufen 2017-02-14.

Externe Links