ISO/IEC 8859-14
Mime / Iana | ISO-8859-14 |
---|---|
Alias (e) | ISO-IR-199, Latin8, Iso-Celtic, L8[1] |
Sprachen) | irisch, Manx, schottisch Gälisch, Walisisch, kornisch, Bretonisch, Englisch |
Standard | ISO/IEC 8859-14: 1998 |
Einstufung | ISO/IEC 8859 (Erweiterte ASCII, ISO/IEC 4873 Level 1) |
Erweitert | US-Ascii |
Bezogen auf | ISO-IR-182 |
ISO/IEC 8859-14: 1998, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 14: Lateinisches Alphabet Nr. 8 (keltisch), ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen, Erstausgabe, veröffentlicht 1998. Es wird informell als als bezeichnet Latin-8 oder keltisch. Es wurde entwickelt, um die abzudecken Keltische Sprachen, wie zum Beispiel irisch, Manx, schottisch Gälisch, Walisisch, kornisch, und Bretonisch.
ISO-8859-14 ist der Iana Bevorzugter Charset -Name für diesen Standard, wenn er mit dem ergänzt ist C0- und C1 -Kontrollcodes aus ISO/IEC 6429. Celtscript hat eine Erweiterung für Windows genannt Verlängertes Latein-8. Microsoft hat zugewiesen Code Seite 28604 a.k.a. Windows-28604 zu ISO-8859-14.[2]
Geschichte
ISO-8859-14 wurde ursprünglich für die vorgeschlagen Sami -Sprachen.[3] ISO 8859-12 wurde für Celtic vorgeschlagen.[4] Später wurde ISO 8859-12 vorgeschlagen für DevanagariDaher wurde der keltische Vorschlag in ISO 8859-14 geändert. Der Sami -Vorschlag wurde in geändert ISO 8859-15,[5] aber es wurde als ISO/IEC 8859 -Teil abgelehnt, obwohl es als registriert wurde ISO-IR-197.[6]
Der ursprüngliche Vorschlag verwendete eine andere Anordnung von Punkten 0xA1 - Bf.[4] Bei der Ausschussentwurf Stadium der Spezifikation a dotless i wurde bei 0xae enthalten,[7] was in a geändert wurde Eingetragenes Markenzeichen (Matching ISO-8859-1) In der endgültigen Veröffentlichung.
ISO-IR-182, eine frühere (registrierte 1994) Modifikation von ISO-8859-1, hatten die Buchstaben ẁ, ẃ, ẅ, ỳ, Ÿ, ŵ, ŷ und ihre Kleinbuchstaben (mit Ausnahme von Ÿ, die bereits enthalten waren) für hinzugefügt Walisische Sprache verwenden.[8] Die endgültige veröffentlichte Version von ISO-8859-14 enthält diese Briefe in denselben Positionen, in denen sie in ISO-IR-182 erscheinen.
Codepage -Layout
Unterschiede aus ISO-8859-1 Lassen Sie die Unicode -Codepunktnummer unter dem Zeichen unter dem Zeichen stehen.
ISO/IEC 8859-14[9][10] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Axt | NBSP | Ḃ 1e02 | ḃ 1e03 | £ | Ċ 010a | ċ 010b | Ḋ 1e0a | § | Ẁ 1e80 | © | Ẃ 1e82 | ḋ 1e0b | Ỳ 1ef2 | SCHÜCHTERN | ® | Ÿ 0178 |
BX | Ḟ 1e1e | ḟ 1e1f | Ġ 0120 | ġ 0121 | Ṁ 1e40 | ṁ 1e41 | ¶ | Ṗ 1e56 | ẁ 1e81 | ṗ 1e57 | ẃ 1e83 | Ṡ 1e60 | ỳ 1ef3 | Ẅ 1e84 | ẅ 1e85 | ṡ 1e61 |
CX | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
Dx | Ŵ 0174 | Ñ | Ò | Ó | Ô | Õ | Ö | Ṫ 1e6a | Ø | Ù | Ú | Û | Ü | Ý | Ŷ 0176 | ß |
Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
Fx | ŵ 0175 | ñ | ò | ó | ô | õ | ö | ṫ 1e6b | ø | ù | ú | û | ü | ý | ŷ 0177 | ÿ |
Entwurfslayout
Der erste Entwurf hatte Positionen A0-BF anders. Es enthielt nicht das Pilcrow-Zeichen, sondern enthielt das Cent-Zeichen stattdessen an seiner lateinischen Position. Später wurde entschieden, dass das Pilcrow-Zeichen häufiger war, sodass das Pilcrow-Zeichen an seiner lateinamerikanischen Position bleibt und stattdessen das Cent-Zeichen entfernt wurde.
Unterschiede zu ISO-8859-14 haben den Unicode-Codepunkt darunter.
ISO/IEC 8859-14 Entwurfsvorschlag[4] Nur Zeilen geändert | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | NBSP | Ḃ | ¢ 00A2 | £ | ḃ 1e03 | Ċ 010a | ċ 010b | § | Ẁ | © | Ẃ | Ṡ 1e60 | Ỳ | SCHÜCHTERN | ® | Ÿ |
BX | Ḋ 1e0a | ḋ 1e0b | Ḟ 1e1e | ḟ 1e1f | Ġ 0120 | ġ 0121 | Ṁ 1e40 | ṁ 1e41 | ẁ | Ṗ 1e56 | ẃ | ṡ 1e61 | ỳ | Ẅ | ẅ | ṗ 1e57 |
Verweise
- ^ Zeichensätze, Internet zugewiesene Zahlen Autorität (IANA), 2018-12-12
- ^ "Blatt/JS-Codepage". GitHub. 12. Oktober 2021.
- ^ Everson, Michael. "Vorgeschlagener ISO 8859-14 (später 15)".
- ^ a b c Everson, Michael. "Vorgeschlagener ISO 8859-12 (später 14)".
- ^ Everson, Michael (1996-06-19). Vorschlag für einen neuen Teil von ISO/IEC 8859: Lateinischer Alphabet Nr. 9 (Sámi).
- ^ Schwedisches Institut für Standards (1997-01-24). ISO-IR-197: SAMI ergänzender lateinischer Satz (PDF). Itcj/Ipsj.
- ^ Everson, Michael (1997-05-05). "ISO/IEC CD 8859-14: 1997-Lateinisches Alphabet Nr. 8 (Celtic)" (Ausschussentwurf).
- ^ Britische Standardinstitution (1994-03-16). ISO-IR-182: Welsh-Variante des lateinischen Alphabets Nr. 1 (rechtsem Teil) (PDF). Itcj/Ipsj.
- ^ Kuhn, Markus; Whistler, Ken (1999-07-27). "ISO/IEC 8859-14: 1998 an Unicode". 8859 zu Unicode -Mapping -Tabellen. Unicode, Inc.
- ^ Internationale Komponenten für Unicode (ICU), ISO-8859_14-1998.UCM, 1999-07-27
Externe Links
- ISO/IEC 8859-14: 1998
- ISO-IR 199 Keltischer ergänzender lateinischer Set (1. Mai 1998, eingereicht von der irischen Körperschaft NSAI/Agits/Wg6)