ISO/IEC 8859-10
Mime / Iana | ISO-8859-10 |
---|---|
Alias (e) | ISO-IR-157, L6, CSISOLATIN6, LATIN6[1] |
Sprachen) | Nordische Sprachen |
Standard | ECMA-144, ISO/IEC 8859 |
Einstufung | ISO 8859 (erweiterte ASCII, ISO 4873 Level 1) |
Erweitert | US-Ascii |
Bezogen auf | ISO-8859-1, ISO-8859-4 |
ISO/IEC 8859-10: 1998, Informationstechnologie-8-Bit-Single-Byte-codierte grafische Zeichensätze-Teil 10: Lateinisches Alphabet Nr. 6, ist Teil von ISO/IEC 8859 Reihe von ASCII-basierten Standard Charaktercodierungen, Erstausgabe im Jahr 1992 veröffentlicht. Es wird informell als als bezeichnet als Latin-6. Es wurde entwickelt, um die abzudecken Nordische Sprachen, als für sie mehr gebrauchswerte als ISO 8859-4.
ISO-8859-10 ist der Iana Bevorzugter Charset -Name für diesen Standard, wenn er mit dem ergänzt ist C0- und C1 -Kontrollcodes aus ISO/IEC 6429. Microsoft hat zugewiesen Code Seite 28600 a.k.a. Windows-28600 zu ISO-8859-10 in Windows. IBM hat zugewiesen Code Seite 919 zu ISO-8859-10. Es wird veröffentlicht von ECMA International wie ECMA-144.[2]
Codepage -Layout
Unterschiede aus ISO-8859-1 Lassen Sie die Unicode -Codepunktnummer unter dem Zeichen unter dem Zeichen stehen.
ISO/IEC 8859-10 (Latin-6)[3][4] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Axt | NBSP | Ą 0104 | Ē 0112 | Ģ 0122 | Ī 012a | Ĩ 0128 | Ķ 0136 | § | Ļ 013b | Đ 0110 | Š 0160 | Ŧ 0166 | Ž 017d | SCHÜCHTERN | Ū 016a | Ŋ 014a |
BX | ° | ą 0105 | ē 0113 | ģ 0123 | ī 012b | ĩ 0129 | ķ 0137 | · | ļ 013c | đ 0111 | š 0161 | ŧ 0167 | ž 017e | ― 2015 | ū 016b | ŋ 014b |
CX | Ā 0100 | Á | Â | Ã | Ä | Å | Æ | Į 012e | Č 010c | É | Ę 0118 | Ë | Ė 0116 | Í | Î | Ï |
Dx | Ð | Ņ 0145 | Ō 014c | Ó | Ô | Õ | Ö | Ũ 0168 | Ø | Ų 0172 | Ú | Û | Ü | Ý | Þ | ß |
Ex | ā 0101 | á | â | ã | ä | å | æ | į 012f | č 010d | é | ę 0119 | ë | ė 0117 | í | î | ï |
Fx | ð | ņ 0146 | ō 014d | ó | ô | õ | ö | ũ 0169 | ø | ų 0173 | ú | û | ü | ý | þ | ĸ 0138 |
ISO-IR 158 Codepage-Layout
ISO-IR 158 ist ein Ergänzung ISO 2022 Grafischer Satz, der Zeichen enthält, die in ISO-8859-10 fehlen, aber zum Schreiben erforderlich sind Skolt Sami oder historische Sami -Orthographien. Es soll in einem verwendet werden ISO 4873 Profil für Sami -Sprachenals G2- oder G3 -Set (d. H. Vorfixiert mit 0x8e/SS2 oder 0x8f/SS3 jeweils) neben dem Hauptlatein-6 (ISO 8859-10) G1-Set.[5] ISO-IR-158 und ISO-IR-197 werden beide in einem informativen ISO 8859 -Anhang verwiesen, um eine angemessenere Berichterstattung über die Orthographie bestimmter Sámi -Sprachen wie Skolt Sámi zu ermöglichen als ISO-8859-4 oder einfache ISO-8859-10.[6]
Das Code -Diagramm gibt ein Symbol, das in älteren Orthographien verwendet wird, um eine zu bezeichnen Aspirated Consonant, normalerweise als umgekehrter Apostroph oder erhöhter linker Ring geschrieben, der ungewöhnliche Name von "High" Ogonek".[7] Die folgende Tabelle zeigt den zusätzlichen grafischen Satz.[5]
ISO-IR 158 (vorangestellt mit 0x8e oder 0x8f) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ´ | |||||||||||||||
3x | ʽ[7] | |||||||||||||||
4x | Ă | À | Ǟ | Ǡ | Ǣ | Ĕ | È | Ǥ | Ǧ | Ǩ | Ŏ | Ò | Ǫ | Ǭ | Ʒ | Ǯ |
5x | ||||||||||||||||
6x | ă | à | ǟ | ǡ | ǣ | ĕ | è | ǥ | ǧ | ǩ | ŏ | ò | ǫ | ǭ | ʒ | ǯ |
7x |
Verweise
- ^ Zeichensätze, Internet zugewiesene Zahlen Autorität (IANA), 2018-12-12
- ^ Standard ECMA-144: 8-Bit-Single-Byte-Coded-Zeichensets-Lateinische Alphabet Nr. 6 (3. Aufl.). 2000.
Diese ECMA-Veröffentlichung ist auch als ISO/IEC 8859-10 zugelassen.
- ^ Whistler, Ken (1999-10-11). "ISO/IEC 8859-10: 1998 an Unicode". 8859 zu Unicode -Mapping -Tabellen. Unicode, Inc.
- ^ Internationale Komponenten für Unicode (ICU), ISO-8859_10-1998.UCM, 1999-10-11
- ^ a b Schwedisches Institut für Standards (13. Juli 1992). ISO-IR-158: SAMI (Lappish) ergänzendes Set (PDF). Itcj/Ipsj.
- ^ "Anhang A: Berichterstattung über Sprachen nach Teilen 1 bis 10 von ISO/IEC 8859 (informativ)" (PDF). Endgültiger Text von dis 8859-1, 8-Bit-Single-Byte-codierter Grafikzeichen-Teil 1: Lateinisches Alphabet Nr. 1. 1998-02-12. ISO /IEC FDIS 8859-1: 1998 / JTC 1/SC 2 N2988 / WG3 N411.
- ^ a b Whistler, Ken (1998-09-22) [1991-04-04]. "High Ogonek". Unicode Mail -Listenarchiv.
Externe Links
- ISO/IEC 8859-10: 1998
- ISO/IEC 8859-10: 1998 -8-Bit-Single-Byte-codierte grafische Zeichensätze, Teil 10: Lateinischer Alphabet Nr. 6 (Entwurf vom 12. Februar 1998, veröffentlicht am 15. Juli 1998)
- Standard ECMA-144: 8-Bit-Single-Byte-codierte Zeichensätze-Lateinisches Alphabet Nr. 6 3. Ausgabe (Dezember 2000)
- ISO-IR 157 Lateinischer Alphabet Nr. 6, Ergänzungssatz (7. September 1992)