Korkkodierung
Das Kork (auch bekannt als T1 oder EC) codieren ist a Zeichenkodierung verwendet zur Codierung Glyphen in Schriftarten.[1] Es ist nach der Stadt von benannt Kork in Irland, wo während a Tex Users Group (TUG) Konferenz im Jahr 1990 Eine neue Kodierung wurde eingeführt Latex.[1] Es enthält 256 Zeichen, die die meisten west- und ost-europäischen Sprachen mit dem unterstützen Lateinisches Alphabet.[2]
Einzelheiten
In 8-Bit Tex Engines Die Schriftkodierung muss mit der Codierung von übereinstimmen Bindestrichmuster wo diese Codierung am häufigsten verwendet wird.[3] Im Latex Man kann zu dieser Kodierung mit dem Wechsel mit dieser Codierung mit \ usepackage [t1] {fontenc}
, während in Kontext Mkii Dies ist bereits die Standardcodierung. In modernen Motoren wie z. XETEX und Luatex Unicode wird vollständig unterstützt und die 8-Bit-Schriftkodierungen sind veraltet.
Zeichensatz
Korkkodierung | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | ` 0060 | ´ 00B4 | ˆ 02c6 | ˜ 02dc | ¨ 00A8 | ˝ 02dd | ˚ 02da | ˇ 02c7 | ˘ 02d8 | ¯ 00af | ˙ 02d9 | ¸ 00B8 | ˛ 02db | ‚ 201a | ‹ 2039 | › 203a |
1x | “ 201c | ” 201d | „ 201e | « 00ab | » 00BB | – 2013 | — 2014 | ZwSP | ₀[a] 2080 | ı[b] 0131 | ȷ[b] 0237 | ff FB00 | fi FB01 | fl FB02 | ffi FB03 | ffl FB04 |
2x | Sp | ! | " | # | $ | % | & | ’ 2019 | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ‘ 2018 | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | SCHÜCHTERN[c] |
8x | Ă 0102 | Ą 0104 | Ć 0106 | Č 010c | Ď 010e | Ě 011a | Ę 0118 | Ğ 011e | Ĺ 0139 | Ľ 013d | Ł 0141 | Ń 0143 | Ň 0147 | Ŋ 014a | Ő 0150 | Ŕ 0154 |
9x | Ř 0158 | Ś 015a | Š 0160 | Ș 0218 | Ť 0164 | Ț 021a | Ű 0170 | Ů 016e | Ÿ 0178 | Ź 0179 | Ž 017d | Ż 017b | IJ 0132 | İ 0130 | đ 0111 | § 00A7 |
Axt | ă 0103 | ą 0105 | ć 0107 | č 010d | ď 010f | ě 011b | ę 0119 | ğ 011f | ĺ 013a | ľ 013e | ł 0142 | ń 0144 | ň 0148 | ŋ 014b | ő 0151 | ŕ 0155 |
BX | ř 0159 | ś 015b | š 0161 | ș 0219 | ť 0165 | ț 021b | ű 0171 | ů 016f | ÿ 00ff | ź 017a | ž 017e | ż 017c | ij 0133 | ¡ 00A1 | ¿ 00BF | £ 00A3 |
CX | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
Dx | Ð[d] | Ñ | Ò | Ó | Ô | Õ | Ö | Œ 0152 | Ø | Ù | Ú | Û | Ü | Ý | Þ | Ss[e] 1e9e |
Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
Fx | ð | ñ | ò | ó | ô | õ | ö | œ 0153 | ø | ù | ú | û | ü | ý | þ | ß 00df |
Anmerkungen
- Hexadezimalwerte unter den Zeichen in der Tabelle sind die Unicode -Zeichencodes.
- Die ersten 12 Zeichen werden oft als verwendet als Charaktere kombinieren.
- ^ 0x18 ist nur eine "nachfolgende Null", die zum Komponieren verwendet wird ‰ oder ‱ (oder willkürliche kleinere Mengen) aus Prozentzeichen (%).
- ^ a b Dotless i und dotless j Kann verwendet werden, um Akzentvarianten wie zu komponieren Ich mit Macron (ī).
- ^ 0x7f ist der Bindestrichcharakter (nicht wirklich ein weicher Bindestrich).
- ^ 0xd0 wird beide als verwendet als Eth (Ð, u+00D0) und als D mit Schlaganfall (Đ, u+0110), was bei einigen Gelegenheiten ein Problem sein könnte (wie das Kopieren von Text aus PDF, Bindestrich, ...)
- ^ 0xDF enthält SS (zwei Buchstaben S). Es ermöglicht Tex, den deutschen Kleinbuchstaben automatisch umzuwandeln ß in die Großbuchstaben.
Unterstützte Sprachen
Die Codierung unterstützt die meisten europäischen Sprachen, die in lateinischem Alphabet geschrieben wurden. Bemerkenswerte Ausnahmen sind:
- Esperanto (mit IL3)
- Lettische Sprache und Litauanische Sprache (mit L7X)
- Walisische Sprache
Sprachen mit leicht suboptimaler Unterstützung umfassen:
- Galizische Sprache, Portugiesische Sprache und spanische Sprache - Aufgrund des Mangels an Charakteren ª und º, welche sind nicht Superscript -Versionen von Kleinbuchstaben "A" und "O" (Superschriften sind dünner) und sie werden oft unterstrichen
- Kroatische Sprache, Bosnische Sprache, Serbische Sprache - Aufgrund der gemeinsamen Verwendung des Steckplatzes für Đ
- türkische Sprache - wegen dotless i unterschiedliche Groß- und Kleinbucher -Kombinationen haben als in anderen Sprachen
Verweise
- ^ a b Petrlik, Lukas (1996-06-19). "Der tschechische und slowakische Charakter -Coding -Chaos erklärten". CS-Codings-Faq. 1.10. Archiviert vom Original am 2016-06-21. Abgerufen 2016-06-21.
- ^ Ferguson, Michael (1990), "Bericht über mehrsprachige Aktivitäten" (PDF), Schlepper, 11 (4): 514–516
- ^ Tex -Bindestrichmuster