Korkkodierung

Das Kork (auch bekannt als T1 oder EC) codieren ist a Zeichenkodierung verwendet zur Codierung Glyphen in Schriftarten.[1] Es ist nach der Stadt von benannt Kork in Irland, wo während a Tex Users Group (TUG) Konferenz im Jahr 1990 Eine neue Kodierung wurde eingeführt Latex.[1] Es enthält 256 Zeichen, die die meisten west- und ost-europäischen Sprachen mit dem unterstützen Lateinisches Alphabet.[2]

Einzelheiten

In 8-Bit Tex Engines Die Schriftkodierung muss mit der Codierung von übereinstimmen Bindestrichmuster wo diese Codierung am häufigsten verwendet wird.[3] Im Latex Man kann zu dieser Kodierung mit dem Wechsel mit dieser Codierung mit \ usepackage [t1] {fontenc}, während in Kontext Mkii Dies ist bereits die Standardcodierung. In modernen Motoren wie z. XETEX und Luatex Unicode wird vollständig unterstützt und die 8-Bit-Schriftkodierungen sind veraltet.

Zeichensatz

Korkkodierung
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x `
0060
´
00B4
ˆ
02c6
˜
02dc
¨
00A8
˝
02dd
˚
02da
ˇ
02c7
˘
02d8
¯
00af
˙
02d9
¸
00B8
˛
02db

201a

2039

203a
1x
201c

201d

201e
«
00ab
»
00BB

2013

2014
ZwSP [a]
2080
ı[b]
0131
ȷ[b]
0237

FB00

FB01

FB02

FB03

FB04
2x  Sp  ! " # $ % &
2019
( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x
2018
a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ SCHÜCHTERN[c]
8x Ă
0102
Ą
0104
Ć
0106
Č
010c
Ď
010e
Ě
011a
Ę
0118
Ğ
011e
Ĺ
0139
Ľ
013d
Ł
0141
Ń
0143
Ň
0147
Ŋ
014a
Ő
0150
Ŕ
0154
9x Ř
0158
Ś
015a
Š
0160
Ș
0218
Ť
0164
Ț
021a
Ű
0170
Ů
016e
Ÿ
0178
Ź
0179
Ž
017d
Ż
017b
IJ
0132
İ
0130
đ
0111
§
00A7
Axt ă
0103
ą
0105
ć
0107
č
010d
ď
010f
ě
011b
ę
0119
ğ
011f
ĺ
013a
ľ
013e
ł
0142
ń
0144
ň
0148
ŋ
014b
ő
0151
ŕ
0155
BX ř
0159
ś
015b
š
0161
ș
0219
ť
0165
ț
021b
ű
0171
ů
016f
ÿ
00ff
ź
017a
ž
017e
ż
017c
ij
0133
¡
00A1
¿
00BF
£
00A3
CX À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ð[d] Ñ Ò Ó Ô Õ Ö Œ
0152
Ø Ù Ú Û Ü Ý Þ Ss[e]
1e9e
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ð ñ ò ó ô õ ö œ
0153
ø ù ú û ü ý þ ß
00df

Anmerkungen

  • Hexadezimalwerte unter den Zeichen in der Tabelle sind die Unicode -Zeichencodes.
  • Die ersten 12 Zeichen werden oft als verwendet als Charaktere kombinieren.
  1. ^ 0x18 ist nur eine "nachfolgende Null", die zum Komponieren verwendet wird oder (oder willkürliche kleinere Mengen) aus Prozentzeichen (%).
  2. ^ a b Dotless i und dotless j Kann verwendet werden, um Akzentvarianten wie zu komponieren Ich mit Macron (ī).
  3. ^ 0x7f ist der Bindestrichcharakter (nicht wirklich ein weicher Bindestrich).
  4. ^ 0xd0 wird beide als verwendet als Eth (Ð, u+00D0) und als D mit Schlaganfall (Đ, u+0110), was bei einigen Gelegenheiten ein Problem sein könnte (wie das Kopieren von Text aus PDF, Bindestrich, ...)
  5. ^ 0xDF enthält SS (zwei Buchstaben S). Es ermöglicht Tex, den deutschen Kleinbuchstaben automatisch umzuwandeln ß in die Großbuchstaben.

Unterstützte Sprachen

Die Codierung unterstützt die meisten europäischen Sprachen, die in lateinischem Alphabet geschrieben wurden. Bemerkenswerte Ausnahmen sind:

Sprachen mit leicht suboptimaler Unterstützung umfassen:


Verweise

  1. ^ a b Petrlik, Lukas (1996-06-19). "Der tschechische und slowakische Charakter -Coding -Chaos erklärten". CS-Codings-Faq. 1.10. Archiviert vom Original am 2016-06-21. Abgerufen 2016-06-21.
  2. ^ Ferguson, Michael (1990), "Bericht über mehrsprachige Aktivitäten" (PDF), Schlepper, 11 (4): 514–516
  3. ^ Tex -Bindestrichmuster

Externe Links