Chinesischer Charaktercode für den Informationsaustausch
Sprachen) | Chinesisch, japanisch, Koreanisch |
---|---|
Standard | Marc-8, ANSI/NISO Z39.64 (beide EACC -Version) |
Aktueller Status | Verwendet hauptsächlich von Bibliothekssystemen |
Einstufung | TBCs zum CJK basierend auf ISO 2022 Struktur, Jackphy Komponente von Marc |
Das Chinesischer Charaktercode für den Informationsaustausch (Chinesisch: 中文資訊交換碼) oder CCCII ist ein Zeichensatz entwickelt von der chinesischen Charakteranalysegruppe in Taiwan. Es wurde erstmals 1980 veröffentlicht und 1982 und 1987 erheblich erweitert.[1]
Es wird hauptsächlich von verwendet von Bibliothekssysteme.[2][3] Es ist eine der frühesten etablierten und anspruchsvollsten Codierungen für traditionelles Chinesisch (vor der Einrichtung von Die großen 5 1984 und ZNS 11643 1986).[2] Es zeichnet sich durch sein einzigartiges System zur Codierung aus vereinfachte Versionen und andere Varianten von seinem Hauptsatz von Hanzi Figuren.[1]
Eine Variante einer früheren Version von CCCII wird von der verwendet Kongressbibliothek im Rahmen Marc-8, unter dem Namen Ostasiatischer Charaktercode (EACCANSI/NISO Z39.64),[4] wo es einen Teil von einem Teil von Marc 21's Jackphy Unterstützung. EACC enthält jedoch weniger Charaktere als die neuesten Versionen von CCCII.[5][1]
Entwurf
Bytebereiche
CCCII ist als 94 konzipiertn festgelegt, wie definiert von ISO/IEC 2022.[1] Jedes chinesische Zeichen wird durch einen 3-Byte-Code dargestellt, in dem jedes Byte 7-Bit ist, dazwischen 0x21 und 0x7e inklusive. Somit beträgt die maximale Anzahl chinesischer Zeichen, die in CCCII dargestellt werden können Die meisten Codepunkte müssten Varianten reserviert werden.
In der Praxis werden jedoch manchmal Bytes außerhalb dieser Bereiche verwendet. Der Code 0x212320 wird von einigen Implementierungen als verwendet ideografischer Raum.[7] Eine CCCII -Spezifikation, die von Bibliotheken in Hongkong verwendet wird, verwendet Codes, die mit 0x2120 für Interpunktion und Symbole beginnen.[8] Das erste Byte 0x7f wird von einigen Varianten verwendet, um Codes für einige ansonsten nicht verfügbar zu codieren Einheitliches Repertoire und Bestellung oder CJK Unified Ideographs Extension a Hanzi (z. B. 0x7f3449 für U+3449 oder 0x7f796e für U+796E;[8] Beachten Sie, wie die Fortsetzungsbytes mit dem übereinstimmen UCS-2BE Code), und dies kann Bytes außerhalb des 0x21–0x7e oder sogar 0x20–0x7F -Bereichs enthalten, z. 0x7f551c für u+551c,[9] 0x7f5aa4 für u+5aa4[9] oder 0x7f8eda für u+8eda.[8]
Interaktion mit ISO 2022
CCCII/EACC ist nicht in der registriert Internationales Register der codierten Zeichensätze, die mit Escape -Sequenzen verwendet werden sollen,[10] Und als solche hat keine Standardbezeichnung für die Verwendung mit ISO 2022. MARC-8 weist EACC die Privatnutzung zu F-Byte 0x31 (1
) in der Umsetzung von ANSI X3.41 (ISO 2022).[11]
Schichten und Variantenzeichen
Die 94 ISO 2022 -Flugzeuge sind in jeweils 16 Ebenen von jeweils 6 Ebenen unterteilt (mit Ausnahme von Schicht 16, die die vier Ebenen 91–94 enthält).[1] Schicht 1 enthält sowohl Non-Hanzi als auch Hanzi Charaktere, mit dem Nicht-Hanzi und am häufigsten verwendeten Hanzi, die in Ebene 1 platziert wurden, und mit den verbleibenden fünf Ebenen, die aus weniger häufiger Hanzi bestehen.[1] Schicht 2 enthält vereinfachte chinesische Charaktere, mit deren Reihen- und Zellzahlen das gleiche sein wie ihre traditionelles Chinesisch Äquivalente in Schicht 1. Schichten 3 bis 12 enthalten weiter Variantenformen, in Reihen- und Zellzahlen homolog zu den ersten beiden Schichten.[12]
Die letzten vier Schichten werden für andere Zwecke verwendet. Insbesondere enthält Layer 13 zusätzliche Zeichen für japanische Sprache Unterstützung (Kana und Japanisch Kokuji) und Schicht 14 enthält zusätzliche Zeichen für koreanische Sprache Unterstützung (Hangul).[12] Die Schicht 15 ist ungenutzt (reserviert), während Schicht 16 für andere Zeichen verwendet wird.[1]
Dieses unverwechselbare Design wurde vom christlichen Wittern des Internationalen Forschungsinstituts für Zen Buddhismus unter kritisiert Hanazono University, der behauptet, dass die Beziehung von Charaktervarianten "sehr komplex ist und nicht in einem festen, eindimensionalen, hart verdrahteten Codetable ausgedrückt werden kann".[3] Ken Lunde beschreibt es als "einen der am besten durchdachten Charakter-Set-Standards aus Taiwan", der seine Struktur als "wirklich bewundert werden" beschreibt, aber zu dem Schluss kommt Offener Typ Die Substitution der Variantenform kann dieselbe Funktionalitätsniveau liefern.[1]
CCCII definiert ungefähr 53940 Codepunkte zum Zeitpunkt seiner Ausgabe von 1987, obwohl ein neuerer Entwurf aus dem Jahr 1989 dies auf 75684 Codepunkte erweitert (mit 44167 einzigartigen Zeichen und 31517 Varianten). EACC, die Variante der Kongressbibliothek, umfasst nur einen kleineren Satz von 15686 Zeichen.[1]
Annahme
Ab 1995 wurde CCCII oder EACC hauptsächlich in Bibliotheken in der verwendet Vereinigte Staaten, Hongkong und Taiwan. Obwohl CCCII Pan-CJK Die Berichterstattung beschränkte sich auf spezialisierte Hardware. Schwierigkeiten zu ermitteln, wann das Variantencharakter der Wurzel versus verwendet werden sollte, verschärft sich durch einen Mangel an fest etablierten Referenzglyphen, die seine Einführung weiter eingeschränkt haben, was dazu führt Die großen 5 häufiger für Chinesen in diesen Gebieten außerhalb der Bibliotheksnutzung verwendet werden (seitdem Unicode musste zu dieser Zeit noch weit verbreitet sein).[3]
Ab 2009[aktualisieren], EACC ist immer noch ausführlich für spezialisierte bibliografische Zwecke verwendet.[1] Es war auch ein wichtiger Vorläufer für Unicode.[1] Unicode Hanzi Zeichen werden auf ihre entsprechenden CCCII- und EACC -Codes in der bezeichnet Unihan Datenbank in den Schlüssel kCCCII
und kEACC
.[4] Mapping -Tabellen für Hanzi, Hangul, Kana und Interpunktion zwischen EACC und Unicode sind in der Kongressbibliothek erhältlich.[13]
Interpunktion, Symbol, Kana und Jamo -Charts
Im Folgenden finden Sie Diagramme für Interpunktion, Symbole, Kana und Hangul Jamo, zeigen die Zeichen und geben Sie mögliche Unicode -Mappings. Nach Möglichkeit werden auf veröffentlichte Zuordnungsdaten verwiesen.
Unicode -Zuordnungen für Hangul -Silben sind nachstehend für die Kürze weggelassen, werden jedoch von der Kongressbibliothek dokumentiert.[14] CCCII HANzi -Zahl in Zehntausenden[1][3] und werden unten nicht gezeigt (außer wo sie auch im Nicht-Hanzi-Bereich als Radikale oder Ziffern enthalten sind), aber die Zuordnungen an Unicode sind in der Unihan-Datenbank erhältlich[4] und von anderswo.[9][8]
Zeichensatz 0x2120 (Ebene 1, Reihe 0: Hongkong Interpunktion)
Obwohl CCCII normalerweise ein 94 istn einstellen,[1] und verwendet daher normalerweise keine Codes, beginnend mit 0x2120,[9] Das folgende Layout wird von einer Variante verwendet, die von Bibliotheken in Hongkong verwendet wird:[8]
CCCII (Hongkong)[8] (mit 0x2120 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | 、 | 。 | ・ | ゙ | ゚ | ´ | ` | ¨ |  ̄ | ヽ | ヾ | ゝ | ゞ | |||
3x | 〃 | 〆 | ‖ | … | ‥ | |||||||||||
4x | “ | 〔 | 〕 | 「 | 」 | 『 | 』 | 【 | 】 | ± | × | ÷ | ||||
5x | ≠ | ≦ | ≧ | ∞ | ∴ | ♂ | ♀ | ° | ℃ | ¢ | £ | § | ☆ | ★ | ○ | ● |
6x | ′ | ″ | ◎ | |||||||||||||
7x | ◇ | ◆ | □ | ■ | △ | ▲ | ▽ | ▼ | ※ | 〒 | → | ← | ↑ | ↓ |
Zeichensatz 0x2121 (Ebene 1, Zeile 1: für Steuerelemente reserviert)
In Ebene 1 Zeile 1 sind keine Zeichen zugewiesen, die für reserviert ist Kontrollcodes.[1]
Zeichensatz 0x2122 (Ebene 1, Zeile 2: mathematische Operatoren)
Diese Reihe enthält mathematische Operatoren. EACC verlässt diese Reihe leer.[13] Die folgende Tabelle wird gegen Quellen aus Taiwan verwiesen.[2][9]
CCCII (Taiwan)[9][15] (mit 0x2122 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ∞ | + | − | ± | × | ⋅ | ÷ | ∕ | = | ≠ | ≡ | ≈ | ∼ | ∝ | < | |
3x | > | ≮ | ≯ | ≤ | ≥ | ≪ | ≫ | ∂ | ∫ | Δ | ∆ | ∇ | ▫ | ∠ | ⊤ | ∥ |
4x | ≅ | ≞ | ∴ | ∃ | ∀ | ∪ | ∩ | ⊂ | ⊃ | ⇒ | ⇔ | ∋ | ∈ | ∉ | ∑ | ㏒ |
5x | ㏑ | ℯ | π | √ | ︕ | ⎸ | ⎹ | 〈 | 〉 | |||||||
6x | ||||||||||||||||
7x |
Die folgende Tabelle wird gegen die vom Hongkong bereitgestellten CCCII -Daten verwiesen Innovativ Benutzergruppe, eine Gruppe von Bibliotheken in Hongkong und von der gehostet Universität Hongkong.[16][8] Es verwendet ein völlig anderes Layout in dieser Zeile:
CCCII (Hongkong)[8] (mit 0x2122 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ∈ | ∋ | ⊆ | ⊇ | ⊂ | ⊃ | ∪ | ∩ | ∧ | ∨ | ¬ | ⇒ | ⇔ | ∀ | ∃ | |
3x | ∠ | ⊥ | ⌒ | ∂ | ∇ | ≡ | ≒ | ≪ | ≫ | √ | ∽ | ∝ | ∵ | ∫ | ∬ | |
4x | Å | ‰ | ♯ | ♭ | ♪ | † | ‡ | ¶ | ◯ | |||||||
5x | ─ | │ | ┌ | ┐ | ┘ | └ | ├ | ┬ | ┤ | ┴ | ┼ | ━ | ┃ | ┏ | ┓ | ┛ |
6x | ┗ | ┣ | ┳ | ┫ | ┻ | ╋ | ┠ | ┯ | ┨ | ┷ | ┿ | ┝ | ┰ | ┥ | ┸ | ╂ |
7x |
Zeichensatz 0x2123 (Ebene 1, Reihe 3: Roman und Zeichensetzung)
Diese Reihe enthält Interpunktion, Westarabische Ziffern und römische Buchstaben.[9] Vergleichen Zeile 3 von Wansung Code und Reihe 3 von GB 2312.
Verschiedene Varianten codieren die unterschiedlich ideografischer Raum (U+3000) bei 0x212320 (die die MARC -Spezifikation anerkennt),[7][8] 0x212321 (was im ANSI -Standard aufgeführt ist und auch von Marc anerkannt wird),[7][8] oder 0x21635f.[9] EACC umfasst nur die Bindestrich-Minus, Klammern und ideografischen Raum in diesem Satz.[7]
CCCII/EACC[13][9][15] (mit 0x2123 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | IDSP[a] | !/ IDSP[b] | " | # | $ | % | & | ' | (/( | )/) | * | + | , | -/- | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ↑ | _ |
6x | `/' | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ |
Zeichensatz 0x212a (Ebene 1, Zeile 10: interne IME -Zeichen und Geta Mark)
In EACC enthält diese Reihe mehrere mehrere Privatnutzungsbereich Zugeordnete Zeichen, die intern verwendet werden, um Zeichenkomponenten durch die darzustellen Rlin Eingabe Methode,[17] die von der Bibliothek des Kongresses für nicht-römische Katalogisierung verwendet wird.[18] Diese Komponentenzeichen sollten nur intern von einem verwendet werden Ime und kann an anderer Stelle angetroffen werden, kann durch das ersetzt werden Geta Mark (U+3013),[17] Diese Zeile enthält auch unter 0x212a46. Diese Reihe ist in CCCII nicht zugewiesen.[1] Die Geta -Marke ist jedoch auch an diesem Ort in einigen Zuordnungen für CCCII aufgeführt.[9]
EACC[13] (mit 0x212a vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | � | � | � | � | � | � | � | � | � | � | � | � | � | � | ||
3x | � | � | � | � | � | � | � | � | � | � | � | � | � | � | � | |
4x | � | � | � | � | � | � | 〓 | |||||||||
5x | ||||||||||||||||
6x | ||||||||||||||||
7x |
Zeichensatz 0x212b (Ebene 1, Zeile 11: Interpunktion)
Diese Reihe enthält verschiedene Interpunktionsmarken, die auf Chinesisch verwendet werden.[1][7] Zusätzlich zu anderen Symbolen. CCCII enthält in dieser Reihe einen Satz von 35 Interpunktionsmarken.[1] EACC enthält nur 13 Zeichen in dieser Zeile (siehe unten).[7]
CCCII/EACC[13][9][15] (mit 0x212b vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ︵ | ︶ | ﹁ | ﹂ | 「 | 」 | ︳ | _ | ﹃ | ﹄ | 『 | 』 | ︴ | ﹏ | ︹ | |
3x | ︺ | 〔/[ | 〕/] | 。 | ・/. | 、 | ⋮ | ⋯ | , | ; | : | ? | ︱ | ! | ︲ | ︱ |
4x | ‘ | ’ | “ | ” | 《 | 》 | 【 | 】 | 〖 | 〗 | ||||||
5x | $ | ¢ | ₡ | £ | ¥ | ₨ | d. | s. | / | # | % | ⅌ | @ | ¶ | ® | |
6x | © | ℅ | & | § | † | ‡ | * | |||||||||
7x | ヽ | ヾ | ゝ | ゞ | α | 〒 |
Zeichensätze 0x212C - 0x212e (Ebene 1, Reihen 12–14: Radikale und Ordinale)
Diese Reihen enthalten Chinesische Radikale,[1] römische Zahlen,[9] Himmelsstämme und terrestrische Zweige.[15]
CCCII[15] (mit 0x212c vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ⼀ | ⼁ | ⼂ | ⼃ | ⼄ | ⼅ | ⼆ | ⼇ | ⼈ | ⼉ | ⼊ | ⼋ | ⼌ | |||
3x | ⼍ | ⼎ | ⼏ | ⼐ | ⼑ | ⼒ | ⼓ | ⼔ | ⼕ | ⼖ | ⼗ | ⼘ | ⼙ | ⼚ | ⼛ | ⼜ |
4x | ⼝ | ⼞ | ⼟ | ⼠ | ⼡ | ⼢ | ⼣ | ⼤ | ⼥ | ⼦ | ⼧ | ⼨ | ⼩ | ⼪ | ⼫ | |
5x | ⼬ | ⼭ | ⼮ | ⼯ | ⼰ | ⼱ | ⼲ | ⼳ | ⼴ | ⼵ | ⼶ | ⼷ | ⼸ | ⼹ | ⼺ | ⼻ |
6x | ⼼ | ⼽ | ⼾ | ⼿ | ⽀ | ⽁ | ⽂ | ⽃ | ⽄ | ⽅ | ⽆ | ⽇ | ⽈ | ⽉ | ⽊ | |
7x | ⽋ | ⽌ | ⽍ | ⽎ | ⽏ | ⽐ | ⽑ | ⽒ | ⽓ | ⽔ | ⽕ | ⽖ | ⽗ | ⽘ | ⽙ |
CCCII[8][15] (mit 0x212d vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ⽚ | ⽛ | ⽜ | ⽝ | ⽞ | ⽟ | ⽠ | ⽡ | ⽢ | ⽣ | ⽤ | ⽥ | ⽦ | ⽧ | ||
3x | ⽨ | ⽩ | ⽪ | ⽫ | ⽬ | ⽭ | ⽮ | ⽯ | ⽰ | ⽱ | ⽲ | ⽳ | ⽴ | ⽵ | ⽶ | |
4x | ⽷ | ⽸ | ⽹ | ⽺ | ⽻ | ⽼ | ⽽ | ⽾ | ⽿ | ⾀ | ⾁ | ⾂ | ⾃ | ⾄ | ⾅ | ⾆ |
5x | ⾇ | ⾈ | ⾉ | ⾊ | ⾋ | ⾌ | ⾍ | ⾎ | ⾏ | ⾐ | ⾑ | ⾒ | ⾓ | ⾔/訁 | ⾕ | |
6x | ⾖ | ⾗ | ⾘ | ⾙ | ⾚ | ⾛ | ⾜ | ⾝ | ⾞ | ⾟ | ⾠ | ⾡ | ⾢ | ⾣ | ⾤ | ⾥ |
7x | ⾦/釒 | ⾧ | ⾨ | ⾩ | ⾪ | ⾫ | ⾬ | ⾭ | ⾮ | ⾯ | ⾰ | ⾱ | ⾲ |
CCCII[9][8][15] (mit 0x212e vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ⾳ | ⾴ | ⾵ | ⾶ | ⾷/飠 | ⾸ | ⾹ | ⾺ | ⾻ | ⾼ | ⾽ | ⾾ | ⾿ | ⿀ | ||
3x | ⿁ | ⿂ | ⿃ | ⿄ | ⿅ | ⿆ | ⿇ | ⿈ | ⿉ | ⿊ | ⿋ | ⿌ | ⿍ | |||
4x | ⿎ | ⿏ | ⿐ | ⿑ | ⿒ | ⿓ | ⿔ | ⿕ | ||||||||
5x | 甲 | 乙 | 丙 | 丁 | 戊 | 己 | 庚 | 辛 | 壬 | 癸 | ||||||
6x | 子 | 丑 | 寅 | 卯 | 辰 | 巳 | 午 | 未 | 申 | 酉 | 戌 | 亥 | ||||
7x | Ⅰ | Ⅱ | Ⅲ | Ⅳ | Ⅴ | Ⅵ | Ⅶ | Ⅷ | Ⅸ | Ⅹ | Ⅺ | Ⅻ |
Zeichensatz 0x212f (Ebene 1, Reihe 15: Chinesische Ziffern und Bopomofo)
Diese Reihe enthält chinesische Ziffern und Bopomofo Figuren.[1] EACC umfasst nur die ideografische Null (〇).[7]
CCCII/EACC[13][15][9] (mit 0x212f vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | 〡 | 〢 | 〣 | 〤 | 〥 | 〦 | 〧 | 〨 | 〩 | 〸 | 〹 | 〺 | ||||
3x | 〇 | 一 | 二 | 三 | 四 | 五 | 六 | 七 | 八 | 九 | 十 | 百 | 千 | 万 | ||
4x | 零 | 壹 | 貳 | 參 | 肆 | 伍 | 陸 | 柒 | 捌 | 玖 | 拾 | 佰 | 仟 | 萬 | 億 | |
5x | ˊ | ˇ | ˋ | ˙/﹒[c] | ㄅ | ㄆ | ㄇ | ㄈ | ㄉ | ㄊ | ㄋ | ㄌ | ㄍ | ㄎ | ㄏ | ㄐ |
6x | ㄑ | ㄒ | ㄓ | ㄔ | ㄕ | ㄖ | ㄗ | ㄘ | ㄙ | ㄚ | ㄛ | ㄜ | ㄝ | ㄞ | ㄟ | ㄠ |
7x | ㄡ | ㄢ | ㄣ | ㄤ | ㄥ | ㄦ | ㄧ | ㄨ | ㄩ | ü |
Zeichensatz 0x272b (Ebene 7, Zeile 11: Referenzmarke)
Diese Reihe enthält die Referenzzeichen (Kome Jirushi).[9]
CCCII[9] (mit 0x272b vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
6x | ※ |
Zeichensatz 0x272e - 0x272f (Ebene 7, Zeilen 14–15: Alternatives Bopomofo)
Eine Variante, die von Bibliotheken in Hongkong verwendet wird, enthält keine Bopomofo -Zeichen in Ebene 1 Zeile 15, sondern in ein anderes Layout in Ebene 7.[8]
CCCII (Hongkong)[8] (mit 0x272e vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
7x | ㄅ | ㄆ | ㄇ | ㄈ | ㄉ | ㄊ | ㄋ | ㄌ | ㄍ | ㄎ |
CCCII (Hongkong) (vorangestellt mit 0x272f) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ㄏ | ㄐ | ㄑ | ㄒ | ㄓ | ㄔ | ㄕ | ㄖ | ㄗ | ㄘ | ㄙ | ㄚ | ㄛ | ㄜ | ㄝ | |
3x | ㄞ | ㄟ | ㄠ | ㄡ | ㄢ | ㄣ | ㄤ | ㄥ | ㄦ | ㄧ | ㄨ | ㄩ |
Zeichensatz 0x6921 (Ebene 73, Reihe 1: japanische Interpunktion)
Diese Zeile befindet sich in Ebene 73, der ersten Ebene von Schicht 13, die Zeichen enthält, die für Zeichen enthalten sind japanische Sprache Unterstützung.[12] Es enthält Interpunktion.[7] Vergleichen Reihe 1 von JIS x 0208, was diese Zeile dazu neigt, dem Layout für die Charaktere zu folgen, die sie enthält.
CCCII/EACC[13][9][8] (mit 0x6921 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ・ | |||||||||||||||
3x | 々 | 〆 | ー | |||||||||||||
4x | ||||||||||||||||
5x | 〈 | 〉 | 《 | 》 | ||||||||||||
6x | ||||||||||||||||
7x |
Zeichensatz 0x6924 (Ebene 73, Reihe 4: Hiragana)
Diese Reihe enthält Hiragana. Vergleichen Reihe 4 von JIS x 0208.
CCCII/EACC[13][9][8] (mit 0x6924 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ぁ | あ | ぃ | い | ぅ | う | ぇ | え | ぉ | お | か | が | き | ぎ | く | |
3x | ぐ | け | げ | こ | ご | さ | ざ | し | じ | す | ず | せ | ぜ | そ | ぞ | た |
4x | だ | ち | ぢ | っ | つ | づ | て | で | と | ど | な | に | ぬ | ね | の | は |
5x | ば | ぱ | ひ | び | ぴ | ふ | ぶ | ぷ | へ | べ | ぺ | ほ | ぼ | ぽ | ま | み |
6x | む | め | も | ゃ | や | ゅ | ゆ | ょ | よ | ら | り | る | れ | ろ | ゎ | わ |
7x | ゐ | ゑ | を | ん |
Zeichensatz 0x6925 (Ebene 73, Reihe 5: Katakana)
Diese Reihe enthält Katakana. Vergleichen Reihe 5 von JIS x 0208, was diese Zeile entspricht, neben der Zugabe des getrennten Dakuten und Handakuten.
CCCII/EACC[13][9] (mit 0x6925 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ァ | ア | ィ | イ | ゥ | ウ | ェ | エ | ォ | オ | カ | ガ | キ | ギ | ク | |
3x | グ | ケ | ゲ | コ | ゴ | サ | ザ | シ | ジ | ス | ズ | セ | ゼ | ソ | ゾ | タ |
4x | ダ | チ | ヂ | ッ | ツ | ヅ | テ | デ | ト | ド | ナ | ニ | ヌ | ネ | ノ | ハ |
5x | バ | パ | ヒ | ビ | ピ | フ | ブ | プ | ヘ | ベ | ペ | ホ | ボ | ポ | マ | ミ |
6x | ム | メ | モ | ャ | ヤ | ュ | ユ | ョ | ヨ | ラ | リ | ル | レ | ロ | ヮ | ワ |
7x | ヰ | ヱ | ヲ | ン | ヴ | ヵ | ヶ | ◌ ゙/゛ | ◌ ゚/゜ |
Zeichensatz 0x6f24–0x6f25 (Ebene 79, Zeilen 4–5: Jamo)
Diese Reihen enthalten Koreanisch Jamo.
EACC[13] (mit 0x6f24 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
5x | ㄱ | ㄴ | ㄷ | ㄹ | ㅁ | ㅂ | ㅅ | ㅇ | ㅈ | |||||||
6x | ㅊ | ㅋ | ㅌ | ㅍ | ㅎ | ㄲ | ㄸ | ㅃ | ||||||||
7x | ㅆ | ㅉ | ㅏ | ㅐ | ㅑ | ㅓ | ㅔ | ㅕ | ㅗ | ㅘ | ㅛ |
EACC[13] (mit 0x6f25 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ㅜ | ㅠ | ㅡ | ㅢ | ㅣ |
Zeichensatz 0x6f76 (Ebene 79, Reihe 86: archaischer Hangul)
Diese Reihe enthält mehrere historische Hangul Charaktere nicht mehr in regelmäßiger Verwendung. Einige davon werden dem zugeordnet Privatnutzungsbereich.[17]
EACC[13] (mit 0x6f76 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
2x | ㆁ | ㆆ | ㅿ | � | ㆍ | |||||||||||
3x | ||||||||||||||||
4x | � | � | � | � | � | � | � | � | � | � | � | � | � | � | � | � |
5x | � | � | � | � | � | � | � | � | ||||||||
6x | ||||||||||||||||
7x |
Zeichensatz 0x7b25 (Ebene 91, Reihe 5: Ergänzende Katakana)
Diese Zeile enthält zusätzliche Katakana Wird verwendet, um fremde Phoneme zu schreiben.[9]
CCCII[9] (mit 0x7b25 vorangestellt) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
7x | ヷ | ヸ | ヹ |
Fußnoten
- ^ Außerhalb des Trail -Byte -Bereichs einer ISO 2022 94n festgelegt, aber von einigen Implementierungen als in Gebrauch benutzt.[7]
- ^ Kodierung des im ANSI -Standard für EACC festgelegten ideografischen Raums.[7] Dies wird als Ausrufezeichen in CCCII verwendet.[9] Zusätzlich zum Ausrufezeichen bei 0x212b3d.[15] Die Hongkong Hkiug -Variante von CCCII folgt EACC hier.[8]
- ^ Die Encode :: Hanextra -Zuordnungen verwenden U+Fe52 für dieses Zeichen.[9] Es erscheint jedoch hier nach ˊ, ˇ und ˋ,,[15] die die anderen drei Tonmarken für Bopomofo. Das Mapping U+02D9 wird beispielsweise häufiger für diese Tonmarke in Bopomofo -Bereichen verwendet Die großen 5.[19]
Verweise
- ^ a b c d e f g h i j k l m n o p q r s Lunde, Ken (2009). CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer (2. Aufl.). Sebastopol, ca.: O'Reilly. S. 122–124. ISBN 978-0-596-51447-1.
- ^ a b c Tang, Audrey (2007-11-10). "Encode :: Hanextra - zusätzliche Sätze chinesischer Codierungen".
CCCII: Die früheste (und anspruchsvollste) traditionelle chinesische Codierung ... wird hauptsächlich in Bibliothekssystemen verwendet. Karte für "CCCII" wird von der Lieferung geliefert Koha Taiwan -Projekt.
- ^ a b c d Wittern, Christian (1995-05-01). "Chinesische Charaktercodes: Ein Update". Internationales Forschungsinstitut für Zen Buddhismus / Hanazono University. Archiviert von das Original Am 2004-10-12.
- ^ a b c Jenkins, John H.; Koch, Richard; Lunde, Ken (2020-03-05). "Unicode Han -Datenbank (Unihan)". Unicode Standard Anhang #38.
- ^ "Archivierte Kopie". Archiviert von das Original am 2016-06-15. Abgerufen 2016-06-15.
{{}}
: CS1 Wartung: Archiviertes Kopie als Titel (Link) - ^ Kangxi -Wörterbuch, p. 1296, Char. 1
- ^ a b c d e f g h i j Kongressbibliothek (2007-12-05). "Code Tabelle Ostasiatische Interpunktionsmarken". MARC 21 Spezifikationen für Rekordstruktur, Zeichensätze und Exchange Media.
- ^ a b c d e f g h i j k l m n o p q Hongkong Innovative Users Group Unicode Task Force. "HKIUG -Code -Tabelle für CJK -Zeichen: Zuordnung zu Unicode". Universität Hongkong Bibliotheken.
- ^ a b c d e f g h i j k l m n o p q r s t u v w Tang, Audrey; Koha Taiwan. "Karte für CCCII". Codieren :: hanextra. CPAN.
- ^ "2.4: Mehrere Byte -Grafikzeichen -Sets". Internationales Register der codierten Zeichensätze, die mit Escape-Sequenzen (ISO-IR) verwendet werden sollen (PDF). Itcj/Ipsj. p. 14.
- ^ Kongressbibliothek (2007-12-05). "Technik 2: Verwenden von Standard -Grafik -Zeichensätzen mit Standards". MARC 21 Spezifikationen für Rekordstruktur, Zeichensätze und Exchange Media.
- ^ a b c Lunde, Ken (1995-12-18). "2.5.2: cccii". Cjk.inf Version 1.9.
- ^ a b c d e f g h i j k l Kongressbibliothek (2007-12-05). "Ostasiatische Code -Tabellen". MARC 21 Spezifikationen für Rekordstruktur, Zeichensätze und Exchange Media.
- ^ Kongressbibliothek (2007-12-05). "Code Tabelle Korean Hangul". MARC 21 Spezifikationen für Rekordstruktur, Zeichensätze und Exchange Media.
- ^ a b c d e f g h i j Die gezeigten Zeichen sind teilweise gegen einen Vertreter gekreuzigt BDF Schriftart für CCCII, verteilt Von Koichi Yasuoka von der Kyoto University.
- ^ Hongkong Innovative Users Group (2013-01-07). "Einführung in die innovative Benutzergruppe in Hongkong". Universität Hongkong Bibliotheken.
- ^ a b c Kongressbibliothek (2004-09-02). "Zusammenfassungsliste von MARC 21 Zeichen, die dem privaten Gebrauchsbereich (PUA) zugewiesen sind". MARC 21 Spezifikationen für Rekordstruktur, Zeichensätze und Exchange Media.
- ^ Morris, Susan (2007). "Jackphy finden: Online -Katalogisierung, um Arabisch, Hebräisch, andere Skripte einzubeziehen". Information Bulletin Library of Congress. Vol. 66, nein. 12.
- ^ Van Kesteren, Anne. "die großen 5". Codierungsstandard. Waswg.
- Einige Informationen auf dieser Seite basieren auf den Informationen auf der CNS Offizielle Website.
Externe Links
- CNS 11643 Offizielle Website (Englische Version der verfügbaren Seiten) enthält Informationen zum CCCII -Zeichen im Abschnitt "Chinesischer Informationscode" festgelegt
- Vollständige Zuordnung von EACC zu Unicode aus der Bibliothek des Kongresses