Code Seite 949 (IBM)
Alias (e) |
|
---|---|
Sprachen) | Koreanisch |
Erstellt von | IBM |
Einstufung | Erweitert ISO 646, Codierung der variablen Breite, CJK -Codierung |
Erweitert | EUC-kr |
Vorausgegangen von | Code Seite 944 |
IBM Code Seite 949 (IBM-949) ist a Zeichenkodierung das wurde von benutzt von IBM zu repräsentieren koreanische Sprache Text auf Computern. Es ist ein Codierung der variablen Breite was die Zeichen aus dem von dem definierten Wansung -Code darstellt Südkorea Standard KS x 1001 in einem Format kompatibel mit EUC-krfügt aber IBM -Erweiterungen für zusätzliche hinzu Hanja, zusätzlich vorkomponiert Hangul Silben und Benutzerdefinierte Zeichen.
Werte in hexadezimal, Bytes 0x00 bis 0x7f werden für Single Byte KS x 1003 verwendet (ISO 646: KR) Zeichen, eine ähnliche Menge wie ASCII, aber mit a gewonnenes Zeichen eher als einen Backslash. Bytes 0x80 bis 0x84 werden für IBM Single -Byte -Erweiterungszeichen verwendet. Lead -Bytes 0x8f bis 0xa0 werden für IBM -Doppel -Byte -Erweiterungszeichen verwendet. Lead -Bytes 0xa1 bis 0xfe werden für Wansung Code (verwendetKS x 1001 Zeichen in EUC-KR-Form, Doppel-Byte), aber mit einem nicht verwendeten Platz für die benutzerdefinierte Verwendung geöffnet.
Obwohl beide manchmal als "CP949" bezeichnet werden, unterscheidet sich IBM-949 von anders als " Windows -Code Seite 949 (IBM-1363), ein Unified Hangul Code von Microsoft, eine andere Erweiterung von EUC-KR. Es sollte auch nicht mit der Umsetzung von EUC-KR von IBM durch IBM verwechselt werden (IBM-970). Code Seite 949 in OS/2 ist die IBM -Code -Seite; Es gibt jedoch ein Patch von Drittanbietern, um dies zu ändern.[1]
Terminologie und Codierungskennzeichnung
Sowohl IBM-949 als auch Einheitlicher Hangul -Code (Windows-949) werden als "Code Seite 949" (oder "CP949") bezeichnet, obwohl sie nur die EUC-KR-Untergruppe gemeinsam teilen. Weder hat eine standardisierte Iana-registriertes Etikett, um es zu identifizieren. Obwohl UHC in der enthalten ist Waswg Codierungsstandard,[2] mit Etiketten wie "Windows-949",[3] IBM-949 ist nicht. IBM-949 ist daher nicht erlaubt in HTML5.
Obwohl die Bedeutung des Etiketts "IBM-949" (und umgekehrt "Windows-949" und "MS949") eindeutig ist, wo diese Etiketten unterstützt werden, variiert die Interpretation der Codierungsbezeichnungen "949" und "CP949" folglich zwischen den Implementierungen. Zum Beispiel, Internationale Komponenten für Unicode Verwendet "CP949", "949", "IBM-949" und "X-IBM949", um sich auf IBM-949 zu beziehen.[4] und zusätzlich die Bezeichnungen "CP949c", "IBM-949c" und "X-IBM949c", um sich auf eine Variante zu beziehen, die unmodifiziert wird ASCII Zuordnungen für 0x20–7e (was zu doppelten Zuordnungen für den Backslash führt),[5] Während (von den Beschriftungen, die die Code-Seite Nummer 949 enthalten) sind nur "MS949" und "Windows-949" UHC zugeordnet.[6] Dies steht im Gegensatz zu Python, der sowohl "CP949" als auch "949" (zusätzlich zu den expliziteren "MS949" und "UHC" erkennt, aber nicht zu "Windows-949") als Bezeichnungen für UHC und enthält keine IBM-949-Codec.[7] Die Code Seite 949 verwendet von koreanischen Sprachversionen von OS/2 ist die IBM -Code -Seite; Um Unterstützung für den gesamten Unicode-Satz koreanischer Silben hinzuzufügen, besteht ein Drittanbieter-Patch, um ihn durch die Microsoft-Code-Seite zu ersetzen.[1]
IBM-949 ist a Codierung der variablen Breite definiert als die Kombination von zwei Festbreiten Codeseiten, die Single-Byte Code Seite 1088 und das Doppelbyte Code Seite 951.[8][9][10]
Geschichte
Eine Version von Code Seite 951 (ein DBCS-PC, d. H. Doppel-Byte-Nicht-Nicht-ByteEUC nicht-Ebcdic, Code), die Doppel-Byte-Komponente für IBM-949, wird in der Überarbeitung der IBM-Unternehmensspezifikation C-H 3-3220-125 zusammen mit Code Seite 834 (A DBCS-Host, d. H. Double-Byte EBCDIC, Code, Code, Code, Code, Code, Code, definiert. ), das ist die Doppel -Byte -Komponente von Code Seite 933.[11] Diese Version von Code Seite 949/951 betrachtete den gesamten Lead-Byte-Bereich 0x8f-A0 als benutzerdefinierte Region und enthielt nur Standard-Wansung-Zuweisungen und benutzerdefinierte Bereiche, wodurch einige Zeichen nicht enthalten sind, die die Code Seite 933/834 enthalten.[11] Einige spätere Versionen wie die implementiert von Internationale Komponenten für Unicode (ICU) Verkleinern Sie die benutzerdefinierte Region, um diese Zeichen als Erweiterungen einzubeziehen.[12]
Sprachen) | Koreanisch |
---|---|
Erweitert | N-Byte Hangul Code |
Transformationen / codiert | Code Seite 933 |
gefolgt von | IBM Code Seite 949 |
Die Revision von C-H 3-3220-125 im Oktober 1989 hatte stattdessen Code Seite 926 als DBCS-PC-Code definiert, der dieselben Zeichen wie IBM-834 in einem Layout codierte, das sich sowohl von IBM-951 als auch IBM-834 unterscheidet, die hatten Ein anderer Blei-Byte-Bereich und war keine EUC-KR-Erweiterung.[11] IBM-926 wurde mit kombiniert mit Code Seite 891 oder Code Seite 1040 (8-Bit N-Byte Hangul Code und eine Erweiterung davon; Vergleichen Sie wie Schicht jis Erweitert 8-Bit Jis x 0201) IBM-934 bzw. IBM-944 bzw. IBM.[13][14]
Code Seite 944/926 sind jetzt veraltet zugunsten von IBM-949. Die Revision von 1992 bezeichnet Code Seite 926 als "eingeschränkt" ("begrenzt auf die jeweilige Umgebung, für die [sie] registriert ist") und gibt ihre Tabellen oder Mappings nicht von den anderen Codeseiten an.[11] und CCSID 944 wird als "Koexistenz und Migration" eingestuft[14] (Kontrast "interoperabel" für CCSID 949).[8] Internationale Komponenten für Unicode umfassen Unicode Zuordnungen für IBM-949[4][12] und IBM-933, aber seine IBM-944-Mapping wurde 2001 entfernt.[15]
Einzel -Byte -Codes
IBM -Code Seite 949 (Einzel -Byte -Komponente: 1088)[16][17][4][5][12] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | ┌ | ┐ | └ | ┘ | │ | ─ | • | ◘ | ○ | ◙ | ♂ | ♀ | ♪ | ♫ | ☼ |
1x | ┼ | ◄ | ↕ | ‼ | ¶ | ┴ | ┬ | ┤ | ↑ | ├ | → | ← | ∟ | ↔ | ▲ | ▼ |
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | ₩ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | ⌂ |
8x | ¢ | ¬ | \ | ‾ | ¦ | 8f | ||||||||||
9x | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 9A | 9b | 9c | 9d | 9e | 9f |
Axt | A0 | 1-_ | 2-_ | 3-_ | 4 -_ | 5 -_ | 6 -_ | 7-_ | 8 -_ | 9 -_ | 10-_ | 11-_ | 12-_ | 13-_ | 14-_ | fünfzehn-_ |
BX | 16-_ | 17-_ | 18-_ | 19-_ | 20-_ | 21-_ | 22-_ | 23-_ | 24 -_ | 25 -_ | 26-_ | 27-_ | 28-_ | 29-_ | 30-_ | 31-_ |
CX | 32-_ | 33 -_ | 34 -_ | 35-_ | 36 -_ | 37-_ | 38 -_ | 39-_ | 40-_ | 41-_ | 42-_ | 43-_ | 44 -_ | 45-_ | 46 -_ | 47-_ |
Dx | 48 -_ | 49-_ | 50-_ | 51-_ | 52-_ | 53-_ | 54 -_ | 55-_ | 56 -_ | 57-_ | 58 -_ | 59-_ | 60-_ | 61-_ | 62-_ | 63-_ |
Ex | 64-_ | 65-_ | 66-_ | 67-_ | 68-_ | 69-_ | 70-_ | 71-_ | 72-_ | 73-_ | 74-_ | 75-_ | 76 -_ | 77-_ | 78 -_ | 79-_ |
Fx | 80-_ | 81-_ | 82-_ | 83-_ | 84-_ | 85-_ | 86-_ | 87-_ | 88 -_ | 89-_ | 90-_ | 91-_ | 92-_ | 93-_ | 94-_ |
Doppel -Byte -Codes
Lead -Bytes 0x8f - 99, 0xc9, 0xfe (Benutzerdefinierte Bereiche)
IBM-949 ist so konzipiert, dass sie maximal 1880 UDC (benutzerdefinierte Zeichen) unterstützen.[8] einschließlich Bereiche in nicht verwendeten Reihen des Wansung -Flugzeugs und Bereiche außerhalb des Wansung -Flugzeugs. In dieser Version enthalten die Lead -Bytes 0x8f -A0 maximal 1692 UDC und Lead -Bytes 0xC9 und 0xFE maximal 94 (d. H. Mit Trail -Bytes 0xa0 - FEFE).[11] Wenn die Erweiterungen jedoch das gesamte Doppel-Byte-Repertoire von unterstützen IBM-933 Implementiert werden sie Lead -Bytes 0x9a -A0 verwenden, was zu einer geringeren maximalen Anzahl von Zeichen für die Benutzerdefinition führt.[4][12]
Wenn Sie auf Unicode zugeordnet sind, werden 0xc9a1 -C9Fe (zwischen den Silben- und Hanja -Bereichen) dem Unicode abgebildet Privatnutzungsbereich Codepunkte U+E000 - E05D, während 0xFEA1 -FEFE (zwischen dem Ende des Hanja -Bereichs und dem Ende der Ebene) auf U+E05E -E0BB abgebildet werden. Außerhalb des Wansung -Flugzeugs werden 0x8FA0–9AA5 (wobei sich das zweite Byte im Bereich 0xa1 - Fe befindet) auf die privaten Nutzungspunkte u+e0bc -e4ca abgebildet.[4] Der letzte dieser Bereiche schneidet in den Beginn der 0x9a Row (siehe unten).
Insgesamt decken diese privaten Gebrauchsbereiche die Codepunkte U+E000..E4CA ab, sodass 1227 UDC von IBM-949 auf Unicode abgebildet werden kann.[12] Der separate Bereich der privaten Verwendung von U+F843..F86E wird von IBM verwendet, um einige Zeichen innerhalb des erweiterten Hanja -Bereichs abzubilden.[12] Dies folgt frühen Empfehlungen des Unicode-Konsortiums, dass Unternehmenszeichen von U+F8FF nach unten und benutzerdefinierten Zeichen aus U+E000 nach oben zugewiesen werden.[18] und ist Teil eines größeren Unternehmensbereichs für private Nutzungsgebiete, das intern von IBM definiert wird, und verwendet den Bereich U+F83D..F8ff.[19][20]
Lead -Bytes 0x9a - 9d (erweiterte Symbole und Hanja)
Nach der Spezifikation von 1992 ist dieser gesamte Bereich benutzerdefiniert.[11] Wie in der Codec implementiert, hat 0x9aa1 bis 0x9aa5 jedoch das Ende des benutzerdefinierten Bereichs zur Intensivstation beigetragen. Der Rest dieses Bereichs umfasst einige nicht-hangul-Zeichen, die in enthalten sind Code Seite 933 aber nicht in Wansung Code. 0x9aa6 bis 0x9aab enthalten verschiedene technische oder mathematische Symbole. Der Rest enthält Hanja Zusätzlich zu denen in enthalten KS x 1001, obwohl einige von IBM auf den privaten Gebrauchsbereich abgebildet werden.[12]
IBM Code Seite 949 (mit 0x9a vorangestellt)[12][22] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | | | | | | ǂ[a] | ≦ | ≧ | K | ¦ | ʺ | 喀 | 擱 | 羯 | 酣 | |
BX | 醵 | 骼 | 蒹 | 哽 | 扃 | 檠 | 熲 | 畊 | 稧 | 雞 | 杲 | 瞽 | 詁 | 栱 | 槓 | 箜 |
CX | 蝌 | 霍 | 盥 | 鸛 | 鉸 | 佝 | 傴 | 媾 | 嫗 | 晷 | 甌 | 覯 | 颶 | 掬 | 跪 | 巹 |
Dx | 漌 | 岌 | 笈 | 覇 | 鰭 | 唜 | 糯 | 喃 | 曩 | 迺 | 佞 | 獰 | 孥 | 鬧 | 靼 | 怛 |
Ex | 闥 | 韃 | 党 | 蟷 | 碓 | 菟 | 咄 | 垌 | 肚 | 蚪 | 滕 | 灯 | 鐙 | 犖 | 幱 | 埓 |
Fx | 榔 | 涼 | 魎 | 癘 | 膂 | 蠡 | 鑢 | 櫟 | 鬣 | 昤 | 泠 | 苓 | 蛉 | 潦 | 艫 |
IBM -Code Seite 949 (mit 0x9b vorangestellt)[12][22] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | 轤 | 漉 | 祿 | 轆 | 籟 | 蕾 | 誄 | 寥 | 僂 | 髏 | 窿 | 凛 | 廩 | 提 | 漓 | |
BX | 离 | 螭 | 魑 | 痳 | 岦 | 媽 | 蟇 | 謾 | 鏝 | 鬘 | 魍 | 眛 | 苺 | 脉 | 俛 | 耄 |
CX | 鉾 | 濛 | 矇 | 瀰 | 糜 | 閩 | 婆 | 欂 | 牔 | 胖 | 髣 | 魴 | 潘 | 翻 | 辟 | 汴 |
Dx | 辮 | 遍 | 駢 | 彆 | 迸 | 鴇 | 黼 | 蝠 | 丰 | 葑 | 仆 | 罘 | 苻 | 蜉 | 頫 | 鮒 |
Ex | 吟 | 蕡 | 巿 | 髴 | 黻 | 妣 | 沙 | 沘 | 睥 | 篦 | 腓 | 轡 | 髀 | 擯 | 蘋 | 贇 |
Fx | 顰 | 鬢 | 姒 | 麝 | 楂 | 槎 | 笥 | 槊 | 鑠 | 歃 | 鍤 | 霎 | 殤 | 鰓 | 噬 |
IBM -Code Seite 949 (mit 0x9c vorangestellt)[12][22] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | 婿 | 齟 | 射 | 單 | 尠 | 愃 | 洗 | 燹 | 霰 | 偰 | 契 | 挈 | 艘 | 霄 | 蟀 | |
BX | 瑣 | 叟 | 宿 | 晬 | 溲 | 祟 | 雎 | 鶉 | 虱 | 啻 | 寺 | 緦 | 矧 | 瑟 | 萼 | 贋 |
CX | 鴈 | 戞 | 遏 | 嵒 | 諳 | 黯 | 鞅 | 欸 | 皚 | 礙 | 靉 | 阨 | 射 | 篛 | 籥 | 羘 |
Dx | 敔 | 恚 | 射 | 羨 | 臙 | 蠕 | 讌 | 塩 | 饜 | 嬰 | 睨 | 翳 | 蕋 | 遨 | 媼 | 薀 |
Ex | 鰮 | 蕘 | 舂 | 蛹 | 吁 | 熨 | 蜿 | 幃 | 衞 | 囿 | 帷 | 蕤 | 黝 | 鬻 | 檼 | 珢 |
Fx | 齦 | 挹 | 栮 | 頣 | 仞 | 眥 | 粢 | 耔 | 觜 | 赭 | 柞 | 潜 | 蚕 | 嶂 | 瘴 |
IBM Code Seite 949 (mit 0x9d vorangestellt)[12][22] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | 装 | 纔 | 柢 | 蛆 | 豬 | 糴 | 囀 | 巓 | 磚 | 翦 | 窃 | 椄 | 梃 | 晢 | 瑅 | |
BX | 踶 | 吊 | 噪 | 皁 | 竈 | 笊 | 糶 | 絛 | 鯛 | 樅 | 蹤 | 蔟 | 肘 | 隼 | 則 | 証 |
CX | 痣 | 湌 | 慚 | 刱 | 悵 | 氅 | 簀 | 蜴 | 躑 | 濺 | 簷 | 蜻 | 砌 | 靆 | 峭 | 綃 |
Dx | 鈔 | 鞘 | 數 | 躅 | 髑 | 怱 | 葱 | 摧 | 槌 | 甃 | 箒 | 鞦 | 麁 | 麤 | 杻 | 舳 |
Ex | 冲 | 橇 | 贅 | 巵 | 徴 | 鵄 | 忱 | 拆 | 橐 | 駄 | 幀 | 蝙 | 庖 | 炮 | 舖 | 鉋 |
Fx | 鞄 | 分 | 蓖 | 蹕 | 瘧 | 邯 | 鷳 | 炕 | 廨 | 慊 | 篋 | 陜 | 皞 | 醐 | 鶻 |
Lead -Bytes 0x9e - A0 (erweiterte Hanja und Silben)
Nach der Spezifikation von 1992 ist dieser gesamte Bereich benutzerdefiniert.[11] Wie in der Codec von IBM implementiert, enthalten 0x9ea1 bis 0x9eAC den Rest des erweiterten Hanja. Der Rest des Bereichs enthält einige zusätzliche Hangul Silben, die nicht in präkomponierter Form in reinen verfügbar sind EUC-kr. Im Gegensatz zu Unified Hangul Code reicht dies nicht aus, um alle unparteiischen zu unterstützen Johab Silben, die in Wansung Code fehlen.[12]
Unter diesen sind 뢔 (rwae, 0x9efc), 쌰 (ssya, 0x9fe6), 쎼 (SSYE, 0x9fed), 쓔 (SSYU, 0x9ff3) und 쬬 (jjyo, 0xa0c1), die den Anfängen der Standard -Wansung -Zeichen entsprechen 뢨 , 썅, 쏀, 쓩 bzw. 쭁, wenn sie teilweise in eine eingegeben wurden Eingabemethode Editor.
IBM -Code Seite 949 (mit 0x9e vorangestellt)[12] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | 鑊 | 圜 | 懽 | 鬟 | 媓 | 怳 | 囂 | 猴 | 篌 | 忻 | 迄 | 頡 | 갂 | 갋 | 걹 | |
BX | 겇 | 겓 | 곩 | 곺 | 괙 | 괨 | 괫 | 궛 | 귕 | 귬 | 긂 | 긏 | 긑 | 긧 | 긼 | 깄 |
CX | 깉 | 깢 | 꺠 | 꼄 | 꼳 | 꽌 | 꽘 | 꽛 | 꽨 | 꾓 | 꾲 | 꾿 | 꿘 | 꿧 | 뀍 | 뀡 |
Dx | 끠 | 낐 | 낻 | 냬 | 넏 | 넞 | 녇 | 녓 | 녙 | 녯 | 녺 | 놧 | 놰 | 눳 | 늧 | 닁 |
Ex | 닑 | 닠 | 댱 | 댸 | 덨 | 덪 | 뎜 | 돓 | 됀 | 됏 | 됬 | 둗 | 둿 | 뒴 | 듁 | 듧 |
Fx | 딮 | 딲 | 딷 | 딿 | 땨 | 떄 | 뗴 | 뚀 | 뚸 | 뜌 | 럐 | 렏 | 뢔 | 룜 | 뤗 |
IBM -Code Seite 949 (mit 0x9f vorangestellt)[12] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | 릐 | 맟 | 맻 | 먜 | 멫 | 멭 | 몀 | 몯 | 뫃 | 뫠 | 믁 | 믕 | 믜 | 믠 | 밎 | |
BX | 밨 | 밷 | 뱜 | 뱨 | 벘 | 벜 | 벹 | 볌 | 볒 | 볓 | 볔 | 봣 | 붗 | 붴 | 븘 | 븡 |
CX | 븨 | 빋 | 뺜 | 뺴 | 뻭 | 뻰 | 뻴 | 뻿 | 뼤 | 뽜 | 뽸 | 뿀 | 뿕 | 뿝 | 뿨 | 쀄 |
Dx | 쀠 | 쁙 | 쁴 | 삮 | 삷 | 삻 | 샃 | 샇 | 샏 | 섥 | 섿 | 셑 | 셗 | 솓 | 솻 | 슌 |
Ex | 슳 | 싀 | 싦 | 쌂 | 쌋 | 쌧 | 쌰 | 썃 | 썌 | 썻 | 쎅 | 쎙 | 쎠 | 쎼 | 쏼 | 쐿 |
Fx | 쑷 | 쒓 | 쓓 | 쓔 | 씼 | 씿 | 앏 | 앟 | 얐 | 얫 | 얶 | 엱 | 엳 | 옝 | 옫 |
IBM -Code Seite 949 (vorangestellt mit 0xa0)[12] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
Axt | 옺 | 욷 | 웟 | 윋 | 윶 | 읻 | 잧 | 잪 | 젇 | 젔 | 젛 | 젹 | 졋 | 좐 | 좜 | |
BX | 좠 | 좬 | 좰 | 좸 | 죨 | 죰 | 죱 | 줫 | 쥭 | 즤 | 짔 | 쨰 | 쩗 | 쩰 | 쪗 | 쪠 |
CX | 쫒 | 쬬 | 쮀 | 쯥 | 쯰 | 찟 | 찦 | 찯 | 찿 | 챂 | 챱 | 챼 | 쳣 | 쳥 | 쵀 | 췃 |
Dx | 츼 | 칻 | 캗 | 캩 | 컈 | 컽 | 켙 | 쾍 | 쾐 | 쾟 | 쾬 | 쾽 | 킈 | 턔 | 텠 | 텩 |
Ex | 퉷 | 튓 | 틍 | 틧 | 팊 | 팦 | 퍙 | 퍠 | 펲 | 펵 | 폇 | 퐤 | 풰 | 퓩 | 픅 | 픐 |
Fx | 픙 | 픠 | 픤 | 핟 | 핡 | 핬 | 핱 | 햬 | 헏 | 혬 | 횩 | 횸 | 훕 | 휌 | 흭 |
Lead -Bytes 0xa1 - C8, 0xca - FD (Standard Wansung)
Siehe auch
Fußnoten
- ^ Dies ist für den IPA -Support nicht enthalten. Vielmehr in Code Seite 933, ALSO 0x4160 ist ein nicht ähnliches Zeichen, das mit einem Schrägstrich angezeigt wird, während IBM-933 also 0x418d mit einem Backslash (d. H. = ⃥) angezeigt wird.[11] Obwohl es sichGesamtbreite von SA540000) ist es IBM-933 SO 0x418d, das EUC-KR und IBM-949 0xa1c1 zugeordnet ist.[11] Aufgrund der Referenzglyphe für das Nicht-Gleichgewicht zeigt sich KS C 5601-1987 auch mit einem Backslash an.[23] Daher ist U+2260, das EUC-KR und daher IBM-949 0xa1c1 zugeordnet ist Zeichen bei u+01c2.[24]
Verweise
- ^ a b Borgendale, Ken. "OS/2 Codepage- und Tastaturanzeigewerkzeuge".
- ^ Van Kesteren, Anne, "5. Indizes (§ Index EUC-kr)", Codierungsstandard, Waswg,
Dies entspricht dem KS x 1001 -Standard und dem Unified Hangul -Code, der gemeinsam als Windows -Codepage 949 bekannt ist.
- ^ Van Kesteren, Anne. "4.2. Namen und Etiketten". Codierungsstandard. Waswg.
- ^ a b c d e "Converter Explorer: IBM-949_P110-1999 (alias x-ibm949)", Internationale Komponenten für Unicode, Unicode -Konsortium
- ^ a b "Converter Explorer: IBM-949_P11A-1999 (alias x-ibm949c)", Internationale Komponenten für Unicode, Unicode -Konsortium. Dies ist die ASCII-basierte Version von IBM-949.
- ^ "Windows-949-2000", Konverter Explorer, Internationale Komponenten für Unicode
- ^ "Codecs - Codec -Registrierung und Basisklassen § Standardcodierungen". Python 3.7.2 Dokumentation. Python Software Foundation.
- ^ a b c "Codierte Zeichensatzkennungen: CCSID 949". IBM Globalisierung. IBM. Archiviert von das Original Am 2014-11-29.
- ^ "CCSID 1088 Informationsdokument". Archiviert von das Original am 2016-03-26.
- ^ "Code Seite 951 Informationsdokument". Archiviert von das Original Am 2017-01-16.
- ^ a b c d e f g h i j "IBM Korean Graphic Character Set: DBCS-Host und DBCS-PC" (PDF). IBM. 2001 [1992]. C-H 3-3220-125 1992-09.
- ^ a b c d e f g h i j k l m n o Internationale Komponenten für Unicode (ICU), IBM-949_P110-1999.UCM, 2002-12-03
- ^ "Codierte Zeichensatzkennungen: CCSID 934". IBM Globalisierung. IBM. Archiviert von das Original Am 2014-12-02.
- ^ a b "Codierte Zeichensatzkennungen: CCSID 944". IBM Globalisierung. IBM. Archiviert von das Original Am 2014-12-01.
- ^ Viswanadha, Ram (2001-11-01). "ICU-1281 Entfernen Sie unerwünschte UCMFiles". Internationale Komponenten für Unicode.
- ^ Code Seite CPGID 01088 (PDF) (PDF), IBM
- ^ Code Seite CPGID 01088 (TXT), IBM
- ^ "2.0: Änderungen in Unicode 1.0" (PDF). Der Unicode Standard, Version 1.1. Unicode -Konsortium. S. 3–4. UTR #4.
- ^ a b "CPGID 01449: IBM Standard PUA". IBM Globalisierung: Code -Seitenkennungen. IBM. Archiviert von das Original Am 2015-09-16.
IBM hat 195 Positionen von U+F83D zu U+F8FF zur Verwendung als IBM-Unternehmenszone ausgewiesen und beabsichtigt, sie innerhalb von IBM konsistent zu verwenden, wenn die Hin- und Rückfahrt der IBM-Charaktere beibehalten werden muss.
- ^ IBM (1997). unicode.nam: Ermöglichen. (Inbegriffen Borgendale, Ken, OS/2 -Codepage- und Tastaturanzeigewerkzeuge)
- ^ "IBM-933_P110-1995.ucm". Internationale Komponenten für Unicode.
- ^ a b c d Der private Gebrauchbereich, das Hanja zugeordnet ist, werden aus Code -Diagrammen identifiziert. Das IBM-Dokument C-H 3-3220-125 1992-09 enthält Codediagramme für die Codeseiten, die als Doppel-Byte-Komponenten für verwendet werden Code Seite 933 und eine ältere Version von Code Seite 949 ohne diese Erweiterungen; Der Hanja in diesem Abschnitt entspricht jedoch der Teilmenge von Tabelle 7 (und befindet sich in derselben Reihenfolge wie), für die ein "PC -Code" nicht aufgeführt ist.[11] Die Mappings der privaten Gebrauchsgebietsgebietsgebiete sind auch mit anderen Codeseiten koordiniert.[19] Inklusive Code Seite 933,[21] Dies kann verwendet werden, um den "Host -Code" für eine bestimmte private Nutzungsgebietskartierung für Unternehmen zu erhalten.
- ^ Korea Bureau of Standards (1988-10-01). Koreanischer Grafikzeichen für den Informationsaustausch (PDF). Itcj/Ipsj. ISO-IR-149.
- ^ "IBM-933_P110-1995 (Lead-Bytes 0E41)". Konverter Explorer. Internationale Komponenten für Unicode.