KPS 9566

KPS 9566
Alias ​​(e) ISO-IR-202 (Version 1997)
Sprachen) Koreanisch, Englisch, Russisch
Teilunterstützung:
griechisch, japanisch
Standard KPS 9566
Aktueller Status Nur in verwendet Nord Korea.
Einstufung ISO-2022-kompatibel DBCs, CJK -Codierung
Codierungsformate Uhc-Stil -Kodierung,[1] ISO 2022.
Andere verwandte Kodierungen (en) KS x 1001, GB 12052

KPS 9566 (""DPRK Standard Koreanisches Grafikzeichen für den Informationsaustausch"))[2] ist ein nordkoreanisch Standard, das eine Zeichencodierung für die angibt Chosŏn'gŭl (Hangul) Schreibsystem für die koreanische Sprache. In der Ausgabe von 1997 wurde ein angegeben ISO 2022-Compliant 94 × 94 Zwei-Byte codierter Zeichensatz. Nachfolgende Ausgaben haben zusätzliche codierte Zeichen außerhalb der 94 × 94 -Ebene auf eine Weise hinzugefügt, die vergleichbar ist Uhc oder GBK.[3]

KPS 9566 unterscheidet sich im Ansatz von KS x 1001, es ist Südkorea Gegenstück, bei der Verwendung einer anderen Bestellung von Chosŏn'gŭl,[4] Bei der Codierung expliziter vertikaler Präsentationsformen der Interpunktion, bei nicht kodierender Duplikat Hanja Für mehrere Lesungen und für mehrere Charaktere, die für das nordkoreanische politische System spezifisch sind, einschließlich besonderer Codierungen für die Namen der vergangenen und gegenwärtigen Führer des Landes (Führer des Landes (Führer des LandesKim Il-Sung, Kim Jong Il und Kim Jong-un).[1][2][3][5]

Obwohl KPS 9566 die ursprüngliche Quelle mehrerer Zeichen war, die zugefügt wurden Unicode,[6] Nicht alle KPS 9566 -Zeichen haben Unicode -Äquivalente. Diejenigen, die nicht auf ähnliche Unicode -Zeichen oder auf die zugeordnet sind Privatnutzungsbereich.[7]

Hintergrund und andere Standards

Das ASCII Charakter -Set entstand in der Vereinigte Staaten 1963 wurde und wurde 1967 in die Form überarbeitet, die es heute hat.[8] ASCII wurde auch 1967 als internationaler Standard akzeptiert und wurde ECMA-6.[8] festgelegt ISO/IEC 646 bis zum Internationale Standardisierungsorganisation.[9] Es wird derzeit als ANSI X3.4-1986 und ISO 646: 1991 bezeichnet.[10] ASCII war eine 7-Bit-Single-Byte-Codierung, einschließlich 94 grafische Zeichen, der Raum und 33 Kontrollcodes, die grundlegende Unterstützung für die Darstellung des amerikanischen englischen Textes als eine Reihe von Bytes lieferte.[8][10]

Die nächste Ausgabe von ISO 646, die 1972 veröffentlicht wurde, überarbeitete den Standard, um das Konzept von vorzustellen Nationale Versionen des Code, damit die Länder einige weniger häufig verwendete Codes durch ihre eigenen erforderlichen Zeichen ersetzen können. Gleichzeitig war die Arbeiten zur Definition von Verlängerungsmechanismen für ASCII im Gange, mit der Absicht, sowohl für 7-Bit- als auch für 8-Bit-Umgebungen anwendbar zu sein. Dies wurde 1973 fertiggestellt und als veröffentlicht als Jis x 0202, ECMA-35 und ISO 2022.[11] ISO 2022 Gibt Mechanismen für die Verwendung von Single-Byte und Mehrfachbyte an Zeichensätze mit einer bestimmten Struktur sowohl in 7-Bit- als auch in 8-Bit Schichtcodes und Fluchtsequenzen.[12]

Länder in Ostasien, aufgrund der Verwendung großer Repertoires von chinesische Charaktere, standardisiert eingeführt Doppelbyte-Codierungen (DBCS) für ihre Schreibsysteme, da die Anzahl der in einem Single-Byte-Code darstellbaren Zeichen nicht ausreicht. In einem ISO 2022 -konformen DBCs kann jeder Charakter mit zwei ASCII -Druckcharakter -Bytes dargestellt werden. Die Position eines Zeichens kann durch diese Bytewerte oder durch zwei Zahlen von 1 bis 94 (a) verwiesen werden Kuten), gleich den jeweiligen Bytes minus 32.[13] Die erste registrierte ISO 2022 -konforme DBCs und die erste ostasiatische DBCs, die als nationaler Standard eingerichtet wurde, war die erste Ausgabe von Jis x 0208 (Japan), veröffentlicht 1978.[14][15] Es folgte GB 2312 (Festlandchina) im Jahr 1980 und von Wansung Code (Südkorea; erstmals als KS C 5601-1987 bezeichnet) 1987.[16][15] Die großen 5 (Taiwan), definiert 1984, folgte nicht der ISO 2022 -Struktur.[16] Bei Verwendung in einer 8-Bit-Umgebung (statt in 7-Bit) wurden GB 2312 und Wansung Code normalerweise mit dem achten Bit mit ASCII oder ähnlichem verwendet SBCS verwendet mit dem achten bisschen unbestimmt; Diese Codierungsschemata sind als bekannt als EUC-CN und EUC-kr, beziehungsweise.[17]

Obwohl das koreanische Schreibsystem individuelle Symbole enthält (Jamo) für Konsonanten und Vokale, die als eine dienen AlphabetDer koreanische Text wird ordnungsgemäß mit diesen Symbolen in Blöcken für jede Silbe zusammengestellt. Der Wansung -Code enthielt einzelne koreanische Silbenblöcke getrennt und behandelte sie als eine große Anzahl von Zeichen ähnlich wie Hanja,[18] und wurde zuerst durch die dritte Ausgabe des südkoreanischen Standards KS C 5601 definiert. Die erste Ausgabe hatte eine Codierung von einzelnen Jamo definiert, die es ermöglichte, Silbenblöcke als Sequenzen zu kodieren, die benannt wurde N-Byte Hangulund war nicht so weit wie beabsichtigt adoptiert worden.[19][20]

Wansung Code hat nicht alle möglichen modernen koreanischen Silben codiert, nur eine Auswahl der 2350 am häufigsten.[2] Obwohl es ihnen ermöglichte, mit Kombination von Sequenzen festgelegt zu werden, die häufig nicht unterstützt wurden.[18] Eine alternative Kodierung, ebenfalls südkoreanisch, benannt Johab tat und diente einige Zeit als Konkurrent von Wansung.[19] Einheitlicher Hangul -Code (UHC), eingeführt von Microsoft mit Windows 95, erweiterte EUC-KR, die die Verwendung von ungültigen EUC-Doppel-Byte-Codes ermöglicht, um alle anderen in Johab verfügbaren Silben darzustellen.[18] Ein ähnlicher Ansatz wurde vom chinesischen Festland verfolgt GBK Codierung, Ausdehnung GB 2312 Mit Unterstützung traditioneller Chinesen und weniger häufigen chinesischen Zeichen durch Codierung von Doppelbyte-Codes ungültig in EUC-CN.[16]

Südkorea war nicht das einzige Land, das ein ISO 2022 DBC für Koreanisch entwickelte: das chinesische Festland GB 12052 wurde 1989 veröffentlicht. Dies stand nicht eng mit dem Wansung -Code zusammen, enthielt jedoch auch komponierte Silben. Stattdessen entsprach es GB 2312 mit koreanischen Silben (und 94 Hanja) Ersetzen der chinesischen Zeichen, mit Ausnahme der Aufnahme eines Dollar -Schilds anstelle eines Yuan -Zeichens. Es wurde möglicherweise für die koreanische Minderheit im Nordosten Chinas entwickelt.[2]

Ebenso entwickelte Nordkorea KPS 9566. Obwohl Nordkorea und Südkorea beide koreanische Chosŏn'gŭl (Hangul) als primäres Schreibsystem verwenden, verwenden sie unterschiedlich Lexikografische Ordnungen.[21] Daher unterscheidet sich die Charakterordnung zwischen Wansung Code und KPS 9566.[4]

KPS 9566 hat mehrere Überarbeitungen erfahren, darunter Ausgaben von 1997 und 2003,[22] hauptsächlich um die Kompatibilität mit zu verbessern Unicode. Diese werden üblicherweise durch Angabe des Jahres angezeigt (z. B. KPS 9566-97, 9566-2003). Die aktuelle Ausgabe zur Veröffentlichung von Red Star OS 3.0 scheint KPS 9566-2011 zu sein, was hinzugefügt wird Kim Jong-un auf die Liste der Führungskräfte.[3] Das öffentlich verfügbare Code -Diagramm für die 1997er Ausgabe von KPS 9566 zeigt eine ISO 2022 94 × 94 -Ebene.[23] Die neueren Ausgaben aus den Informationsquellen, die außerhalb Nordkoreas selbst verfügbar sind, scheinen zusätzliche Zuordnungen außerhalb der EUC -Ebene zu definieren (ähnlich wie GBK oder UHC).[3]

Aufgrund der Interoperabilitätsprobleme, die sich aus der Verwendung mehrerer nationaler Standard- und Plattform- oder Schriftspezifischen proprietären Charakterkodierungen ergeben, ist die Unicode Standard wurde entwickelt, um zu ermöglichen, dass alle darstellbaren Text in einem einzigen universellen Format austauschten. Die erste Ausgabe von Unicode wurde 1991 und 1992 veröffentlicht.[24] und ISO/IEC 10646 wurde 1993 synchron mit Unicode gegründet.[25] Unicode -Formate werden für den internationalen Gebrauch auf dem bevorzugt Weltweites Netz, wo Legacy -Charakter -Codierungen als partielle Kodierungen von Unicode durch Mapping -Dateien behandelt werden.[26][27]

Entwurf

Im Prinzip ähnelt KPS 9566 dem durch die definierten Wansung -Charakter, der festgelegt ist Südkorea KS x 1001 Standard, obwohl die beiden nicht kompatibel sind. Beide codieren einen Abschnitt der Interpunktion, Symbole, Jamo, Kana und alphabetische Zeichen, gefolgt von einer Untergruppe der möglichen modernen Chosŏn'gŭl -Silben, gefolgt von einem Abschnitt Hanja.[2] KPS 9566 verwendet jedoch eine andere Bestellung von Jamo und Silben, um sich dem Nordkoreaner anzupassen Lexikografische Ordnung Standards.[4] KPS 9566 enthält auch 28 explizit gedrehte Interpunktionszeichen für die vertikale Typografie, die KS x 1001 nicht tut, und kodiert jeden Hanja nur einmal, während KS x 1001 mehrere Hanja mit mehreren Messwerten mehrmals codiert.[2]

KPS 9566-97 codiert insgesamt 2679 Chosŏn'gŭl-Silben und 4653 Hanja. Dies bietet eine bessere Abdeckung als die 2350 Silben, die von Wansung Code codiert werden: Zum Beispiel das 똠 -Zeichen, das im Namen von 똠 방각하 verwendet wird[KO]Eine bekannte koreanische literarische Arbeit hat keinen zugewiesenen Wansung CodePoint, sondern einen (38-02) in KPS 9566.[2] Der Abschnitt Hanja enthält 4652 Zeichen aus dem Einheitliches Repertoire und Bestellung und einer von CJK Unified Ideographs Extension a. Die Gesamtheit von Zeile 15, die zweite Hälfte von Zeile 44 (nach dem Silbenblock) und der zweiten Hälfte von Zeile 94 (nach dem Hanja-Block) kann für benutzerdefinierte Zwecke verwendet werden.[2]

KPS 9566 zeichnet sich besonders durch die Aufnahme mehrerer Sonderfiguren aus dem nordkoreanischen politischen Leben aus. Insbesondere enthält es den Hammer, Sichel und Pinsel des Workers' Party of Koreasowohl ungekreist als auch eingekreist[7] (Codepunkte 12-01 und 12-02),[23] und zwei Gruppen von drei Spezialfiguren, die die Namen der nordkoreanischen Führer unterschreiben Kim Il-Sung (김일성) und Kim Jong Il (김정일) in einer speziellen dekorativen Schriftart (Codepunkte 04-72 bis 04-74 bzw. 04-75 bis 04-77).[28] Die Silben für Kim und IL, die in der Schreibweise beider Namen identisch sind, werden zweimal codiert. KPS 9566-2011 enthält zusätzlich den Namen von Kim Jong-un (김정은) als Codepunkte 04-78 bis 04-80.[3][5]

Aufgrund dieser Sonderzeichen gibt es derzeit keine vollständige Kompatibilität zwischen KPS 9566 und Unicode, es sei denn Privatnutzungsbereich.[1]

KPS 10721

Nordkorea entwickelte auch einen zweiten Charakter -Set, KPS 10721 "Code des ergänzenden koreanischen Hanja, der zum Informationsaustausch eingestellt ist", die im Jahr 2000 veröffentlicht wurde. KPS 10721 codiert einen Satz von mindestens 19469 Hanja[2] Zusätzlich zu denen, die in KPS 9566 enthalten sindDiese hatten nicht alle Zuordnungen zu Unicode, enthielten jedoch 10358 aus dem Einheitliches Repertoire und Bestellung, 3187 von CJK Unified Ideographs Extension a und 107 von CJK -Kompatibilitätsideographien (alle in der Grundlegende mehrsprachige Ebene) sowie 5767 von CJK Unified Ideographs Extension B und 50 von CJK -Kompatibilitätsideografien Supplement (in dem Zusätzliche ideografische Ebene).[2]

Neben der Kartierung dieser Hanja zu Unicode ist wenig über den KPS 10721 -Standard außerhalb Nordkoreas bekannt.[2][5] Für diese Hanja in den Unicode -Code -Diagrammen werden nordkoreanische Referenzglyphen aufgrund eines Mangels an geeigneten Schriftdaten, die dem Unicode -Konsortium verfügbar sind, nicht bereitgestellt.[29] Unicode Hanja-Zeichen mit KPS 9566- oder KPS 10721-Quellen werden dennoch in den KPS-Codes in die KPS-Codes übertragen Unihan Datenbank mit dem Schlüssel kirg_kpsource.[30]

Dokumentation und Beziehung zu Unicode

Die erste Berichterstattung von Unicode über koreanische Silben, hinzugefügt in Version 1.0, basierte auf Wansung Code. In Unicode Version 2.0, einem neuen Block koreanischer Silben (der Gegenwart Hangul Silben Block) wurde hinzugefügt, basierend auf dem in Johab verfügbaren Silbenrepertoire, und der vorherige Block wurde gelöscht (es ist jetzt besetzt von CJK Unified Ideographs Extension a). Dies wurde unter der Annahme geschehen, dass noch keine einkodierten koreanischen Daten vorhanden waren, sondern als "koreanisches Durcheinander" bekannt wurden und die verantwortlichen Ausschüsse sich verpflichteten, in Zukunft keine so inkompatible Veränderung vorzunehmen.[31] Ein von der Unicode -Stabilitätspolitik kodifizierter Versprechen.[32]

Das Code-Diagramm für KPS 9566-97, veröffentlicht April 1997,[2] wurde dem vorgelegt ISO Internationales Register der codierten Zeichensätze zur Registrierung zur Verwendung mit ISO/IEC 2022. Es wurde im Juni 1998 mit der Nummer registriert ISO-IR-202. Dieses Code -Diagramm ist öffentlich von der verfügbar Informationsverarbeitungsgesellschaft Japans.[23]

Im August 1999 reichte die nordkoreanische Nationalbehörde ein Dokument an WG2 ein (ISO/IEC JTC 1/SC 2 Arbeitsgruppe 2), die ISO -Körperschaft, für die verantwortlich ist ISO/IEC 10646, der internationale Standard, der entspricht Unicode. Dieses Dokument forderte die Hinzufügung der KPS 9566-Codes zu den vorhandenen Querversicherungen von der CJK Unified Ideographs Diagramme, die Zugabe von 80 Symbolzeichen aus KPS 9566, die keine vorhandenen Unicode -Zuordnungen hatten, eine Auflösung für den Unterschied in der Kollationsreihenfolge zwischen KPS 9566 und Unicode (aufgrund der Reihenfolge der Zeichen in Unicode nach den südkoreanischen Codierungen) und der Zugabe von 8 kombiniert Jamo. Es wurde auch für WG2 aufgefordert, das vorhandene Unicode -Zeichen und Blockamen zu bearbeiten, um den Begriff "koreanisches Zeichen" und nicht "Hangul" zu verwenden.[33] Eine erweiterte Version dieses Vorschlags, die in mehrere Dokumente unterteilt wurde, wurde im Dezember 1999 als Arbeitselement eingereicht.[34]

Eine detaillierte Antwort wurde von der eingereicht Schwedisch Vertreter im März 2000, der sich gegen einige der Punkte widersetzt und die Schweden gegen den Vorschlag ausgibt. Diese Antwort besagte, dass die Änderung der Codierung der koreanischen Charaktere erneut zu erheblichen Störungen führen würde, noch mehr als beim ersten Mal, was bei vergleichsweise wenigen Implementierungen durchgeführt wurde, die jedoch im Nachhinein nicht hätte durchgeführt werden dürfen. Es wurde erklärt, dass nur wenige oder keine Sprachen durch den Codepunktwert korrekt zusammengestellt werden können und dass eine Schneiderin für die UNICODE COLLATION ALGORITHM oder ISO/IEC 14651 (dann eingezogen werden) sollte für diesen Zweck verwendet werden, und dass normative Namen der bereits zugewiesenen Zeichen aufgrund der Stabilitätspolitik nicht geändert werden können, obwohl nicht normative Übersetzungen in andere Sprachen eingesetzt werden können. Es wurde vorgeschlagen, dass eine maschinenlesbare Mapping-Datei zwischen Unicode und KPS 9566 vom nordkoreanischen Körper selbst bereitgestellt werden könnte und nützlicher wäre als eine gedruckte Kreuzreferenz im Standarddokument. In Bezug auf die vorgeschlagenen zusätzlichen Zeichen stellte die Antwort fest, dass Charaktere, die Kompatibilitätsabzüge in Unicode haben würden, nicht hinzugefügt werden sollten und dass Logos, einschließlich derjenigen der politischen Parteien, und Sonderzeichen für Namen bestimmter Personen nicht hinzugefügt werden sollten.[35]

Im Juli 2000 schrieb die nordkoreanische Körperschaft an WG2 und beschuldigte sie, beide Versionen des Unicode für Koreaner auf der Grundlage südkoreanischer Vorschläge zu entwickeln, ohne Nordkorea zu konsultieren, und beschuldigte sie, die kommerziellen Interessen von Unternehmen und Ängsten der internationalen Furcht vorzulegen. Verwirrung über den Respekt gegen die Souveränität Nordkoreas und die Begründung, dass Nordkorea die weitere Weigerung betrachten würde, den Namen und die Ordnung der koreanischen Charaktere in Unicode als Beleidigung ihrer souveränen Würde und als Kompromiss dessen zu ändern ISO'S Ansprüche auf Unparteilichkeit. Sie wiederholten ihre Nachfrage nach WG2 und Unicode, um die Reihenfolge der koreanischen Charaktere zu "korrigieren" und die Namen "Hangul Jamo" und "Hangul Silbe" zu "koreanischem Alphabet" und "koreanischer Silbe" zu "korrigieren".[4]

Im August 2000 reichte die nordkoreanische Nationalgremium eine detailliertere Version ihrer Anfragen in einer Reihe von fünf aufeinanderfolgenden Vorschlägen ein. Diese forderten die Hinzufügung von 14 zusätzlichen Jamo -Zeichen.[36] die Zugabe von 82 Symbolzeichen,[37] und die Verwendung des Begriffs "koreanisches Alphabet" anstelle von "Hangul",[38] lieferte unterstützende Beweise für den nordkoreanischen Aufrechterhalten,,[21] und forderte das nordkoreanische Hanja -Repertoire.[39] Diese Vorschläge wurden in zwei Treffen zwischen Nordkoreaner diskutiert, Südkorea, Schwedische und andere WG2 -Vertreter im September 2000, bei denen die nordkoreanische Körperschaft gebeten wurde, Manuskriptbeweise für die zusätzlichen Jamo -Zeichen zu liefern, ihren Symbolvorschlag mit Symbolen erneut in Unicode entfernt und in Betracht zu ziehen, und die Verwendung zu erwägen ISO/IEC 14651dann in der endgültigen Entwurfsbühne für Kollationszwecke.[40]

Im September 2001 reichte die nordkoreanische Nationale Körperschaft eine überarbeitete Reihe von Vorschlägen ein, in dem die Hinzufügung mehrerer KPS 9566- und KPS 10721 -Zeichen, einschließlich 70 Symbolzeichen, zu Unicode angefordert wurde.[41][42] In dieser Version des Vorschlags wurde ein Abschnitt von Dokumentauszügen, die die Verwendung mehrerer Zeichen und kurze Erklärungen ihres Zwecks demonstrieren, enthalten. Das Workers' Party of Korea Symbol wurde als "Hammer und Sichel und Pinsel" bezeichnet,[41] in früheren Versionen des Vorschlags umbenannt in "Mark der Arbeiterpartei in Korea", umbenannt,[37] und gerechtfertigt als ein identifizierendes Symbol auf Karten.[41] Als Rechtfertigung für die vorgeschlagenen Charaktere für die Namen der Führungskräfte erklärten sie, dass die Namen der Führungskräfte häufig mit einer anderen Größe und einem Schriftgewicht in nordkoreanischen Veröffentlichungen zum Zwecke der Betonung erscheinen.[41] Eine Follow-up der südkoreanischen WG2-Vertreter beantragte Beweise, Namen in Koreanisch und Begründung für das Hinzufügen bestimmter dieser Charaktere, und stellte fest, dass nicht betroffene Versionen der Charaktere für die Namen der Führer bereits existierten.[43] Im Oktober 2001 wurde ein Treffen der nord- und südkoreanischen Vertreter der WG2 einberufen, die 47 der Symbolfiguren für die Hinzufügen von Unicode empfohlen hatte, und schlug vor, dass die Namen und die WPK -Symbole der Führungskräfte zur weiteren Diskussion von WG2 erhoben werden.[44]

Ein nachfolgendes Feedback -Dokument vom Februar 2002 in Bezug Teehaus Als ein allgemeineres "heißes Getränk" -Symbol akzeptiert werden und es mit Symbolen gleichsetzen, die in Reiseführer verwendet werden, um heiße oder alkoholfreie Getränke zu bezeichnen. Es wurde auch empfohlen, die Referenzglyphe für den vorhandenen CodePoint für einen Regenschirm ohne Regen zu modifizieren, um mit der vorgeschlagenen Referenzglyphe für den Regenschirm mit Regen zu harmonieren, sie mit den für die Verpackung verwendeten "trockenen" -Symbole gleichzusetzen, und stellte die Frage der Frage, welche Blitz- und Hochspannungswarnsymbole in vorhandenen Symbolsammlungen könnten mit dem vorgeschlagenen "Hochspannung" -Scharakter vereinheitlicht werden.[45] Alle drei Charaktere wurden in Version 4.0 in Unicode aufgenommen.[46] Es wurde auch empfohlen, die horizontalen Fraktionen und die nach links gezeigte Schere mit a zu codieren VariationswählerDa die Schere kein unterschiedlich orientiertes Paar Scheren begleitete und die vorhandenen Unicode-Fraktions-Codepoints die verzerrten und horizontalen Formen enthielten.[45]

Im November 2002 veröffentlichte die südkoreanische Körperschaft eine Reihe von Drei-Wege Eingabe aus Nordkorea.[47]

Im August 2004 zwei Mapping-Tabellen zwischen KPS 9566-2003 und Unicode wurden dem vorgelegt OpenOffice.org Projekt einer Person unter Verwendung des Namens "Ooprojlover", der angab, dass sie die aktualisierte Version des KPS 9566 -Standards darstellten, und forderten die Hinzufügung des Supports an.[22] Diese Dateien kartierten die in Unicode nicht verfügbaren Zeichen auf die Privatnutzungsbereichund enthalten zusätzliche codierte Formulare für andere Silbenblöcke außerhalb der Haupt-ISO-IR-202-Ebene. Eine Mapping -Tabelle wurde später von der veröffentlicht Unicode -Konsortium Im Jahr 2011 basierend auf diesen Zuordnungsdaten, jedoch mit Fehlern, die unter Bezugnahme auf das ISO-IR-Diagramm korrigiert wurden.[1]

Kopien von Red Star OS 3.0 enthalten Schriftarten für eine neuere Ausgabe von KPS 9566, die KPS 9566-2011 zu sein scheinen. Die von Red Star OS verwendete Mapping -Tabelle wurde intern erfolgreich extrahiert. Neben dem Hinzufügen Kim Jong-un In der Liste der Führungskräfte ändert KPS 9566-2011 die Zuordnungen bestimmter vertikaler Formen im Vergleich zu den Zuordnungen von 2003 (nutzen Sie die Ausnutzung des Vertikale Formen Block in Unicode 4.1 hinzugefügt) und enthält auch mehrere zusätzliche Hanja und Symbole, die außerhalb der ISO-IR-202-Ebene codiert sind. Einige dieser zusätzlichen Symbole sind ebenfalls dem privaten Gebrauchsbereich zugeordnet. Ihre Identität ist jedoch nicht bekannt, da außerhalb Nordkoreas keine Namen oder Referenzglyphen für diese Zeichen bekannt sind.[3]

Auswirkungen auf Unicode heute

Unicode 4.0 wurden aufgrund der nordkoreanischen Vorschläge zu mehreren aktuellen Unicode -Zeichen hinzugefügt, obwohl nicht immer an den ursprünglichen vorgeschlagenen Codepoints. Dazu gehören heißes Getränk (☕ ☕, vorgeschlagen als Teesymbol), das als Kartensymbol zum Markieren a vorgeschlagen wurde Teehausund die Flaggensymbole weiße Flagge (⚐) und schwarze Flagge (⚑), die als Kartensymbole für Schlachten und militärische Siege vorgeschlagen wurden.[6] Diese Zeichen wurden für die vorläufigen Codepunkte U+270A, U+268E bzw. U+268F vorgeschlagen.[44] aber an den endgültigen Codepunkten U+2615, U+2690 bzw. U+2691 codiert.[48] Sie enthalten auch eine Reihe von Richtungspfeilen im Bereich U+2B05 bis U+2B0D.[44] ohne einen Arrow nach rechts, der einem vorhandenen Charakter in der zugeordnet wurde Dingbats Block,[49] die an den gleichen Codepunkten hinzugefügt wurden, für die sie vorgeschlagen wurden, neben den nordöstlichen und nordwestlichen Pfeilen, die im Vergleich zum Vorschlag getauscht wurden.[50]

Weitere piktografische Charaktere, die in den nordkoreanischen Vorschlag aufgenommen wurden, sind der Regenschirm mit Regentropfen (☔), der Blitz für Hochspannung (⚡) und das Warndreieck (⚠ ⚠ ⚠.[44] Nach einer Diskussion darüber, welches andere Hochspannungssymbol Glyphen im Gebrauch war das gleiche Charakter wie das aus dem nordkoreanischen Vorschlag,[45] und welcher Glyphe am besten in das Unicode -Code -Diagramm einbeziehen kann,[51] und nach der Änderung des Codentafel Glyphe des vorhandenen Regenschirmcharakters ohne Regen (U+2602, ☂), um mit dem neuen Regenschirm mit Regentropfen aus dem nordkoreanischen Vorschlag zu harmonisieren,[45][53] Diese Zeichen wurden auch in Unicode 4.0 hinzugefügt, gleichzeitig wie die Flaggen und das Getränksymbol.[46][48][51] Obwohl für die vorläufigen Codepunkte U+2618 vorgeschlagen, U+267F und U+267E,[44] Sie erhielten die endgültigen Codepunkte U+2614, U+26A1 bzw. U+26A0.[48]

Von diesen Charakteren wurden das heiße Getränk, der Regenschirm mit Regentropfen, Blitz und Warndreieck sowie die Aufwärts-, Abwärts- und Linkspfeile anschließend als Zuordnungen aus dem japanischen Zell ausgewählt Emoji Sets,[54] Insgesamt sieben aktuelle Unicode -Emoji, die ursprünglich auf Antrag von Nordkorea zu Unicode hinzugefügt wurden. Der Regenschirm mit Regentropfen und den Aufwärts-, Abwärts- und Linkspfeilen war ebenfalls mit Charakteren aus dem vereint ARIB -Erweiterungen verwendet im japanischen Rundfunk,[55] die mehrere Zeichen enthalten, die jetzt als Emoji eingestuft sind,[56] und wurde Unicode in Unicode 5.2 zugeordnet.[57] Das als Emoji oder in Emoji Regional- und Identity -Flag -Sequenzen verwendete Paar weißer und schwarzer Flaggen ist jedoch ein anderer "Wellen" -Set, der in Unicode 7.0 hinzugefügt wurde (U+1F3F3 und U+1F3F4).[58][59] Nicht das nordkoreanische Paar.

Ab 2018 blieben mehrere KPS 9566 -Zeichen verbleiben, die nicht auf Unicode zugeordnet sind. Dazu gehören das WPK-Symbol, vier dreieckige Markierungen, ein nach links zeigender Scherespaar (ausgeschlossen auf der Begründung, die diese kontrastive Verwendung mit den rechten Scheren in der Dingbats Block war nicht nachgewiesen worden), ein nach oben zeigender Manikule In einem Kreis vertikale Präsentationsformen von Interpunktionsmarken, Varianten der Schließklammern integrieren Punkte, horizontale Varianten von Varianten von vulgäre Brüche getrennt von ihren schrägen Versionen und den Namen der Führer kodiert.[60]

A Japanische Postmarke mit einem Abwärtsgerichtsdreieck wurde in KPS 9566-97 enthalten, wurde jedoch in KPS 9566-2003 entfernt[1] Nachdem die nordkoreanische Körperschaft sie aus ihrem Unicode -Vorschlag zur Überprüfung zurückgezogen hatte[61] als Reaktion auf Anfragen des südkoreanischen Körpers nach Beweisen für die Verwendung des Symbols in Nordkorea.[43] Diese Marke wurde 2018 auf der Grundlage der Kompatibilität von KPS 9566 neu aufgebaut und als in Japan in Japan verwendete elektrische Konformitätsmarke identifiziert PSE Diamond.[62] Es wurde zu Unicode in Version 13.0 hinzugefügt, die 2020 veröffentlicht wurde.

Codierte Formen

Die Ausgabe von KPS 9566 von 1997 wurde im Internationalen Register der codierten Zeichensätze für die Verwendung mit Escape-Sequenzen als ISO-IR-202 registriert.[23] und kann daher mit Verwendung codiert werden ISO/IEC 2022. Es ist eine 94n Mehrfach-Byte-G-Set, d. H. Wenn es in einem 7-Bit-ISO 2022-Code verwendet wird (analog zu ISO-2022-JP oder ISO-2022-kr), Zeichen werden im entsprechenden Modus mit Bytespaaren zwischen 0x21 und 0x7e codiert.

Die dokumentierten Zuordnungen zwischen KPS 9566 und Unicode für die 2003[22][1] und 2011[3] Ausgaben von KPS 9566 Verwenden Sie eine Codierung, die einer Anpassung von ähnelt Einheitlicher Hangul -Code (UHC), um KPS 9566 anstelle von Wansung-Code zu codieren, wobei ihre aktualisierten Versionen der ISO-IR-202-Ebene unter Verwendung von Byt-Paaren zwischen 0xa1 und 0x codiert werden, und mit anderen Zwei-Byte-Codes, die für Silben verwendet werden, die nicht in ISO- vorhanden sind. IR-202. Die Reihenfolge der erweiterten Silben folgt der üblichen KPS 9566 -Bestellung. Ähnlich wie bei UHC verwenden sie Lead -Bytes 0x81 und höher und Trail -Bytes aus den Bereichen 0x41–0x5a, 0x61–0x7a und 0x81–0xfe, ausgenommen der Bereich 0xa1–0xe, wenn der Blei -Byte 0xa1 oder höher ist.[3]

Die Ausgabe 2011 enthält auch mehrere zusätzliche Hanja und Symbole, die außerhalb der ISO-IR-202-Ebene nach dem Bereich für die erweiterten Silbenblöcke verwendet wurden.[3] Dieser Ansatz ist ähnlich wie bei GBKAber mit den Trail-Bytes in den UHC-Bereichen verbleiben: Wie die erweiterten Silben mit Lead-Bytes 0xa1 und höher verwenden alle die Trail-Byte-Bereiche 0x41–0x5a, 0x61–0x7a und 0x81–0xa0. Erweiterte Hanja werden mit Blei Bytes zwischen 0xc8 und 0xDC codiert, erweiterte Symbole werden unter Verwendung von Blei Bytes zwischen 0xe0 und 0xea codiert und erweiterte Codes mit Lead -Bytes zwischen 0xec und 0xFE sind ohne Lücken zu den Lücken zu den Kartierungen zu den Privatnutzungsbereich[3] (Vergleichen Sie die benutzerdefinierten Bereiche in GBK). Einige der Zeichen im Abschnitt Erweiterter Symbole und drei im Abschnitt Hanja werden ebenfalls dem privaten Gebrauchsbereich von Unicode abgebildet. Im Gegensatz zu den pua-abgebildeten Symbolen in der Haupt-ISO-IR-202-Ebene wird die Identität dieser Zeichen nicht dokumentiert.[3]

Lead -Byte

In diesem Diagramm wird das Gesamtlayout der Hauptebene des KPS 9566 -Zeichens von Lead -Byte festgelegt.[23] Für Lead -Bytes, die für andere Zeichen als komponierte Chosŏn'gŭl -Silben oder Hanja verwendet werden, werden Links auf die Diagramme auf dieser Seite zur Verfügung gestellt, in der die unter dieser Lead -Byte codierten Zeichen aufgeführt sind. Für Lead -Bytes, die für Hanja verwendet werden, werden Links zum entsprechenden Abschnitt von bereitgestellt WiktionärHanja Index.

Wenn zwei hexadezimale Zahlen angegeben sind, wird der Wert unter 0x7f in einer 7-Bit-Codierung verwendet.[a] und der größere Wert (zwischen 0xa1 und 0xfe) wird in einem 8-Bit verwendet EUC-Stil -Kodierung.[17] Das erweiterte Uhc-Style 8-Bit-Codierungen, die ab 2003 definiert sind, verwenden ebenfalls die größeren Byte-Werte zwischen 0xa1 und 0x inklusive für die Hauptebene auf ISO-IR-202.[1][3]

KPS 9566 (Lead -Byte)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax Sp[b] 1-_ 2-_ 3-_ 4 -_ 5 -_ 6 -_ 7-_ 8 -_ 9 -_ 10-_ 11-_ 12-_ 13-_ 14-_ fünfzehn-_
3x/bx 16-_ 17-_ 18-_ 19-_ 20-_ 21-_ 22-_ 23-_ 24 -_ 25 -_ 26-_ 27-_ 28-_ 29-_ 30-_ 31-_
4x/cx 32-_ 33 -_ 34 -_ 35-_ 36 -_ 37-_ 38 -_ 39-_ 40-_ 41-_ 42-_ 43-_ 44 -_ 45-_ 46 -_ 47-_
5x/dx 48 -_ 49-_ 50-_ 51-_ 52-_ 53-_ 54 -_ 55-_ 56 -_ 57-_ 58 -_ 59-_ 60-_ 61-_ 62-_ 63-_
6x/ex 64-_ 65-_ 66-_ 67-_ 68-_ 69-_ 70-_ 71-_ 72-_ 73-_ 74-_ 75-_ 76 -_ 77-_ 78 -_ 79-_
7x/fx 80-_ 81-_ 82-_ 83-_ 84-_ 85-_ 86-_ 87-_ 88 -_ 89-_ 90-_ 91-_ 92-_ 93-_ 94-_ Del[b]

Nicht-Hanja, nicht komponierte Sets in der Hauptebene

Zeichensatz 0x21/0xa1 (Zeilennummer 1, Interpunktion und vertikale Formen)

Dieser Satz enthält eine gemeinsame Satzzeichen wie Klammern, Anführungszeichen, Kommas usw. sowie Präsentationsformulare zur Verwendung im vertikalen Schreiben. ASCII Grundlatein CodePoints (im Einklang mit Artikeln zu anderen CJK -Zeichensätzen wie z. KS x 1001 oder Jis x 0208), wird aber dem zugeordnet Halbbreiten- und Vollbreitenformen Blockieren Sie, wenn Sie in einer Codierung verwendet werden, die KPS 9566 mit kombiniert ASCII (wie definiert durch beispielsweise der Ausgabe 2003).[1]

Im Vergleich zur Zuordnung von 2003 ändert die Mapping von 2011 die Unicode -Zuordnungen von drei vertikalen Präsentationsformen, um die zu nutzen Vertikale Formen Block mit Unicode 4.1 eingeführt.[3]

KPS 9566 (vorangestellt mit 0x21/0xa1)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax IDSP
3001

3002
,
002c
.
002e
·
00B7
:
003a
;
003b
?
003f
!
0021

2025

2026
~[c]
007e

3003

2015
3x/bx [d]
2010
_
005f
[e]
Ffe3
/
002f
\
005c
|
007c

2225

2215

2216

309b

309c
´
00B4
`
0060
¨
00A8
^
005e
ˇ
02c7
4x/cx ˙
02d9
ʼ/ ˚/ ˊ/
22ee
ⸯ[f]
2018

2019

201c

201d
(
0028
)
0029

3014

3015
[
005b
]
005d
5x/dx {
007b
}
007d

3008

3009

300a

300b

300c

300d

300E

300f

3010

3011
.))[g] .⟫[g]
201a

201b
6x/ex
201e

201f

Fe35

Fe36

Fe39

Fe3a

Fe47

Fe48

Fe37

Fe38
︿
Fe3f

Fe40

Fe3d

Fe3e

Fe41

Fe42
7x/fx
Fe43

Fe44

Fe3b

Fe3c
 ASCII -Interpunktion kann ebenfalls zugeordnet werden Die Halbbreiten- und Fullwidth -Formen blockieren.
 Zugeordnet in den privaten Gebrauchsbereich, simuliert simuliert.

Zeichensatz 0x22/0xa2 (Zeilennummer 2, Symbole und Operatoren)

Dieser Satz enthält mathematische Operatoren und einige andere Symbole wie das Et-Zeichen, Pilcrow, Musik Note und so weiter. ASCII Grundlatein Codepoints (im Einklang mit Artikeln zu anderen CJK -Zeichensätzen), wird aber dem zugeordnet Halbbreiten- und Vollbreitenformen Blockieren Sie, wenn Sie in einer Codierung verwendet werden, die KPS 9566 mit kombiniert ASCII.[1]

Mehrere dreieckige "Straßenmark" -Symbole, die bevorstehende Berge oder Steigungen vor oder auf einer Seite bezeichnen, sind in dieser Reihe enthalten, aber derzeit nicht in Unicode enthalten. Sie werden dem privaten Gebrauchsbereich zugeordnet.[41]

KPS 9566 (vorangestellt mit 0x22/0xa2)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax +
002b
-
002d
±
00B1
×
00d7
÷
00f7
=
003d

2260
<
003c
>
003e

2266

2267

221e

2234

2642

2640
3x/bx
2220

22a5

2312

2202

2207

2261

2252

2248

226a

226b

221a

223d

221d

2235

222b

222c
4x/cx
222e

2208

220b

2286

2287

2282

2283

2209

220c

2288

2289

2284

2285

222a

2229

2227
5x/dx
2228
[e]
Ffe2

21d2

21d4

2200

2203

2211
#
0023
&
0026
*
002a
@
0040
§
00A7

203b

2606

2605

25cb
6x/ex
25cf

25ce

25c7

25c6

25a1

25A0

25b3

25b2

25bd

25bc

25b7

25c1

25b6

25c0
[h]
2218
[ich]
2219
7x/fx
2756
[j][k] [j] [j] [j]
2690

2691

266f

266d

266a

2020

2021

00B6

2295

2296
 ASCII -Interpunktion kann ebenfalls zugeordnet werden Die Halbbreiten- und Fullwidth -Formen blockieren.
 Zugeordnet in den privaten Gebrauchsbereich, simuliert simuliert.

Zeichensatz 0x23/0xa3 (Zeilennummer 3, Ziffern und Roman)

Dieser Satz enthält eine Teilmenge von ASCII, minus Interpunktion und Symbole, bestehend aus Westarabische Ziffern und beide Fälle der Grundlegendes lateinisches Alphabet. Vergleichen Reihe 3 von JIS x 0208, was diese Reihe genau übereinstimmt. Vergleichen und gegenüberstellen Reihe 3 von KS x 1001 und GB 2312, einschließlich ihrer gesamten nationalen Varianten von ISO 646 In dieser Zeile und nicht nur die alphanumerische Untergruppe.

Die Zeichen in dieser Zeile sind unten zugeordnet Grundlatein CodePoints (im Einklang mit Artikeln zu den anderen Zeichensets), wird aber dem zugeordnet Halbbreiten- und Vollbreitenformen Blockieren Sie, wenn Sie in einer Codierung verwendet werden, die KPS 9566 mit kombiniert ASCII.[1]

KPS 9566 (vorangestellt mit 0x23/0xa3)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax
3x/bx 0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
4x/cx A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
I
0049
J
004a
K
004b
L
004c
M
004d
N
004e
O
004f
5x/dx P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005a
6x/ex a
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
i
0069
j
006a
k
006b
l
006c
m
006d
n
006e
o
006f
7x/fx p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007a

Zeichensatz 0x24/0xa4 (Zeilennummer 4, Chosŏn'gŭl Jamo und Leaders 'Namen)

Dieser Satz enthält Chosŏn'gŭl Jamosowie besondere Codierungen für die Namen der nordkoreanischen Führer (ab 2003) Kim Il-Sung und Kim Jong Il. Der Name von Kim Jong-un ist auch zur Ausgabe 2011 enthalten.[3] Vergleichen mit Reihe 4 von KS x 1001.

Der Jamo in dieser Reihe, der im Unicode existiert Hangul -Kompatibilität Jamo Block (der die von KS x 1001 abgebildeten positionunabhängigen Zeichen enthält) werden diesem Block zugeordnet. Das veraltete Jamo Unterscheidung palatalisierter Zischflüssigkeiten zu den positionspezifischen Zeichen in der Hangul Jamo Block.[1] Im Gegensatz die Blei -Byte 0xea.[3]

Die besonderen Codierungen der Namen der Führungskräfte sind in Unicode nicht vorhanden und dem privaten Gebrauchsbereich zugeordnet. Sie werden unten mit Markup simuliert.

KPS 9566 (vorangestellt mit 0x24/0xa4)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax
3131

3134

3137

3139

3141

3142

3145

3147

3148

314a

314b

314c

314d

314e

3132
3x/bx
3138

3143

3146

3149

314f

3151

3153

3155

3157

315b

315c

3160

3161

3163

3150

3152
4x/cx
3154

3156

315a

315f

3162

3158

315d

3159

315e

3133

3135

3136

313a

313b

313c

313d
5x/dx
313e

313f

3140

3144

317f

3181

3186

318d

113c

113d

113e

113f

114e

114f

1150

1151
6x/ex
1154

1155
[l] [l] [l] [l] [l] [l] [l] [l]
7x/fx [l]
 Zugeordnet in den privaten Gebrauchsbereich, simuliert simuliert.

Zeichensatz 0x25/0xa5 (Zeilennummer 5, kyrillisch)

Dieser Satz enthält beide Fälle von 33 Buchstaben aus dem Cyrillic Drehbuch, ausreichend, um die Moderne zu schreiben Russisches Alphabet und Bulgarisches Alphabet, obwohl andere Formen von kyrillisch zusätzliche Buchstaben erfordern.[65]

Vergleichen Reihe 12 von KS x 1001 und Reihe 7 von JIS x 0208, die das gleiche Layout verwenden (aber in einer anderen Zeile).

KPS 9566 (vorangestellt mit 0x25/0xa5)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax А
0410
Б
0411
В
0412
Г
0413
Д
0414
Е
0415
Ё
0401
Ж
0416
З
0417
И
0418
Й
0419
К
041a
Л
041b
М
041c
Н
041d
3x/bx О
041e
П
041f
Р
0420
С
0421
Т
0422
У
0423
Ф
0424
Х
0425
Ц
0426
Ч
0427
Ш
0428
Щ
0429
Ъ
042a
Ы
042b
Ь
042c
Э
042d
4x/cx Ю
042e
Я
042f
5x/dx а
0430
б
0431
в
0432
г
0433
д
0434
е
0435
ё
0451
ж
0436
з
0437
и
0438
й
0439
к
043a
л
043b
м
043c
н
043d
6x/ex о
043e
п
043f
р
0440
с
0441
т
0442
у
0443
ф
0444
х
0445
ц
0446
ч
0447
ш
0448
щ
0449
ъ
044a
ы
044b
ь
044c
э
044d
7x/fx ю
044e
я
044f

Zeichensatz 0x26/0xa6 (Zeilennummer 6, griechische Buchstaben und römische Ziffern)

Dieser Satz enthält römische Zahlen und grundlegende Unterstützung für die griechisches Alphabet, ohne Diakritik oder die Final Sigma.

Vergleichen und gegenüberstellen Reihe 5 von KS x 1001 (der dieselben Zeichen, aber in einem anderen Layout und einer anderen Zeile verwendet) und Reihe 6 von JIS x 0208 (Das verwendet das gleiche Layout für die griechischen Buchstaben, jedoch ohne die römischen Ziffern).

KPS 9566 (vorangestellt mit 0x26/0xa6)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax Α
0391
Β
0392
Γ
0393
Δ
0394
Ε
0395
Ζ
0396
Η
0397
Θ
0398
Ι
0399
Κ
039a
Λ
039b
Μ
039c
Ν
039d
Ξ
039e
Ο
039f
3x/bx Π
03a0
Ρ
03A1
Σ
03a3
Τ
03A4
Υ
03A5
Φ
03A6
Χ
03a7
Ψ
03a8
Ω
03a9
4x/cx α
03b1
β
03b2
γ
03b3
δ
03b4
ε
03b5
ζ
03b6
η
03b7
θ
03b8
ι
03b9
κ
03ba
λ
03BB
μ
03BC
ν
03BD
ξ
03be
ο
03bf
5x/dx π
03c0
ρ
03c1
σ
03c3
τ
03c4
υ
03c5
φ
03c6
χ
03c7
ψ
03c8
ω
03c9
6x/ex
2160

2161

2162

2163

2164

2165

2166

2167

2168

2169
7x/fx
2170

2171

2172

2173

2174

2175

2176

2177

2178

2179

Zeichensatz 0x27/0xa7 (Zeilennummer 7, eingekreist, superscript, Index, Fraktionen)

In der Ausgabe von 2003 wurden in dieser Zeile in dieser Zeile mehrere eingekreiste Zahlen fälschlicherweise auf Unicode abgebildet, da die nicht finalen vorgeschlagenen Codepunkte verwendet wurden.[1] Sie wurden in der Ausgabe 2011 korrigiert.[3]

KPS 9566 (vorangestellt mit 0x27/0xa7)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax
2460

2461

2462

2463

2464

2465

2466

2467

2468

2469

246a

246B

246c

246d

246e
3x/bx
246f

2470

2471

2472

2473

3251

3252

3253

3254

3255

3256

3257

3258

3259

325a
4x/cx
3260

3261

3262

3263

3264

3265

3266

3267

3268

3269

326a

326b

326c

326d
5x/dx
326e

326f

3270

3271

3272

3273

3274

3275

3276

3277

3278

3279

327a

327b
6x/ex
2070
¹
00B9
²
00B2
³
00B3

2074

2075

2076

2077

2078

2079
½
00bd

2153

2154
¼
00BC
¾
00be
7x/fx
2080

2081

2082

2083

2084

2085

2086

2087

2088

2089
1/2[m] 1/3[m] 2/3[m] 1/4[m] 3/4[m]
 Zugeordnet in den privaten Gebrauchsbereich, simuliert simuliert.

Zeichensatz 0x28/0xa8 (Zeilennummer 8, Einheit, Menge und Währungssymbole)

Dieser Satz enthält Symbole für Maßeinheiten und Währung. Die in ASCII vorhandenen (hervorgehoben) sind nachstehend gezeigt, um zugeordnet zu werden Grundlatein Codepoints (im Einklang mit Artikeln zu anderen CJK -Zeichensätzen), werden jedoch dem zugeordnet Halbbreiten- und Vollbreitenformen Blockieren Sie, wenn Sie in einer Codierung verwendet werden, die KPS 9566 mit kombiniert ASCII.[1]

Das Kelvin Das Zeichen wurde durch a ersetzt Eurozeichen In der Ausgabe 2003.[1] Die Ausgabe 2011 enthält eine alternative Codierung des Kelvin -Zeichens bei 0xe988.[3]

Vergleichen und kontrastieren Sie das Repertoire von Einheitensymbolen, die in enthalten sind Reihe 7 von KS x 1001.

KPS 9566 (vorangestellt mit 0x28/0xa8)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax °
00B0

2032

2033

2103

2109
/[n]
Ffe6
$
0024
[e]
Ffe0
[e]
Ffe1
[e]
Ffe5
%
0025

2030

212b

33c4
3x/bx
33A1

33A5

339d

33A0

33A4

339c

339f

33a3

3377

3378

3379

339e

33A2

33A6

3399

339a
4x/cx
339b

33A7

33A8

338d

338e

338f

33b4

33b5

33b6

33b7

33b8

33b9

3380

3381

3382

3383
5x/dx
3384

33ba

33BB

33BC

33BD

33be

33bf

2126

33c0

33c1

3390

3391

3392

3393

3394

33de
6x/ex
33df

33b0

33b1

33b2

33b3

338a

338b

338c

33a9

33aa

33AB

33AC

2113

3395

3396

3397
7x/fx
3398

33ff

3388

3389

33ad

33ae

33af

32cc

33dd

33c8

32CD

32ce

33d6

33CB

33ca
 ASCII -Interpunktion kann ebenfalls zugeordnet werden Die Halbbreiten- und Fullwidth -Formen blockieren.

Zeichensatz 0x29/0xa9 (Zeilennummer 9, Boxzeichnung)

KPS 9566 (vorangestellt mit 0x29/0xa9)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax
2500

2502

250c

2510

2518

2514

251c

252c

2524

2534

253c

2501

2503

250f

2513
3x/bx
251b

2517

2523

2533

252b

253b

254b

2520

252f

2528

2537

253f

251d

2530

2525

2538
4x/cx
2542

2512

2511

251a

2519

2516

2515

250e

250d

251e

251f

2521

2522

2526

2527

2529
5x/dx
252a

252d

252e

2531

2532

2535

2536

2539

253a

253d

253e

2540

2541

2543

2544

2545
6x/ex
2546

2547

2548

2549

254a
7x/fx

Zeichensatz 0x2a/0xaa (Zeilennummer 10, Hiragana)

Diese Reihe enthält Hiragana für den Einsatz in der japanische Sprache.

Vergleichen Reihe 10 von KS x 1001, das das gleiche Layout verwendet. Vergleichen und gegenüberstellen Reihe 4 von JIS x 0208, was auch dasselbe Layout verwendet, aber in einer anderen Zeile.

KPS 9566 (vorangestellt mit 0x2a/0xaa)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax
3041

3042

3043

3044

3045

3046

3047

3048

3049

304a

304b

304c

304d

304e

304f
3x/bx
3050

3051

3052

3053

3054

3055

3056

3057

3058

3059

305a

305b

305c

305d

305e

305f
4x/cx
3060

3061

3062

3063

3064

3065

3066

3067

3068

3069

306a

306b

306c

306d

306e

306f
5x/dx
3070

3071

3072

3073

3074

3075

3076

3077

3078

3079

307a

307b

307c

307d

307e

307f
6x/ex
3080

3081

3082

3083

3084

3085

3086

3087

3088

3089

308a

308b

308c

308d

308e

308f
7x/fx
3090

3091

3092

3093

Zeichensatz 0x2b/0xab (Zeilennummer 11, Katakana)

Diese Reihe enthält Katakana für den Einsatz in der japanische Sprache. Allerdings die Japanische lange Vokalmarke, das in Katakana -Text verwendet und in Zeile 1 von enthalten ist Jis x 0208, ist nicht enthalten (ähnlich wie mit GB 2312 und ks x 1001),[66] Obwohl es von KPS 9566-2011 außerhalb der Hauptebene enthalten ist, at 0xea48.[3]

Vergleichen Reihe 11 von KS x 1001, das das gleiche Layout verwendet. Vergleichen und gegenüberstellen Reihe 5 von JIS x 0208, was auch dasselbe Layout verwendet, aber in einer anderen Zeile.

KPS 9566 (vorangestellt mit 0x2b/0xab)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax
30a1

30a2

30a3

30A4

30A5

30a6

30a7

30a8

30a9

30aa

30AB

30AC

30ad

30a

30af
3x/bx
30b0

30b1

30b2

30b3

30b4

30b5

30b6

30b7

30b8

30b9

30ba

30bb

30BC

30bd

30be

30bf
4x/cx
30c0

30c1

30c2

30c3

30c4

30c5

30c6

30c7

30c8

30c9

30ca

30cb

30cc

30cd

30ce

30cf
5x/dx
30d0

30d1

30d2

30d3

30d4

30d5

30d6

30d7

30d8

30d9

30da

30 dB

30dc

30dd

30de

30df
6x/ex
30e0

30e1

30e2

30e3

30e4

30e5

30e6

30e7

30e8

30e9

30ea

30EB

30EC

30ed

30ee

30ef
7x/fx
30f0

30f1

30f2

30f3

30f4

30f5

30f6

Zeichensatz 0x2c/0xac (Zeilennummer 12, Verschiedene Symbole und Pfeile)

Zum Zweck der Zuordnung dieser Zeile auf Unicode war der fett rechte Pfeil mit dem fett rechten Pfeil von Rightwards von vereinheitlicht Zapf Dingbats (U+27a1),[49] Obwohl frühere Tabellen (denen die Zuordnungen für die anderen farbigen Pfeile fehlten) stattdessen mit U+279E einheitlich hatten, einen etwas anderen Zapf -Dingbats -Charakter.[47] Da entsprechende Pfeile in andere Richtungen nicht in der enthalten waren Dingbats Block, zusätzliche Pfeile wurden zwischen U+2B05 und U+2B0D für die Kompatibilität mit KPS 9566 codiert. Diese wurden in die Unicode -Code -Diagramme unter Verwendung der vom nordkoreanischen Nationalkörper vorgeschlagenen Referenzglyphen eingebaut Zapf Dingbats.[49] Diese Pfeile (U+2B05 bis U+2B07 plus U+27a1) wurden in Unicode 6.0 als Zuordnungen für einige der Pfeilzeichen in Cellular ausgewählt Emoji Sets.[54] Anschließend während der Zugabe der Wingdings 3 Repertoire in Unicode 7.0 wurde die Unicode -Berichterstattung von Pfeilzeichen überprüft, was dazu führte Glyphe für den Zapf -Dingbats -Charakter wurde nicht als angemessen angesehen.[49]

In früheren Ausgaben von KPS 9566 wie der Ausgabe von 1997 enthielt diese Reihe beide die einfachen Postalmarke im japanischen Stil (〒) und eine Version in einem nach unten zeigenden Dreieck,[41][23] die von der nordkoreanischen Nationalen Körperschaft vorgeschlagen wurde, um neben den anderen fehlenden KPS 9566 -Zeichen zu Unicode hinzugefügt zu werden.[41] Eine Antwort von a Südkorea Repräsentant, unter anderem Anfragen, beantragte Beweise für die Verwendung des Symbols in Nordkorea und stellte fest, dass die Postmarke im japanischen Stil in Südkorea nicht verwendet wird, was ein eingekreistes 우 (d. H. ㉾) für einen ähnlichen Zweck verwendet, und fragte sich, ob ein Japanisch ein Japaner ist -Stil -Postmarke wurde in Nordkorea verwendet.[43] Es wurde eine nachfolgende Sitzung abgehalten, um diesen Vorschlag zu erörtern, an dem die Vertreter des Nord- und Südkoreanischen WG2 teilnahmen. In dem Treffen Bericht stellt fest, dass die nordkoreanische Gremium beschlossen hatte, den Charakter zu überprüfen, bevor er weiter diskutierte, und es daher nicht zur Prüfung durch WG2 als Ganzes empfohlen hat.[61] Das Post -Mark -Dreieck wurde 2003 aus KPS 9566 entfernt, wobei nur die nicht eingeschälte Postmarke verließ.[1]

Das Postalmark-Dreieck wurde schließlich in Version 13.0 zu Unicode hinzugefügt, sowohl für die Kompatibilität mit dem Legacy KPS 9566-97-Zeichen als auch nach der Marke, die als Symbol identifiziert wurde, das für die Zertifizierung für Zertifizierung verwendet wurde Elektrogeräte in Japan (als Vorgänger der PSE Diamond).[62]

Bestimmte KPS 9566 -Zeichen in dieser Reihe, nämlich zwei Formen des Emblems der Workers' Party of Korea, ein Paar Schere, die in eine andere Richtung als die in der zeigen Dingbats Block und ein umwärtiger nach oben zeigter Manikule, bleiben der Kartierung der Privatnutzungsbereich.[1]

Die nordöstlichen und nordwestlichen weißen Pfeile verwendeten in der Ausgabe 2003 falsche Unicode-Mappings.[1] Dies wurde in den Ausgaben -Mappings 2011 korrigiert.[3]

KPS 9566 (vorangestellt mit 0x2c/0xac)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax [Ö] [Ö]
235f

2600

2602
☔︎
2614

2601

2744
⚡︎
26a1

26a0

2116

2192

2190

2191

2193
3x/bx
2197

2196

2198

2199

2194

2195

21E8

21E6

21E7

21E9

2b00

2B01

2B02

2B03

2B04

21f3
4x/cx [p]
27a1

2B05

2B06

2B07

2B08

2B09

2b0a

2b0b

2b0c

2b0d

2663

2665

2660

2666

3012
[q]
2B97
5x/dx
260f

260e

23ce
[r]
261e
[s] [t] ☕︎
2615

327c

327d

321d

321e

33c7

32cf

3250

2121

213b
6x/ex
337a
®
00AE
7x/fx
 Zugeordnet in den privaten Gebrauchsbereich, simuliert simuliert.

Zeichensatz 0x2e/0xae (Zeilennummer 14, Latin-1-Untergruppe)

Die Charaktere in diesem Satz waren in der Version von 1997 nicht vorhanden, sondern in der Version 2003 hinzugefügt.[1] Sie bilden eine Untergruppe der Latin-1 Supplement Unicode -Block (entspricht der oberen Hälfte der ISO 8859-1 (Latein-1) Zeichensatz). Dies schließt akzentuierte römische Buchstaben und Symbole ein. Einige der bereits eingeschlossenen Symbole werden weggelassen, während einige andere als Halbwidth -Gegenstücke zu den früheren dupliziert werden Fullwidth Formen: Zum Beispiel die nicht unterschreiben (¬, u+00AC) wird als 0xaac dargestellt, während seine Vollbreitenform (¬, u+ffe2) als 0xa2d1 (in) dargestellt wird Reihe 2).[1]

Diese Zeile wird aus der Zuordnung für die Ausgabe 2011 des Standards weggelassen,[3] Dies zeigt an, dass es möglicherweise irgendwann nach der Ausgabe 2003 entfernt wurde. Das Halfwidth -Yen -Zeichen wird stattdessen codiert 0xe98e In der Ausgabe 2011.[3]

Das Erforderlicher Platz würde außerhalb des Bereichs von 94 Zeichen fallen und mit dem Bereich kollidieren, der für erweiterte Chosŏn'gŭl-Silben verwendet wird, wenn a Uhc-Style -Codierung wird (speziell mit der Silbe 쁲) verwendet.[1] und wird weggelassen. Obwohl die y mit Trema Außerdem fällt außerhalb des 94-Charakter-Bereichs, und das Trail-Byte 0xff ist ansonsten nicht genutzt, der Code 0xaeff wird ihm in KPS 9566-2003 zugeordnet.[1]

KPS 9566-2003 (vorangestellt mit 0x2e/0xae)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x/ax ¡
00A1
¢
00A2
£
00A3
¤
00A4
¥
00A5
¦
00A6
©
00A9
ª
00AA
«
00ab
¬
00AC
SCHÜCHTERN ¯
00af
3x/bx µ
00B5
¸
00B8
º
00ba
»
00BB
¿
00BF
4x/cx À
00C0
Á
00c1
Â
00C2
Ã
00c3
Ä
00C4
Å
00C5
Æ
00c6
Ç
00C7
È
00C8
É
00C9
Ê
00ca
Ë
00CB
Ì
00cc
Í
00CD
Î
00CE
Ï
00cf
5x/dx Ð
00d0
Ñ
00d1
Ò
00d2
Ó
00d3
Ô
00D4
Õ
00d5
Ö
00d6
Ø
00d8
Ù
00d9
Ú
00da
Û
00db
Ü
00dc
Ý
00dd
Þ
00de
ß
00df
6x/ex à
00e0
á
00e1
â
00e2
ã
00e3
ä
00E4
å
00e5
æ
00E6
ç
00e7
è
00e8
é
00E9
ê
00ea
ë
00eb
ì
00ec
í
00ed
î
00ee
ï
00ef
7x/fx ð
00F0
ñ
00F1
ò
00F2
ó
00F3
ô
00F4
õ
00F5
ö
00f6
ø
00f8
ù
00f9
ú
00fa
û
00fb
ü
00FC
ý
00fd
þ
00FE
ÿ
00ff

Vorkomponierte Chosŏn'gŭl -Sätze (Zeilen Nummer 16 bis 44)

Vorkomponierte Chosŏn'gŭl-Silbencluster erhalten Codepunkte in einem kontinuierlichen Sortierblock zwischen den Codepunkten 16-01 und 44-47 einschließlich. Nicht alle möglichen Cluster erhalten Codepunkte.[67] Vergleichen Die unterschiedliche Bestellung und Verfügbarkeit in KS x 1001.

Das für KPS 9566-2003 dokumentierte codierte Formular codiert das KPS 9566-Flugzeug auf GR (0xa1-0xfe) und kodiert zusätzlich die verbleibenden Silbencluster mit Lead-Bytes im Bereich 0x80-0xc2 und Trail-Byte in den Ranges 0x41-0x5a, 0x61-0x7a und 0x81-0XFE (wo höchstens ein Byte im Bereich 0xa1-0xfe liegt),[1] ähnlich zu Einheitlicher Hangul -Code Aber mit den ausgelassenen Clustern von und sortierender Reihenfolge von KPS 9566, nicht KS x 1001.

  • Row 16: 가 각 간 갇 갈 갉 갊 감 갑 값 갓 강 갖 갗 같 갚 갛 갔 갸 갹 갼 걀 걈 걋 걍 거 걱 건 걷 걸 걹 걺 검 겁 것 겅 겆 겉 겊 겋 겄 겨 격 견 겯 결 겸 "
  • Zeile 17: 글 긁 긇 급 긋 긍 기 긱 긴 긷 길 긺 깁 깃 깅 깆 깇 깉 깊 개 객 갠 갤 갭 갯 갱 갰 곈 곌 곕 곕 곗 곗 곗 곗 곗 곗 곗 곗 곗 곗 곗 곗 곗 겐 겜 겟 겡 계 곈 곌 곕 곕 곗 곗 곗 곗 곗 곗 곗 곗 곗 겐 겔 겝 겡 겠 곈 곌 곌 곕 곗 곗 곗 겍 겐 겔 겝 겡 계 곈 곌 곕 곕 게 겍 겍 겐 겔 겝 겡 갰 곈 곌 곕 곗 곗. "
  • Row 18: 낛 난 낟 날 낡 낢 남 납 낫 낭 낮 낯 낱 낳 낚 났 냐 냑 냔 냘 냠 냡 냥 너 넉 넋 넌 널 넒 넓 넘 넙 넛 넝 넢 넣 넊 넜 녀 녁 년 녈 념 녑 녓 녕 녘 "
  • Row 19: 늦 늪 니 닉 닌 닐 닒 님 닙 닛 닝 닢 내 낵 낸 낼 냄 냅 냇 냉 냈 냬 네 넥 넨 넬 넴 넵 넷 넹 넸 녜 녠 뇌 뇐 뇔 뇜 뇝 뇟 뉘 뉜 뉠 뉨 뉩 뉭 늬 늰 "
  • Zeile 20: 덮 덯 덨 뎌 뎐 뎔 뎡 뎠 도 독 돈 돋 돎 돐 돔 돕 돗 동 돛 돝 됴 두 둑 둘 둠 둡 둣 듧 듬 듬 듭 듯 듯 듯 듯 듯 듯 듯 듯 듯 듯 듯 듯 듕 듕 득 듣 들 듦 듧 듬 듭 듭 듯 듯 듯 듯 듯 듯 듯 듯 듕 득 듣 들 듦 듧 듬 듭 듭 듯 듯 듯 듯 듕 드 든 듣 듥 듧 듧 듬 듭 듯 듈 듐 듕 드 든 들 둡 듧 듬 듭 듯 듯. "
  • Row 21: 뒴 뒵 뒷 뒹 듸 듼 딀 딉 딍 돠 돤 돨 둬 둰 둴 둼 둿 뒀 돼 됀 됄 됐 뒈 뒝 라 락 란 랄 람 랍 랏 랑 랒 랖 랗 랐 랴 략 랸 랼 럄 럅 럇 량 러 럭 런 "
  • Zeile 22: 륫 륭 르 른 를 름 릅 릇 릉 릊 릍 릎 릭 린 릴 림 립 릿 링 맆 래 랙 랜 램 랩 랫 랭 롈 롑 롑 롓 뢰 뢰 뢰 뢰 뢰 뢰 뢰 뢰 뢰 뢰 뢰 뢰 뢰 뢰 렐 렙 렝 렜 롄 롈 롑 롓 롓 뢰 뢰 뢰 뢰 뢰 뢰 뢰 뢰 렐 렘 렛 렜 례 롈 롑 롓 롓 뢰 뢰 뢰 뢰 렐 렘 렛 렝 례 롈 롈 롑 롓 뢰 렉 렌 렐 렘 렛 렜 랭 롈 롑 롓 뢰 뢰. "
  • Zeile 23: 먐 먕 머 먼 멀 멁 멂 멈 멉 멋 멍 멎 멌 며 멱 면 멸 몀 몁 몃 명 몇 몄 목 몫 몬 몯 묵 문 묻 묻 물 물 물 물 물 물 물 물 물 물 물 물 물 물 몽 묘 묠 묩 무 묵 문 묻 묻 물 물 물 물 물 물 물 물 몽 뫃 묜 묠 묫 묵 문 문 묻 물 물 물 물 몽 뫃 묜 묩 묫 묵 문 문 묻 물 못 못 몽 뫃 묜 묩 몯 묵 문 묻 물 물. "
  • Row 24: 메 멕 멘 멜 멤 멥 멧 멩 멨 몌 몐 뫼 묀 묄 묌 묍 묏 묑 뮈 뮌 뮐 믜 믠 믬 뫄 뫈 뫙 뫘 뭐 뭔 뭘 뭠 뭡 뭣 뭤 뫠 뭬 바 박 밗 반 받 발 밝 밞 밟 밤 "
  • Zeile 25: 뵬 부 분 붇 불 붉 붊 붐 붑 붓 붕 붙 뷰 뷴 뷸 븀 븁 븃 븅 브 븍 븐 블 븝 븟 븡 비 밷 밸 뱀 뱀 뱁 뱁 뱁 뱁 뱁 뱁 뱁 뱁 뱁 뱁 뱁 뱁 뱁 뱁 빕 빗 빚 빛 백 밷 밷 밸 뱀 뱀 뱁 뱁 뱁 뱁 뱁 뱁 뱁 뱁 빕 빗 빚 빛 백 밷 밷 밸 뱀 뱁 뱁 뱁 빔 빕 빗 빛 배 밴 밷 밸 뱀 뱀 빎 빔 빔 빕 빗 빚 배 비 밷 밸 뱀 뱁 뱁. "
  • Zeile 26: 사 삭 산 삳 살 삵 삶 삼 삽 삿 상 샅 샤 샥 샨 샬 샴 샵 샷 샹 서 석 섟 섣 설 섦 섧 셧 셩 셨 셨 소 소 소 소 소 소 소 소 소 소 소 소 소 소 섞 섰 션 셜 셤 셧 셩 셨 셨 소 소 소 소 소 소 소 소 섞 섰 셕 션 셤 셧 셧 셩 셨 소 소 소 소 섞 섰 셕 션 셤 셧 셧 셩 셨 성 성 섶 섞 섰 셕 셜 섦 셧 셩 셨 소 소 소. "
  • Row 27: 습 슷 승 시 식 신 싣 실 싫 심 십 싯 싱 싶 새 색 샌 샐 샘 샙 샛 생 샜 섀 섄 섈 섐 섕 세 섹 센 셀 셈 셉 셋 셍 셑 셒 셌 셰 셴 셸 솅 쇠 쇡 쇤 쇨 "
  • Zeile 28: 잦 잤 쟉 쟌 쟎 쟐 쟘 쟙 쟝 저 적 전 젊 점 접 젓 정 젖 젔 져 젹 젼 졈 졉 졋 졍 졌 죡 죤 죨 죨 죰 죰 죰 죰 죰 죰 죰 죰 죰 죰 죰 죰 죰 좀 좁 종 좆 좋 죠 죡 죤 죨 죨 죰 죰 죰 죰 죰 죰 죰 죰 좀 좁 종 좆 좋 죡 죤 죤 죨 죰 죰 죰 죰 좀 좁 종 좇 좋 죡 죤 죤 죨 죰 졺 졺 좀 좁 종 좇 졌 죡 죤 죨 죰 죰 졺. "
  • Row 29: 쟨 쟬 제 젝 젠 젤 젬 젭 젯 젱 젶 젰 졔 졘 졜 죄 죈 죌 죔 죕 죗 죙 죘 쥐 쥑 쥔 쥗 쥘 쥠 쥡 쥣 즤 좌 좍 좐 좔 좝 좟 좡 줘 줬 좨 좽 좼 줴 줸 줼 "
  • Zeile 30: 추 축 춘 출 춤 춥 춧 충 츄 츈 츌 츔 츠 측 츤 츨 츰 츱 츳 층 치 칙 친 칠 칡 침 칩 첵 첸 첸 첼 쳄 쳄 쳄 쳄 쳄 쳄 쳄 쳄 쳄 쳄 쳄 쳄 챌 챕 챙 챘 체 첵 첸 첼 첼 첼 쳄 쳄 쳄 쳄 쳄 쳄 쳄 챌 챕 챙 챘 체 첵 첸 첼 첼 쳄 쳄 쳄 쳄 챌 챔 챗 챙 챼 첵 첸 첸 첼 쳄 쳄 챈 챌 챔 챗 챘 칩 첵 첸 첼 쳄 쳄 챈. "
  • Zeile 31: 캼 캽 컁 컥 컨 컫 컬 컴 컵 컷 컹 컽 컸 켜 켠 켤 켬 켭 켯 켱 켰 코 콕 콜 콤 콥 콧 큠 크 크 큭 큰 큰 큰 큰 큰 큰 큰 큰 큰 큰 큰 큰 큰 큰 쿨 쿱 쿵 큐 큘 큠 크 큭 큭 큰 큰 큰 큰 큰 큰 큰 큰 큰 쿨 쿱 쿵 큐 큘 큠 크 큭 큭 큰 큰 큰 쿤 쿨 쿱 쿵 큐 큘 큠 크 큭 큭 쿡 쿤 쿨 쿰 쿱 쿵 콥 큠 콩 크 큭 큰. "
  • Row 32: 콸 쾀 쾅 쿼 퀀 퀄 퀑 쾌 쾐 쾔 쾡 퀘 퀙 퀠 퀭 타 탁 탄 탈 탉 탐 탑 탓 탕 탚 탔 탸 탼 턍 터 턱 턴 털 턺 텀 텁 텃 텅 텄 텨 텬 텼 토 톡 톤 톨 톰 "
  • Row 33: 테 텍 텐 텔 템 텝 텟 텡 텦 톄 톈 퇴 퇸 툇 툉 튀 튁 튄 튈 튐 튑 튕 틔 틘 틜 틤 틥 톼 퇀 퉈 퉜 퇘 퉤 퉨 퉸 파 팍 판 팔 팖 팜 팝 팟 팡 팥 팎 팠 "
  • Zeile 34: 퓻 퓽 프 플 픔 픕 픗 픙 피 픽 핀 핌 핍 핏 핑 패 팩 팬 팰 팸 팹 팻 팼 퍠 페 펙 펜 퓌 퓌 퓐 퓔 퓔 퓜 퓜 퓜 퓜 퓜 퓜 퓜 퓜 퓜 퓜 퓜 퓜 펲 폐 폘 폣 푄 퓌 퓌 퓐 퓔 퓔 퓜 퓜 퓜 퓜 퓜 퓜 퓜 퓜 펲 폔 폘 폣 푄 퓌 퓐 퓐 퓔 퓜 퓜 퓜 퓜 펭 폐 폘 폡 푀 푄 퓌 퓐 퓔 퓜 펫 펭 펲 폐 폘 페 푄 퓌 펠 퓔 퓔 펫 펫 펭 펭. "
  • Zeile 35: 홍 홑 효 횰 횹 횻 후 훅 훈 훌 훑 훕 훗 훙 휴 휵 휸 휸 흄 흇 흉 흐 흔 흖 흗 흘 흙 힝 힝 핵 핵 핵 핸 핸 핸 핸 핸 핸 핸 핸 핸 핸 핸 핸 흩 힉 힐 힘 힛 힝 해 핵 핵 핵 핸 핸 핸 핸 핸 핸 핸 핸 흩 힌 힐 힙 힛 힝 해 핵 핵 핸 핸 핸 핸 흩 히 힌 힘 힙 힝 힝 해 핵 핸 흣 흥 흩 히 힌 흗 힛 힝 흝 핵 핵 흣 흣 흥. "
  • Zeile 36: 홧 황 훡 훤 훨 훰 훵 홰 홱 홴 횃 횅 훼 훽 휀 휄 휑 까 깍 깐 깓 깔 깖 깝 깟 깡 깥 껑 꺾 꺾 껐 껴 껴 껴 껴 껴 껴 껴 껴 껴 껴 껴 껴 꺌 꺼 껄 껌 껏 껑 꺾 껐 껐 껴 껴 껴 껴 껴 껴 껴 껴 꺌 꺼 껀 껄 껍 껏 껑 꺾 껐 껐 껴 껴 껴 꺌 꺼 꺽 껄 껌 껏 껑 꺾 껐 껐 껴 꺈 꺌 꺼 꺽 껄 깡 껑 꺾 깠 껐 꺅 꺈. "
  • Row 37: 낍 낏 낑 깨 깩 깬 깰 깸 깹 깻 깽 깼 꺠 께 껙 껜 껠 껨 껩 껫 껭 껬 꼐 꾀 꾁 꾄 꾈 꾐 꾑 꾕 뀌 뀐 뀔 뀜 뀝 뀡 꽈 꽉 꽌 꽐 꽛 꽝 꽜 꿔 꿘 꿜 꿥 "
  • Row 38: 똘 똠 똡 똣 똥 뚀 뚜 뚝 뚠 뚤 뚫 뚬 뚭 뚱 뜌 뜨 뜩 뜬 뜯 뜰 뜸 뜹 뜻 뜽 띠 띡 띤 띨 띰 띱 띳 띵 때 땍 땐 땔 땜 땝 땟 땡 땠 떼 떽 뗀 뗄 뗌 뗍 "
  • Row 39: 뻣 뻥 뻤 뼈 뼉 뼘 뼙 뼛 뼝 뼜 뽀 뽁 뽄 뽈 뽐 뽑 뽓 뽕 뾰 뿅 뿌 뿍 뿐 뿔 뿜 뿝 뿟 뿡 쀼 쁑 쁘 쁜 쁠 쁨 쁩 삐 삑 삔 삘 삠 삡 삣 삥 빼 빽 뺀 뺄 "
  • Zeile 40: 쏟 쏠 쏢 쏩 쏫 쏭 쑈 쑌 쑐 쑘 쑝 쑤 쑨 쑬 쑴 쑵 쑹 쓔 쓘 쓧 쓩 쓰 쓱 쓸 쓺 쓿 씀 쌕 쌘 쌘 쌜 쌤 쌤 쌤 쌤 쌤 쌤 쌤 쌤 쌤 쌤 쌤 쌤 쌤 쌤 씯 씰 씻 씽 씼 쌕 쌘 쌜 쌜 쌜 쌤 쌤 쌤 쌤 쌤 쌤 쌤 씯 씰 씹 씻 씼 쌔 쌕 쌘 쌜 쌜 쌤 쌤 쌤 씯 씰 씹 씻 씼 쌔 쌕 쌘 쌜 쌜 씩 씬 씯 씰 씹 씽 쓿 쌕 쌘 쌜 쌤 쌤 씬. "
  • Zeile 41: 짧 짬 짭 짱 짰 쨔 쨔 쨘 쨩 쩌 쩍 쩐 쩗 쩜 쩝 쩟 쩡 쩡 쩠 쪘 쪼 쪽 쫀 쫌 쫍 쫏 쫑 쭛 쭛 쭝 쮸 쮸 쯀 쯀 쯀 쯀 쯀 쯀 쯀 쯀 쯀 쯀 쯀 쯀 쯀 쭁 쭉 쭌 쭘 쭙 쭛 쭝 쮸 쮸 쯀 쯀 쯀 쯀 쯀 쯀 쯀 쯀 쬼 쭁 쭉 쭐 쭙 쭛 쭝 쭝 쮸 쯀 쯀 쯀 쯀 쬰 쭁 쭉 쭌 쭘 쭛 쭛 쭝 쮸 쯀 쬬 쬰 쬼 쭁 쭉 쫍 쭙 쭛 쫒 쮸 쮸 쯀 쯀 쬰. "
  • Zeile 42: 쫘 쫙 쫜 쫭 쫬 쭤 쭹 쭹 쫴 쬈 쮀 아 안 앉 않 알 앍 앍 앒 앓 암 압 앙 앝 앞 앟 았 어 어 억 언 언 얹 얹 얹 얹 얹 얹 얹 얹 얹 얹 얹 얹 얹 얌 얏 양 얗 얐 어 억 언 언 언 얹 얹 얹 얹 얹 얹 얹 얹 얇 얍 양 얕 얐 어 억 언 언 얹 얹 얹 얹 얇 얌 얏 얕 얗 어 어 억 언 얹 얃 얄 얇 얌 얏 앞 얐 어 억 언 언 얹 얹 얄. "
  • Row 43: 욘 욜 욤 욥 욧 용 우 욱 운 울 욹 욺 움 웁 웃 웅 유 육 윤 율 윰 윱 윳 융 윷 으 윽 은 읃 을 읅 읊 음 읍 읏 응 읒 읓 읔 읕 읖 읗 이 익 인 일 읽 "
  • Row 44: 위 윅 윈 윌 윔 윕 윗 윙 의 읜 읠 읨 읫 와 왁 완 왇 왈 왐 왑 왓 왕 왔 워 웍 원 월 웜 웝 웟 웡 웠 왜 왝 왠 왬 왯 왱 웨 웩 웬 웰 웸 웹 웻 웽 윁

Hanja setzt (Zeilen Nummer 45 bis 94)

Die Hanja bei 69-09 (0xe5a9) ist U+676E zugeordnet in allen dokumentierten Tabellen; Charaktere werden jedoch nach ihren Lesungen geordnet, aus denen es scheint, dass es u+67ff sein soll stattdessen.[68]

Erweiterte Nicht-Silbe, Nicht-Hanja-Sätze in KPS 9566: 2011

Im Folgenden finden Sie Diagramme für die Nichtsyllable, Nicht-Hanja-Abschnitt von KPS 9566-2011 außerhalb der Hauptebene.[3]

Verlängerungssatz 0xe0 (Symbole und Piktogramme)

KPS 9566-2011 (vorangestellt mit 0xe0)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
25d1

2298

2709

261b

261e

270c
5x
270d

270f

270e

2710

2713

2714

22a1

2394
6x
2299
7x ⚓︎
2693

263c
8x
25c9
9x
272a

272f

272c

272b

272e

272d

2730

2729
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet

Erweiterung setzt 0xe1, 0xe2, 0xe3 (unbekannt)

Diese Erweiterung setzt die Karte in den privaten Gebrauchsbereich ein. Ihr Zweck ist nicht dokumentiert.[3]

KPS 9566-2011 (vorangestellt mit 0xe1)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
5x
6x
7x
8x
9x
Axt (Teil der Hauptebene.)
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet
KPS 9566-2011 (vorangestellt mit 0xe2)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
5x
6x
7x
8x
9x
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet
KPS 9566-2011 (vorangestellt mit 0xe3)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
5x
6x
7x
8x
9x
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet

Erweiterungssatz 0xE4 (Pfeile)

Dieses Set enthält mehrere meist rechtliche Pfeile, die auf den Unicode abgebildet sind Dingbats Block und anderswo.[3]

KPS 9566-2011 (vorangestellt mit 0xe4)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
2794

2798

2799

279a

279b

279c

279d

279f

27a0

27a2

27a3

27a4

27a5

27a6

27a7
5x
27a8

27a9

27aa

27ab

27AC

27ad

27AE

27af

27b1

27b2

27b3
6x
27b4

27b5

27b6

27b7

27b8

27b9

27ba

27bb

27be

27BC

27bd
7x
8x
27f7

21c

296b

296c

21d0

27f9
9x
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet

Erweiterungssatz 0xE5 (Roman -Superscripts und Indexs)

Diese Reihe enthält mehrere Kleinbuchstaben Roman Superscripts mit Trail -Bytes, die ihren Großbuchstaben -ASCII -Äquivalenten und Kleinbuchstaben Roman entsprechen Einweis mit Trail -Bytes, die ihren Kleinbuchstaben -ASCII -Äquivalenten entsprechen.[3]

KPS 9566-2011 (vorangestellt mit 0xe5)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
1d43

1d47

1d9c

1d48

1d49

1da0

1d4d

1d4f

1d50

207f

1d52
5x
1d56

1d57

1d58

1d5b
6x
2090

2091

1D62

2c7c

2092
7x
1D63

1D64

1d65

2093
8x
9x
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet

Erweiterung Set 0xE6 (griechische und Symbol -Superscripts und Indexs)

KPS 9566-2011 (vorangestellt mit 0xe6)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
1d45

1d5d

1d5e

1d5f

1d4b
ᶿ
1DBF

1DB9
5x
1d60

1d61
6x
1D66

1D67
7x
1D68

1d69

1d6a
8x
207a

207b
9x
208a

208b
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet

Erweiterungssatz 0xE7 (weitere Listenmarker)

KPS 9566-2011 (vorangestellt mit 0xe7)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
325b

325c

325d

325e

325f

32b1

32b2

32b3

32b4

32b5

32b6

32b7

32b8

32b9

32ba
5x
32BB

32BC

32BD

32be

32bf
6x
7x
8x
9x
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet

Verlängerungssatz 0xE8

KPS 9566-2011 (vorangestellt mit 0xe8)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
5x
6x
7x
8x
Fe30
9x
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet

Erweiterungssatz 0xE9 (zusätzliche Symbole und Zeichensetzung)

Dieses Set enthält spielerische Kartenanzugsymbole, verschiedene verschiedene Symbole und die Halbbreiten -Gegenstücke für einige der Währungssymbole in Reihe 8. Das Kelvin Zeichen ist auch enthalten,[3] nach dem ersetzt durch die ersetzt wurde Eurozeichen.[1]

KPS 9566-2011 (vorangestellt mit 0xe9)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
2205

2297

3013

2667

2661

2664

2662

25ef

29be
5x
6x
7x
8x
212a

20A9

20A4
¥
00A5
9x
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet

Verlängerungsset 0xea (japanische Interpunktion und zusätzliches Jamo)

Dieser Satz enthält mehrere Interpunktionsmarken, die in verwendet werden Japan, und einige Charaktere aus dem Hangul -Kompatibilität Jamo Unicode -Block, der noch nicht enthalten ist in Reihe 4.[3] Dies umfasst einige der Jamo -Charaktere, in denen vorhanden ist KS x 1001, aber zuvor fehlte in KPS 9566.

KPS 9566-2011 (mit 0xea vorangestellt)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
4x
30fd

30FE

309d

309e

3005

3006

3007

30fc
5x
6x
3165

316d

3171

3172

3173

3174

3175

3176

3177

3178

3179

317a

317b

317d

317e
7x
3180

3184

3185

3187

3188

3189

318a

318b

318c

119e

318E
8x
9x
 Nicht in Unicode, dem privaten Gebrauchsbereich zugeordnet

Fußnoten

  1. ^ Zum Beispiel zeigen die Überschriften des ISO-IR-202-Diagramms 7-Bit-Binärcodes sowie Kuten/Hang-Yol-Codes für die Zeichen).[23]
  2. ^ a b Als ein ISO 2022 kompatibel 94n-Character set, die einfacher Raum und Charakter löschen sind immer als Single-Byte-Codes bei 0x20 bzw. 0x7f (nicht 0xa0 bzw. 0xff) erhältlich.
  3. ^ Oder U+223c .[47]
  4. ^ Andere Zuordnungen verwenden U+00Ad , passen KS x 1001 01-09.[47]
  5. ^ a b c d e Eine halbe Widthen solcher Charakter ist in vorhanden Reihe 14Dies ist speziell ein Vollbreitencharakter.
  6. ^ Eine vertikale Form des Tilde Dash. Die vom Unicode-Konsortium bereitgestellte Zuordnungsdatei erkennt die Abbildung auf u+2e2f an.[1] das wird von verwendet von Red Star OS,[7] Es stellt jedoch fest, dass das Unicode-Charakter für ein signifikant unterschiedliches Zeichen (ein vertikaler Tilde mit hoher Diakritikum) bestimmt ist und auch die Zuordnung U+F104 (im privaten Gebrauchsbereich) auflistet.[1] basierend auf Zuordnungsdaten, die an die übermittelt wurden OpenOffice.org Projekt im Jahr 2004.[22] Hier unter Verwendung eines Bildes gezeigt.
  7. ^ a b Ein Charakter, der eine Periode mit einer abschließenden Halterung kombiniert, die dem hier gezeigten privaten Gebrauchsbereich zugeordnet ist.
  8. ^ Oder U+25e6 .[47]
  9. ^ Oder U+2022 .[47]
  10. ^ a b c d Zugeordnet in den privaten Gebrauchsbereich, hier mit einem Bild gezeigt.
  11. ^ Mac OS Koreanisch (Hangultalk), eine Codierung von Wansung Code Plus -Erweiterungssätze codiert ein visuell ähnliches Zeichen bei 0xa79b,[63] Welcher Apfel karten in die Unicode -Sequenz U+25b4+20E4 (▴⃤).[64] Es wird jedoch keine dokumentierte Verwendung dieser Zuordnung für das KPS 9566 -Charakter verwendet.
  12. ^ a b c d e f g h i Ein ermutigter/betonte Charakter aus dem Namen eines nordkoreanischen Führers, der hier mit Markup simuliert ist, dem privaten Gebrauchsgebiet zugeordnet.
  13. ^ a b c d e Form eines Bruchs mit horizontaler Balken und vertikaler Anordnung, der hier simuliert ist, dem privaten Gebrauchsbereich zugeordnet.
  14. ^ Degrees Kelvin in der Version von 1997 (einige Versionen des Codendiagramms enthalten ein Abschlusszeichen im Einheitssymbol). Euro ab 2003 Version.
  15. ^ a b Emblem der Workers' Party of Korea, zugeordnet in den privaten Gebrauchsbereich, hier mit einem Bild gezeigt.
  16. ^ Oder U+279E oder U+2B95 : Siehe Text.
  17. ^ Im Jahr 1997 Versionsdiagramme und im Unicode -Vorschlag N2374 ab 2001. Entfernen in der Version 2003.
  18. ^ In der Ausgabe 2003 auf U+261E (☞) zugeordnet.[1] Die Ausgabe 2011 ordnet sie stattdessen dem privaten Gebrauchsgebiet Charakter U+F13B ab.[3] Die Referenzglyphe ist eine Rückhand -Manikule,[23][3] d.h. Übereinstimmung U+1F449 (︎). Vergleichen 0xe04d in KPS 9566-2011.
  19. ^ Kreiste nach oben Manikule, zugeordnet auf den privaten Gebrauchsbereich,[1] Hier unter Verwendung eines Bildes gezeigt. Eine mögliche Nicht-PUA-Zuordnung wäre die Sequenz U+1F446+20DD (︎⃝).[7]
  20. ^ Up-links-Zeigenschere, dem hier unter Verwendung eines Bilds gezeigten privaten Gebrauchsbereichs zugeordnet sind.

Verweise

  1. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab "KPS 9566-2003 bis Unicode". Unicode -Konsortium.
  2. ^ a b c d e f g h i j k l Lunde, Ken (2009). CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer (2. Aufl.). Sebastopol, ca.: O'Reilly. S. 148–151. ISBN 978-0-596-51447-1.
  3. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab AC Chung, Jaemin (2018-01-05). "Informationen zur neuesten Version von KPS 9566 (KPS 9566-2011?)" (PDF). UTC L2/18-011.
  4. ^ a b c d Cho, Chun-Hui (2000-07-05). "DPRK-Buchstaben zu Charakternamen und Bestellung in 10646-1: 2000" (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2231.
  5. ^ a b c Lunde, Ken (2019-03-25). "Vier der Art: KS x 1001 & KPS 9566". CJK -Blog. Adobe Inc.
  6. ^ a b Ewell, Doug (2002-08-15). "Re: Skripte in Unicode 4.0". Unicode Mail -Listenarchiv.
  7. ^ a b c d West, Andrew (2015-05-29). "KPS 9566 Mappings (war Re: Arrow Dingbats)". Unicode Mailing List Archiv.
  8. ^ a b c Jennings, Thomas Daniel (2020-03-17) [1999]. "Eine kommentierte Geschichte einiger Zeichencodes oder ASCII: Amerikanischer Standardcode für Informationsinfiltration". Sensible Forschung (SR-IX). Archiviert vom Original am 2016-05-22. Abgerufen 2020-03-17.
  9. ^ "Standard ECMA-6: 7-Bit-codierter Zeichensatz". ECMA International.
  10. ^ a b Lunde, Ken (2009). CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer (2. Aufl.). Sebastopol, ca.: O'Reilly. p. 89. ISBN 978-0-596-51447-1.
  11. ^ ECMA/TC 1 (1973). "Kurze Geschichte". 7-Bit-Eingangs-/Ausgangscodierter Zeichensatz (PDF) (4. Aufl.). ECMA. ECMA-6: 1973.
  12. ^ ECMA (1994). Charaktercode -Struktur und Erweiterungstechniken (PDF) (6. Aufl.). ECMA-35: 1994.
  13. ^ Lunde, Ken (2009). CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer (2. Aufl.). Sebastopol, ca.: O'Reilly. S. 19–20, 581–582. ISBN 978-0-596-51447-1.
  14. ^ Lunde, Ken (2009). CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer (2. Aufl.). Sebastopol, ca.: O'Reilly. S. 84–85. ISBN 978-0-596-51447-1.
  15. ^ a b "2.4: Mehrere Byte -Grafikzeichen -Sets". Internationales Register der codierten Zeichensätze, die mit Escape-Sequenzen (ISO-IR) verwendet werden sollen (PDF). Itcj/Ipsj. p. 14.
  16. ^ a b c Lunde, Ken (2009). CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer (2. Aufl.). Sebastopol, ca.: O'Reilly. S. 94–147. ISBN 978-0-596-51447-1.
  17. ^ a b Lunde, Ken (2009). CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer (2. Aufl.). Sebastopol, ca.: O'Reilly. S. 242–255. ISBN 978-0-596-51447-1.
  18. ^ a b c Shin, Jungshik. "Was sind KS x 1001 (KS C 5601) und andere Hangul -Codes?". Hangul & Internet in Korea FAQ.
  19. ^ a b Hwang, Jinsang (2005). Die soziale Gestaltung der IKT -Standards: Ein Fall von nationalen Coded -Charakter -Standard -Kontroversen in Korea (PDF). Universität von Edinburgh.
  20. ^ Lunde, Ken (1995-12-18). "3.3.6: n-byte Hangul". Cjk.inf Version 1.9.
  21. ^ a b Komitee für die Standardisierung des D P R von Korea (CSK) (2000-08-10). "Beweise für die Anordnung koreanischer Charaktere von CSK" (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2246.
  22. ^ a b c d "Conversionstabellen zwischen KPS 9566-2003 (n. Koreanisch) und Unicode". Apache OpenOffice (AOO) Bugzilla. 2004-08-27.
  23. ^ a b c d e f g h Komitee für Standardisierung von D. P. R. aus Korea (1998-06-22). DPRK Standard Koreanisches Grafikzeichen für den Informationsaustausch (PDF). Itcj/Ipsj. ISO-IR-202.
  24. ^ Unicode -Konsortium. "Geschichte der Unicode -Veröffentlichung und Veröffentlichungsdaten".
  25. ^ West, Andrew (2019-06-17) [2007-06-05]. "Unicode und ISO/IEC 10646".
  26. ^ Murata, Makoto (14. April 2000). "XML Japanisches Profil". W3c Notizen. W3c.
  27. ^ Van Kesteren, Anne. Codierungsstandard. Waswg.
  28. ^ Lunde, Ken (1999). CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer. Sebastopol, ca.: O'Reilly. p. 116. ISBN 1-56592-224-7.
  29. ^ Koch, Richard. "F: Warum fehlt DPRK (Nordkoreaner == kirg_kpsource) Glyphen in einigen CJK -Code -Diagrammen?". FAQ - Chinesisch und Japanisch. Unicode -Konsortium.
  30. ^ Jenkins, John H.; Koch, Richard; Lunde, Ken (2020-03-05). "Unicode Han -Datenbank (Unihan)". kirg_kpsource. Unicode Standard Anhang #38.
  31. ^ Yerdeau, F. (1998). "UTF-8, ein Transformationsformat von ISO 10646". Ietf. doi:10.17487/rfc2279. RFC 2279. {{}}: Journal zitieren erfordert |journal= (Hilfe)
  32. ^ "Unicode -Charakter -Codierungsstabilitätsrichtlinien". Unicode -Konsortium. 2017-06-23.
  33. ^ Jo, Chun-Hui (1999-08-10). "Änderung des Teils, der die koreanischen Charaktere in ISO/IEC 10646-1: 1998 Änderung 5 enthält." (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2056.
  34. ^ "Neuer Arbeitsartikelvorschlag (NP) für eine Änderung des koreanischen Teils von ISO/IEC 10646-1: 1993". 1999-12-07. L2/99-380, ISO/IEC JTC 1 N5999.
  35. ^ Karlsson, Kent (2000-03-02). "Kommentare zu DPRK Neuen Arbeitselemsvorschlag zu koreanischen Charakteren". ISO/IEC JTC 1/SC 2/WG 2 N2167.
  36. ^ Komitee für die Standardisierung des D P R von Korea (CSK) (2000-08-10). "Vorschlag für die Zugabe von 14 koreanischen Alphabeten zu ISO/IEC 10646-1" (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2243.
  37. ^ a b Komitee für die Standardisierung des D P R von Korea (CSK) (2000-08-10). "Vorschlag für die Zugabe von 82 Symbolen zu ISO/IEC 10646-1" (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2244.
  38. ^ Komitee für die Standardisierung des D P R von Korea (CSK) (2000-08-10). "Vorschlag, den vorhandenen Namen der koreanischen Zeichen in ISO/IEC 10646-1 zu ändern" (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2245.
  39. ^ Komitee für die Standardisierung des D P R von Korea (CSK) (2000-08-10). "Vorschlag, die Hanja-Säule von D. P. R. von Korea in ISO/IEC 10646-1 hinzuzufügen (14938 Ideografien zu CJK Unified Ideographs und 3181 Ideographs bis zu seiner Ausweitung [sic] a)" (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2247.
  40. ^ Koreanische Skript ad hoc Group (2000-09-21). "Bericht über das Treffen der koreanischen Skript ad hoc Group". ISO/IEC JTC 1/SC 2/WG 2 N2282.
  41. ^ a b c d e f g Komitee für die Standardisierung des D p r von Korea (CSK) (2001-09-03). Vorschlag zu 70 Symbolen zu ISO/IEC 10646-1: 2000 hinzufügen (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2374.
  42. ^ Komitee für die Standardisierung des D p r von Korea (CSK) (2001-09-03). Vorschlag, die 160 -Kompatibilitäts -Hanja -Code -Tabelle von D P von Korea in CJK -Kompatibilitätsideographien hinzuzufügen (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2375.
  43. ^ a b c Gim, Gyeongseog (2001-10-13). Roks Kommentare zu DPRKs Vorschlag WG2 N 2374, um 70 Symbole zu ISO/IEC 10646-1: 2000 hinzuzufügen (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2390.
  44. ^ a b c d e Koreanische Skript ad hoc Group (2001-10-16). Ein Bericht über das koreanische Skript -Ad -hoc -Gruppenversammlung am 15. Oktober 2001 (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2392, UTC L2/01-388. Archiviert von das Original (PDF) am 2020-08-03. Abgerufen 2020-04-29.
  45. ^ a b c d Freytag, Asmus (2002-02-13). "Anmerkungen zu vorgeschlagenen Symbolen von DPRK" (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2417, UTC L2/02-102.
  46. ^ a b Emojipedia. "Unicode 4.0 Emoji". Emojipedia.
  47. ^ a b c d e f Kim, Kyongsok (2002-11-30). "Nationale Körperposition: 3-Wege-Cross-Reference-Tabellen-KS x 1001, KPS 9566 und UCS" (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2564. [HINWEIS: Aktualisierte Links für Tabellen, die das Dokument begleiten: [1] [2]
  48. ^ a b c d "Verschiedene Symbole" (PDF). Unicode 4.0.0 Delta -Code -Diagramme. Unicode -Konsortium.
  49. ^ a b c d Whistler, Ken (2015-05-28). "Re: Arrow Dingbats". Unicode Mail -Listenarchiv.
  50. ^ "Verschiedene Symbole und Pfeile" (PDF). Unicode 4.0.0 Delta -Code -Diagramme. Unicode -Konsortium.
  51. ^ a b Overington, William (2003-02-24). "Unicode 4.0 Beta -Zeichen".
  52. ^ "Verschiedene Symbole" (PDF). Unicode 3.2.0 Delta -Code -Diagramme. Unicode -Konsortium.
  53. ^ Das Unicode 4.0 -Codediagramm zeigt die modifizierte Glyphe an.[48] Während das Unicode 3.2 -Codediagramm die vorherige Glyphe zeigt.[52]
  54. ^ a b Scherer, Markus; Davis, Mark; Momoi, Kat; Tong, Darick; Kida, Yasuo; Edberg, Peter. "Emoji -Symbole: Hintergrunddaten - Background -Daten zum Vorschlag zur Codierung von Emoji -Symbolen" (PDF). UTC L2/10-132.
  55. ^ Suignard, Michel (2007-09-18). "Japanische Fernsehsymbole" (PDF). UTC L2/07-391, ISO/IEC JTC 1/SC 2/Wg 2 n3341.
  56. ^ Unicode -Konsortium (2020). "Emoji -Versionen & Quellen, v13.0".
  57. ^ Emojipedia. "Unicode 5.2 Emoji -Liste". Emojipedia.
  58. ^ Emojipedia. "Wedeln der weißen Flagge Emoji". Emojipedia.
  59. ^ Emojipedia. "Schwarzer Flagge Emoji". Emojipedia.
  60. ^ Marin Silva, Eduardo (2018). Vorschlag, Kompatibilitätsymbole und Zeichensetzung in der DVRK zu überdenken (PDF). UTC L2/18-004.
  61. ^ a b Koreanische Skript ad hoc Group (2001-10-16). Ein Bericht über das koreanische Skript -Ad -hoc -Gruppenversammlung am 15. Oktober 2001 (PDF). ISO/IEC JTC 1/SC 2/WG 2 N2392, UTC L2/01-388. Archiviert von das Original (PDF) am 2020-08-03. Abgerufen 2020-04-29. D P R von Korea schlug vor, dass sie diesen Charakter sorgfältiger überprüfen würden, bevor er bei Korean Script ad hoc Group oder WG2 erneut diskutiert wird.
  62. ^ a b Marín Silva, Eduardo (2018). Vorschlag zu codieren: Symbol für Typ A Elektronik (PDF). UTC L2/18-184R.
  63. ^ Lunde, Ken (2009). "Anhang E: Anbieter -Charakter -Set -Standards" (PDF). CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer (2. Aufl.). Sebastopol, ca.: O'Reilly. ISBN 978-0-596-51447-1.
  64. ^ Apfel (2005-04-05). "Karte (externe Version) von Mac OS Korean Coding zu Unicode 3.2 und später". Unicode -Konsortium.
  65. ^ Czyborra, Roman (1998-11-30) [1998-05-25]. "Die kyrillische Charset -Suppe". Archiviert vom Original am 2016-12-03. Abgerufen 2016-12-03.
  66. ^ Lunde, Ken (2009). "Anscheinend fehlende Charaktere". CJKV -Informationsverarbeitung: Chinesisch, Japanisch, Koreanisch und Vietnamesisches Computer (2. Aufl.). Sebastopol, ca.: O'Reilly. p. 180. ISBN 978-0-596-51447-1.
  67. ^ Diese Tabelle wird aus kps9566.txt generiert.[1]
  68. ^ Chung, Jaemin (2021-03-17). "KP0-E5A9 sollte U+67ff anstelle von U+676E zugeordnet werden" (PDF). UTC L2/21-059.

Externe Links