Hongkong ergänzender Charakter -Set
Das Hongkong ergänzender Charakter -Set (香港增補字符集; häufig abgekürzt zu Hkscs) ist ein Satz von chinesische Charaktere - Insgesamt 4,702 in der ersten Veröffentlichung - verwendet in Kantonesischsowie beim Schreiben der Namen einiger Orte in Hongkong (ob in geschriebenes Kantonesisch oder Standard -Chinesisch Sätze).[1] Es entwickelte sich aus dem vorhergehenden Regierungs chinesischer Charakter Set (政府通用字庫) oder GCCS. GCCS ist eine Reihe von Ergänzungen chinesische Charaktere codiert in den benutzerdefinierten Bereichen der Die großen 5 Zeichensatz. Es wurde ursprünglich innerhalb der verwendet Die Regierung von Hongkong und später von der Öffentlichkeit benutzt. Es entwickelte sich später in Hongkong ergänzende Zeichenset, als die Zeichen im Set eingereicht wurden ISO-10646 zum Codieren.
Entwicklungsgeschichte
Mime / Iana | Big5-Hkscs |
---|---|
Alias (e) | Big5HK, CSBIG5HKSCS |
Sprachen) | Traditionelles Chinesisch, Kantonesisch |
Einstufung | 8 Bit CJK DBCs |
Erweitert | Big5 Eten |
Aufgrund der inhärenten Unterschiede zwischen Standard -Chinesisch und geschriebenes Kantonesisch, Die Regierung von Hongkong erkannte die Notwendigkeit eines standardisierten Satzes von proprietär Zeichen, die die Stromlinie der elektronischen Kommunikation ermöglichen; Zu der Zeit die Die großen 5 Das chinesische Codierungsschema enthielt keine große Mehrheit dieser Charaktere (einige waren fälschlicherweise mit ähnlichen Zeichen verknüpft).
Das Regierungs chinesischer Charakter Set (政府通用字庫) oder GCCS wurde somit von der Regierung entwickelt. Das Charaktersatz besteht aus chinesischen Charakteren, die üblicherweise in Hongkong verwendet werden. Einige Charaktere sind Kantonesisch-spezifisch, während einige alternative Formen von Zeichen sind. Das Set ist nicht gut organisiert und die Charaktere werden nicht genau untersucht.
Anschließend wurde die HKSCS-1999 (HKSCS 1999-Spezifikation) entwickelt. Nach seiner Akzeptanz wurden neuere Überarbeitungen im Jahr 2001 (hinzugefügt 116 neue Zeichen) und 2004 (hinzugefügte 123 neue Zeichen) mit insgesamt 4.941 Zeichen veröffentlicht. 106 GCCS-Zeichen wurden in HKSCS-1999 aufgrund der Vereinigung entfernt, und ihre Big5-Codepunkte sind für die Kompatibilität reserviert.[2][3] Pensionierte "nicht überprüfbare" GCCS -Charaktere finden sich in UTC -Quellen (UTC-00877-UTC-00898),[4] wo sie aus Adobe-CNS1-1 stammen,[5] ein Adobe-CNS1 Ergänzung implementiert zur Unterstützung von GCCs.[6]
Die HKSCs sind in codiert Die großen 5 (Big5-Hkscs,[7] Big5hk[8]) und ISO 10646 (Unicode). Ab HKSCS-2004 verwenden alle Zeichen zuvor den Abschnitt "Gebrauch" von Unicode für private Gebrauchsgebiete[a] werden umgestaltet, wobei viele von ihnen dem Verlängerungsblock oder ergänzenden ideografischen Kompatibilitätsblock zugewiesen werden.[9] Um die Kompatibilität mit Programmen zu bewahren, die PUA -Codepunkte generierten, sind die zugewiesenen Codepunkte reserviert und es werden keine neuen Zeichen zugeordnet Pua.
Versionsgeschichte
Die HKSCs haben einige Iterationen durchlaufen.[10]
Ausführung | Gesamtzeichen | Erscheinungsdatum |
---|---|---|
GCCS | 3.049 | 1995 |
HKSCS-1999 | 4,702 | 09/1999 |
HKSCS-2001 | 4,818 | 12/2001 |
HKSCS-2004 | 4,941 | 05/2005 |
HKSCS-2008 | 5,009 | 12/2009 |
HKSCS-2016 | 5.033 | 05/2017 |
Die letzte Ausgabe von HKSCS, um alle ihre Charaktere in Big5 zu codieren, war HKSCS-2008, während die in HKSCS-2016 hinzugefügten Zeichen nur auf Unicode abgebildet sind (als a CJK Unified Ideographs Horizontale Glyphenerweiterung gegebenenfalls).[11]
Macao ergänzende Zeichenset
Ähnlich wie in Hongkongs Situation gibt es auch Charaktere, die von Macao benötigt werden, aber weder in Big5 noch HKSCs enthalten sind, daher die Macao ergänzende Zeichenset wurde entwickelt und auf HKSCs mit zusätzlichen, von Unicode-abgebildeten Zeichen aufgebaut. Die erste Charge von 121 MSCs -Zeichen wurde 2009 für die Zugabe zu oder horizontaler Erweiterung in Unicode (gegebenenfalls) eingereicht,[12] und die erste endgültige Version von MSCS wurde im Jahr 2020 eingerichtet.[11]
Kompatibilität
Betriebssysteme
Microsoft Windows
Im Microsoft Windows 98, NT 4.0, 2000, XP, HKSCS -Unterstützung können mithilfe von Microsoft Patch aktiviert werden. In der Implementierung von Microsoft, Anwendung mit Code Seite 950 verwendet automatisch einen versteckten Code Seite 951 Tabelle für die Die großen 5 Codierung der HKSCS -Erweiterungen. Die Tabelle unterstützt alle Codepunkte in HKSCS-2001, mit Ausnahme der vom Standard angegebenen Kompatibilitätscodepunkte.[13] Darüber hinaus wird die Mingliu -Schrift mit dem Patch von Microsoft verändert. Es ist bekannt, dass dieser Patch Konflikte in Anwendungen erzeugt wie z. Microsoft Office, oder jede Anwendung mit Unterstützung von Schriftarten vereinfachte chinesische Charaktere (z.B.: Simsun). Wenn die Zielumgebung benutzerdefinierte Schriftart enthält, die den vom Patch von Microsoft betroffenen Codepunkten zugeordnet sind, können die benutzerdefinierten Schriftarten den Patch von Microsoft rückgängig machen. Darüber hinaus bricht der Patch den EUDC -Editor mit den betroffenen Windows -Versionen.[14]
Beginnend mit Windows Vista werden HKSCS-2004-Zeichen nur als Unicode 4.1 oder höher unterstützt.[15] Alle Zeichen werden Standard zugewiesen, nichtPua Codepoints. Die Zeichen werden mit dem angezeigt Mingliu Schriftart, und diese Zeichen können über die Tastatur eingegeben werden. Der Patch, der bietet Die großen 5 Die Codierung von HKSCs ist in Windows Vista und später nicht unterstützt. Ein von Microsoft bereitgestellter Dienstprogramm ist verfügbar, um HKSCs und Unicode pua-kodierte Zeichen in die Unicode 4.1-Version umzuwandeln.[16]
Im Jahr 2010 veröffentlichte Microsoft einen HKSCS-2004-Patch für Windows XP und Windows Server 2003.[17] Es ersetzt Windows XP-Version von Mingliu, PMingliu und Mingliu_HKSCS (wenn HKSCS-2001-Patch angewendet wurde) durch Windows 7-Version von Mingliu, PMingliu und Mingliu_HKSCS. Darüber hinaus werden Mingliu-EXTB, Mingliu_HKSCS-EXTB- und PMINGLIU-EXTB-Schriftarten zum Zielsystem hinzugefügt. IME wird jedoch nicht so aktualisiert, wie im Fall des HKSCS-2001-Patchs, und die Schriftarten stammen aus der Vorabveröffentlichung von Windows 7.
Für frühere Versionen des Betriebssystems erfordert der HKSCS -Support die Verwendung von Microsoft Patch oder die Dienstprogramme der digitalen 21 von Hongkong.
IBM
IBM weist CCSID 5471 dem HKSCS-2001 Big5 zu Codepage (mit CPGID 1374 als CCSID 5470 als Doppel -Byte -Komponente),[18][19] CCSID 9567 zur HKSCS-2004-Codeseite (mit CPGID 1374 als CCSID 9566 als Doppel-Byte-Komponente),[20] und CCSID 13663 zur HKSCS-2008-Codeseite (mit CPGID 1374 als CCSID 13662 als Doppel-Byte-Komponente),[21] Während CCSID 1375 (mit CPGID 1374 als CCSID 1374 als Doppel -Byte -Komponente) einer wachsenden HKSCS -Codeseite zugeordnet ist, die derzeit CCSID 13663 entspricht.[22]
Linux
HKSCS -Unterstützung wurde hinzugefügt zu Glibc Im Jahr 2000, aber es wurde seitdem nicht mehr aktualisiert. Die Unterstützung der HKSCS-2004 wird als Unicode 4.1 und später als Unicode ausgezeichnet.
Zum freedesktop.org Konfiguration, Ar pl Shanheisun uni FONT unterstützt HKSCS-2004 seit 0.1-0.DOT.1, wobei die neueste Überarbeitung von HKSCS-2004 in Version 0.1.20060903-1 unterstützt wird.
Moderne Desktop -Verteilungen (z. B. Ubuntu) umfassen Arphische Technologie's HKSCS-konforme UKAI- und UMing-Schriftarten, wenn die traditionelle chinesische Sprachunterstützung während der Installation ausgewählt wird. Sie können auch zu einem späteren Zeitpunkt manuell installiert werden.
Mac OS
Mac OS X 10.0–10.2 unterstützt HKSCS-1999. 10.3–10.4 unterstützt HKSCS-2001. Einige der zu HKSCS-2004 hinzugefügten Buchstaben werden über Unicode PUA in OS X 10.4 unterstützt. Ab OS X 10.5 werden alle HKSCS-2004-Zeichen über Standard-Unicode 4.1-Codepunkte unterstützt.
Anwendungen und das Web
Mozilla 1,5 und höher unterstützt HKSCS, wobei die HKSCS-2004-Unterstützung in Gecko 1.8.1 Codebasis hinzugefügt wird.[23] Im Gegensatz zum oben genannten Patch verwendet Mozilla eine eigene Code-Seitentabelle. Die Fix für Fehler 343129 unterstützt jedoch keine Zeichen, die auf Codepunkte über den grundlegenden mehrsprachigen Ebenen zugeordnet sind.[24]
Qt 3.x-basierte Anwendungen (z. B.::: Kde) Unterstützen Sie nur Zeichen, die auf Codepunkte FFFF oder niedriger zugeordnet sind. In QT4 werden Charaktere außerhalb von BMP über Ersatzstoffe unterstützt. Big5-HKSCS Text Codec unterstützt HKSCS-1999 in QT-2.3.x, aber es war zu spät im QT-Entwicklungsplan, um offiziell in die QT-2.3.x-Serie aufgenommen zu werden, so dass es offiziell in QT-3.0.1. . Die Unterstützung von HKSCS-2001 wurde in QT-3.0.5 hinzugefügt.[25]
Gnom Unterstützt HKSCS -Zeichen in Unicode -Bereichen, mit Ausnahme derjenigen, die dem Grundblock mit mehrsprachiger Ebene zugeordnet sind. Während Pango 1.1 wurden Patches zur Unterstützung von Zeichen, die auf die oberen Basis mehrsprachigen Ebenen zugeordnet wurden, eingeführt.[26]
Das Waswg Codierungsstandard (verwendet von HTML5) Enthält HKSCs in seine Definition von Big5 (auch mit dem Plain Big5 -Label verwendet). Nur sein Decoder verwendet jedoch alle HKSCS Big5 Eten).[27] Neuere Browser folgen diesem Standard, einschließlich Feuerfuchs.
Siehe auch
Anmerkungen
Verweise
- ^ FAQs über GovHK -Online -Dienste - andere technische Fragen und Fehleraufnahmen
- ^ "Big5cmp.txt". Archiviert von das Original am 13. September 2016. Gefunden am Mapping -Tabelle - HKSCS -2008
- ^ "HKSCS-2004 Anhang IV. Kompatibilitätspunkte für GCCs" (PDF). Archiviert von das Original (PDF) am 30. September 2016. Abgerufen 29. September 2016.
- ^ "Gruppe: Big5-GCCs 外字". Abgerufen 30. September 2016.
- ^ "U-Source-Glyphen" (PDF). Abgerufen 30. September 2016.
- ^ "Die Adobe-CNS1-6-Charaktersammlung" (PDF). Abgerufen 30. September 2016.
- ^ "Charaktersätze". Iana.
- ^ "SDK -Komponenten".
- ^ "Big5-Hkscs: 2004".
- ^ "Ogcio - Entwicklung von HKSCs". Archiviert von das Original am 22. August 2017. Abgerufen 21. August 2017.
- ^ a b Macao Special Administrative Region Government (11. Juni 2020). "Einreichung der vertikalen Erweiterung von Macao (UNC -Zeichen), horizontaler Erweiterung und IVSES -Registrierung für MSCs" (PDF). ISO/IEC JTC 1/SC 2/Wg 2 Irgn 2430.
- ^ Computer chinesische Zeichen, die die Arbeitsgruppe codieren (12. Juni 2009). "Einreichung von Zeichen von Macao Information Systems Charakter Set" (PDF). ISO/IEC JTC 1/SC 2/Wg 2 Irgn 1580. archiviert von das Original (PDF) am 4. Januar 2015.
- ^ Steele, Shawn. "CP 951 & HKSCS". Ich bin kein Klingon. Frau Dev Blog. Abgerufen 13. September 2016.
- ^ 華通 資訊網: 小心! 有 人 悄悄 換掉 了 你 的 系統 系統 字型 字型 字型
- ^ Microsoft: Hongkong ergänztes Zeichensatz - Unterstützung für Windows -Plattform
- ^ Microsoft Character Code Conversion Routinen für HKSCS-2004
- ^ Windows XP -Schriftart für ISO 10646: 2003 + Änderung 1 Traditionelle chinesische Unterstützung
- ^ "CCSID 5471: gemischt Big-5 EXT für HKSCS-2001". IBM Globalisierung - codierte Zeichensatzkennungen. IBM. Archiviert von das Original am 29. November 2014.
- ^ Internationale Komponenten für Unicode (ICU), IBM-5471_P100-2006.UCM, 9. Mai 2007
- ^ "CCSID 9567: gemischt Big-5 EXT für HKSCS-2004". IBM Globalisierung - codierte Zeichensatzkennungen. IBM. Archiviert von das Original am 29. November 2014.
- ^ "CCSID 13663: gemischt Big-5 EXT für HKSCS-2008". IBM Globalisierung - codierte Zeichensatzkennungen. IBM. Archiviert von das Original am 29. November 2014.
- ^ "CCSID 1375: gemischt Big-5 Ext für HKSCs". IBM Globalisierung - codierte Zeichensatzkennungen. IBM. Archiviert von das Original am 29. November 2014.
- ^ Mozilla.org: Bug 343129-Big5-HKSCS 2004 <==> Unicode-Tabellen-Update
- ^ Bug 162431-Nicht-BMP-Unicode (Ebene 1 und höher. Ersatz) Unterstützung für Charset-Encoder/Decoder
- ^ "QT 4.7: Big5-HKSCS Text Codec". Archiviert von das Original am 4. März 2016. Abgerufen 10. November 2011.
- ^ Fehler 101081-Nicht-BMP (Ebene 1 bis Flugzeug 16) Zeichen werden nicht unterstützt
- ^ Van Kesteren, Anne. "Codierungsstandard". Waswg.
Externe Links
- Hongkonger Regierungsstelle auf den HKSCs Herunterladbare HKSCS -Dokumente & Schriftart
- Microsoft HKSCS -Unterstützung für Windows Platform
- 香港參考宋體 Laden Sie die Seite von Dynalab herunter (華康科技有限公司) 's HKSCS -Schrift.
- Grafische Ansicht von Big5-HKSCs im Konverter-Explorer der Intensivstation
- Ein Zeichensatz, der auf Mac OS X funktioniert
- UMING/UKAI-Eine kostenlose Open-Source-Schriftart unterstützt HKSCS
- Open Source Hong Kong -Schriftarten Projekt