Multinationaler Charaktersatz

Multinationaler Charaktersatz (MCS)
Mime / Iana DEC-MCS
Alias ​​(e) IBM1100, CP1100, WE8DEC, CSDECMCS, Dez.
Sprachen) Englisch, verschiedene andere
Erweitert US-Ascii
gefolgt von ISO 8859-1, LICs, Brascii, Korkkodierung

Das Multinationaler Charaktersatz (DMCs oder MCS) ist ein Zeichenkodierung 1983 geschaffen von Digital Equipment Corporation (Dez) zur Verwendung in der Populär VT220 Terminal. Es war eine 8-Bit-Erweiterung von ASCII Das zusätzliche Akzentzeichen, Währungssymboleund andere Charakterglyphen, die in 7-Bit-ASCII fehlen. Es ist nur einer der Codeseiten Implementiert für den VT220 Nationaler Ersatzcharaktersatz (NRCS).[1][2] MCS ist als IBM registriert Codepage/Ccsid 1100 (Multinationale Emulation) seit 1992.[3][4] Abhängig von der damit verbundenen Sortierung Orakel nennt es We8dec, N8DEC, DK8DEC, S8dec, oder Sf8dec.[5][6]

Eine solche "erweiterte ASCII"Sets waren häufig (der nationale Ersatzcharakter -Set für mehr als ein Dutzend europäischer Sprachen), aber MCS hat die Auszeichnung, der Vorfahr von zu sein ECMA-94 1985[7] und ISO 8859-1 1987.[8]

Das Code-Diagramm von MCS mit ECMA-94, ISO 8859-1 und den ersten 256 Codepunkten von Unicode haben viel mehr Ähnlichkeiten als Unterschiede. Zusätzlich zu nicht verwendeten Codepunkten sind Unterschiede zu ISO 8859-1:

MCS -Codepunkt Unicode -Mapping Charakter
0xa8 U+00A4 ¤
0xd7 U+0152 Œ
0xdd U+0178 Ÿ
0xf7 U+0153 œ
0xfd U+00ff ÿ

Zeichensatz

Dec Multinational Character Set[3][9][10][11][12][13][14]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0_ Nul Soh Stx ETX Eot Enq Ack Bel  BS   Ht   Lf   Vt   Ff   Cr   ALSO   Si  
1_ Dle DC1 DC2 DC3 DC4 Nak Syn ETB KANN  Em  Sub ESC  Fs   Gs   Rs   UNS 
2_  Sp  ! " # $ % & ' ( ) * + , - . /
3_ 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4_ @ A B C D E F G H I J K L M N O
5_ P Q R S T U V W X Y Z [ \ ] ^ _
6_ ` a b c d e f g h i j k l m n o
7_ p q r s t u v w x y z { | } ~ Del
8_ Ind Nel SSA ESA HTS Htj VTS PLD Plu  Ri   SS2 SS3
9_ DCS PU1 PU2 Sts CCH MW SPA EPA CSI  St  OSC  PM  APC
EIN_ ¡ ¢ £ ¥ § ¤
00A4
© ª «
B_ ° ± ² ³ µ · ¹ º » ¼ ½ ¿
C_ À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
D_ Ñ Ò Ó Ô Õ Ö Œ
0152
Ø Ù Ú Û Ü Ÿ
0178
ß
E_ à á â ã ä å æ ç è é ê ë ì í î ï
F_ ñ ò ó ô õ ö œ
0153
ø ù ú û ü ÿ
00ff
 Unterschiede aus ISO-8859-1

Siehe auch

Verweise

  1. ^ "VT220 Programmer Referenzhandbuch" (2 ed.). Digital Equipment Corporation (Dez). 1984 [1983].
  2. ^ "Tinselner Emulator - Nationaler Ersatzcharakter Set (NRCS)". Jahrhundertsoftware. Archiviert vom Original am 2016-12-01. Abgerufen 2016-12-01. [sic]
  3. ^ a b "SBCS -Code -Seiteninformationen - CPGID: 01100 / Name: Multinationale Emulation". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-03. Abgerufen 2016-12-02. [1] [2] [3]
  4. ^ "CCSID 1100 Informationsdokument". Archiviert von das Original Am 2014-12-01.
  5. ^ Baird, Cathy; Chiba, Dan; Chu, Winson; Fan, Jessica; Ho, Claire; Gesetz, Simon; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Trute, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, tim; Wang, Chao; Wong, Simon; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie (2002) [1996]. "Anhang A: Gebietsschemasdaten". Oracle9i -Datenbank Globalisierung Support Guide (PDF) (Release 2 (9.2) ed.). Oracle Corporation. Oracle A96529-01. Archiviert (PDF) vom Original am 2017-02-14. Abgerufen 2017-02-14.
  6. ^ "Oracle Charakterenset -Beschreibungen für 9.2". Tageslicht chemische Informationssysteme. 2017. Archiviert vom Original am 2016-06-17. Abgerufen 2017-02-14.
  7. ^ Standard ECMA-94: 8-Bit-Einzel-Byte-Coded Grafic-Zeichensatz (PDF) (1 ed.). Europäische Computerherstellervereinigung (ECMA). März 1985 [1984-12-14]. Archiviert (PDF) vom Original am 2016-12-02. Abgerufen 2016-12-01. Seit 1982 wurde die Dringlichkeit der Notwendigkeit eines 8-Bit-Single-Byte-Coded-Zeichensatzes in ECMA sowie in ANSI/X3L2 erkannt, und es wurden zahlreiche Arbeitspapiere zwischen den beiden Gruppen ausgetauscht. Im Februar 1984 wurde ECMA TC1 an ISO/TC97/SC2 ein Vorschlag für einen solchen codierten Zeichensatz eingereicht. Auf seiner Sitzung vom April 1984 beschloss SC, TC97 einen Vorschlag für ein neues Arbeitspunkt für dieses Thema zu unterwerfen. Technische Diskussionen während und nach diesem Treffen veranlassten TC1, das von X3L2 vorgeschlagene Codierungsschema zu übernehmen. Teil 1 des Entwurfs International Standard DTS 8859 basiert auf diesem gemeinsamen ANSI/ECMA -Vorschlag .... von der Generalversammlung vom 13. bis 14. Dezember 1984 als ECMA -Standard angenommen.
  8. ^ Czyborra, Roman (1998). "ISO 8859-1 und MCS". ISO 8859 Alphabetsuppe. Archiviert vom Original am 2016-12-01. Abgerufen 2016-12-01. [4] [5]
  9. ^ "VT220 Programmer Referenzhandbuch". Digital Equipment Corporation (Dez). Tabelle 2-3: Dec Multinationales Zeichensatz (C1- und GR-Codes). Abgerufen 2016-12-02.
  10. ^ VAX/VMS -Benutzerhandbuch. Digital Equipment Corporation (Dez). April 1986. AI-Y517a-te.
  11. ^ Dezember (Februar 1992) [November 1989]. "Kapitel 2: Charaktercodierung - Dec Supplemental Graphic Character Set". VT420 Programmer Referenzhandbuch (PDF) (2 ed.). Digital Equipment Corporation. S. 24–25. EK -VT420 - RM.002. Archiviert (PDF) vom Original am 2017-01-29. Abgerufen 2017-01-29.
  12. ^ Flohr, Guido (2016) [2006]. "Locale :: Recodedata :: DEC_MCS - Konvertierungsroutinen für dec_mcs". CPAN libintl-perl. 1.0. Archiviert vom Original am 2017-01-14. Abgerufen 2017-01-14.
  13. ^ Kostis, Kosta. "Dec Multinational Character Set (DEC MCS)". 1.20. Archiviert vom Original am 2017-01-16. Abgerufen 2017-01-16.
  14. ^ Cowan, John Woldemar (1999-07-07). "Dec Multinational Character Set (1987) zu Unicode". 0,1. Unicode, Inc. Archiviert von das Original Am 2017-02-18. Abgerufen 2017-02-18.