Code Seite 942

Codepage 942 (abgekürzt wie CP942 oder IBM-942) ist eine von IBMs Erweiterungen von Schicht jis. Die codierten Zeichensätze sind Jis x 0201, Jis x 0208, IBM -Erweiterungen für IBM 1880 UDC- und IBM -Erweiterungen. Es ist die Kombination der Single-Byte Code Seite 1041 und das Doppelbyte Code Seite 301.[1]

Es ist ein Superset von IBM-932unterscheidet sich in der Verwendung von Code Seite 1041 anstelle von Code Seite 897 für seine einzelnen Byte -Codes. Code Seite 1041 ist eine Erweiterung der Code Seite 897 und fügt fünf Einzelbyte-Zeichen hinzu.[2] 0x80 wird dem zugeordnet Cent Zeichen (¢), 0xa0 wird dem zugeordnet Pfund-Zeichen (£), 0xfd wird dem zugeordnet nicht unterschreiben (¬), 0xfe wird dem zugeordnet Backslash (\) und 0xff wird dem zugeordnet Tilde (~).[3] Diese sind alle in Code Seite 897 und daher IBM-932 nicht zugewiesen.[4]

Code Seite 942 enthält Standard 7-Bit ISO 646 Codes und japanische Zeichen werden durch das hohe Bit des ersten Bytes angezeigt, das auf 1 gesetzt ist. Einige Codepunkte auf dieser Seite erfordern ein zweites Byte. Daher verwenden Zeichen entweder 8 oder 16 Bits für die Codierung.

Code Seite 1041 und damit Code Seite 942 verwendet 0x5c für die Yen Zeichen (¥) und 0x7e für die Überlinie (),[3] passen die untere Hälfte von Jis x 0201 statt US-Ascii. Die Version von Code Seite 942 verwendet jedoch in Internationale Komponenten für Unicode (genannt "IBM-942_P12A-1999" oder "X-IBM942C") verwendet US-ASCII-Zuordnungen für Single-Byte-Zeichen zwischen 0x20 und 0x7e. Dies führt zu einer doppelten Zuordnung für die Tilde (0x7e und 0xff) und den Backslash (0x5c und 0xfe).[5]

Layout

Erster Byte
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0
1
2 ! " # $ % & '' ( )) * + Anwesend - . /
3 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4 @ EIN B C D E F G H ich J K L M N Ö
5 P Q R S T U V W X Y Z [ ¥ ] ^ _
6 ` a b c d e f g h ich j k l m n Ö
7 p q r s t u v w x y z { | }
8 ¢
9
EIN £
B ソ
C
D
E
F ¬ \ ~
Zweites Byte
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0
1
2
3
4
5
6
7
8
9
EIN
B
C
D
E
F
 
Nicht druckbarer ASCII -Zeichen
Unveränderter ASCII -Charakter
Modifiziertes ASCII -Zeichen
Single-Byte-Halbbreite Katakana
Erster Byte eines Doppel-Byte-Charakters, der von Jis x 0208 verwendet wird
Nicht als erster Byte verwendet, nicht zugewiesener Raum in JIS x 0208
Erster Byte eines Doppel-Byte-IBM-Erweiterungscharakters
Erster Byte eines doppelbyte-IBM-designierten Benutzers definierten Charakter
IBM Single -Byte -Erweiterungen
Zweiter Byte eines Doppel-Byte-Charakters, dessen erste Hälfte der JIS-Sequenz ungerade war
Zweiter Byte eines Doppel-Byte-Charakters, dessen erste Hälfte der JIS-Sequenz gerade war
Ungenutzt als zweiter Byte eines Doppelbyte-Charakters


Siehe auch

Verweise

  1. ^ "Codierte Zeichensatzkennungen - CCSID 942". IBM Globalisierung. IBM. Archiviert von das Original Am 2016-03-15.
  2. ^ "Code -Seiten -Kennungen - CP 01041". IBM Globalisierung. Archiviert von das Original am 2016-06-01.
  3. ^ a b "CP01041.txt". IBM. Archiviert vom Original am 2019-01-12.
  4. ^ "CP00897.txt". IBM. Archiviert vom Original am 2019-01-12. Abgerufen 2017-11-08.
  5. ^ "Converter Explorer: IBM-942_P12A-1999". ICU -Demonstration. Internationale Komponenten für Unicode.

Externe Links