Code Seite 37
Mime / Iana | IBM037 |
---|---|
Alias (e) | CP037, EBCDIC-CP-US, EBCDIC-CP-CA, EBCDIC-CP-WT, EBCDIC-CP-NL, CSIBM0377[1] |
Einstufung | Ebcdic |
Transformationen / codiert | ISO/IEC 8859-1 |
Andere verwandte Kodierungen (en) | Ebcdic 37-2, 500, 924, 1047, 1140 |
Code Seite 37 (Ccsid 37; Etikett IBM037
),[1] bekannt als "USA/Kanada - CECP", ist ein Ebcdic Code -Seite, die auf IBM Mainframes verwendet wird. Es codiert das ISO/IEC 8859-1 Repertoire von grafischen Zeichen.
Code Seite 37 ist eine der am häufigsten verwendeten und am besten unterstützten Ebcdic-Code-Seiten. Es wird als Standard verwendet Z/OS Code -Seite in der Vereinigte Staaten und andere englischsprachige Länder.[2] Es gilt als "Erforderliche" Ebcdic -Code -Seite für die USA,[3] und auch verwendet in Australien, Neuseeland, das Niederlande, Portugal und Brasilienund weiter ESA/390 Systeme in Kanada,[4] aber nicht auf Kanadier AS/400 Systeme, die verwenden Code Seite 500 stattdessen.[5] Es ist eines von vier EBCDIC -Codeseiten (neben 500, 875 und 1026) mit Zuordnungsdaten, die von geliefert wurden Microsoft zum Unicode -Konsortium,[6] und einer von sieben (zusammen mit 273, 424, 500, 875, 1026 und 1140) unterstützt durch Python als Standard.[7]
Zeichensatz
Code Seite 37[8][9] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Soh | Stx | ETX | Sel | Ht | RNL | Del | Ge | Sps | Rpt | Vt | Ff | Cr | ALSO | Si |
1x | Dle | DC1 | DC2 | DC3 | Res/ Enp | Nl | BS | Poc | KANN | Em | UBS | Cu1 | Ifs | IGs | IRS | Ius/ ITB |
2x | Ds | SOS | Fs | Wus | BYP/ INP | Lf | ETB | ESC | Sa | Sfe | Sm/ SW | CSP | MFA | Enq | Ack | Bel |
3x | Syn | Ir | Pp | Trn | NBS | Eot | SBS | ES | RFF | Cu3 | DC4 | Nak | Sub | |||
4x | Sp | NBSP | â 00e2 | ä 00E4 | à 00e0 | á 00e1 | ã 00e3 | å 00e5 | ç 00e7 | ñ 00F1 | ¢ 00A2 | . 002e | < 003c | ( 0028 | + 002b | | 007c |
5x | & 0026 | é 00E9 | ê 00ea | ë 00eb | è 00e8 | í 00ed | î 00ee | ï 00ef | ì 00ec | ß 00df | ! 0021 | $ 0024 | * 002a | ) 0029 | ; 003b | ¬ 00AC |
6x | - 002d | / 002f | Â 00C2 | Ä 00C4 | À 00C0 | Á 00c1 | Ã 00c3 | Å 00C5 | Ç 00C7 | Ñ 00d1 | ¦ 00A6 | , 002c | % 0025 | _ 005f | > 003e | ? 003f |
7x | ø 00f8 | É 00C9 | Ê 00ca | Ë 00CB | È 00C8 | Í 00CD | Î 00CE | Ï 00cf | Ì 00cc | ` 0060 | : 003a | # 0023 | @ 0040 | ' 0027 | = 003d | " 0022 |
8x | Ø 00d8 | a 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | i 0069 | « 00ab | » 00BB | ð 00F0 | ý 00fd | þ 00FE | ± 00B1 |
9x | ° 00B0 | j 006a | k 006b | l 006c | m 006d | n 006e | o 006f | p 0070 | q 0071 | r 0072 | ª 00AA | º 00ba | æ 00E6 | ¸ 00B8 | Æ 00c6 | ¤ 00A4 |
Axt | µ 00B5 | ~ 007e | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007a | ¡ 00A1 | ¿ 00BF | Ð 00d0 | Ý 00dd | Þ 00de | ® 00AE |
BX | ^ 005e | £ 00A3 | ¥ 00A5 | · 00B7 | © 00A9 | § 00A7 | ¶ 00B6 | ¼ 00BC | ½ 00bd | ¾ 00be | [ 005b | ] 005d | ¯ 00af | ¨ 00A8 | ´ 00B4 | × 00d7 |
CX | { 007b | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | I 0049 | SCHÜCHTERN | ô 00F4 | ö 00f6 | ò 00F2 | ó 00F3 | õ 00F5 |
Dx | } 007d | J 004a | K 004b | L 004c | M 004d | N 004e | O 004f | P 0050 | Q 0051 | R 0052 | ¹ 00B9 | û 00fb | ü 00FC | ù 00f9 | ú 00fa | ÿ 00ff |
Ex | \ 005c | ÷ 00f7 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005a | ² 00B2 | Ô 00D4 | Ö 00d6 | Ò 00d2 | Ó 00d3 | Õ 00d5 |
Fx | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | ³ 00B3 | Û 00db | Ü 00dc | Ù 00d9 | Ú 00da | Eo |
Code -Seitenübersetzung
Da CP 037 alle Standard-Latin-1-Zeichen enthält, ist es möglich, die Zeichencodes aus dem CP 037-Zeichen zu übersetzen zu ISO 8859-1 Charaktercodes, so dass die Übersetzung zum CP 037-Zeichen eine genaue Wertschöpfung ist Rundfahrt Wandlung. Ebenso die Hälfte der Steuerzeichen Codes können genau in ihre übersetzt werden ASCII Äquivalente. Wenn der Rest Ebcdic-Nur Kontrollzeichen werden (willkürlich) in die verbleibenden nicht verwendeten ASCII -Codes -Punkte (Hex 80 bis 9F) übersetzt, wobei die resultierende Übersetzung alle 256 -Zeichen -Codepunkte abdeckt. Eine solche Übersetzungstabelle ist unten dargestellt:
CP 037 → ISO 8859-1 _0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _EIN _B _C _D _E _F 0_ 00 01 02 03 9c 09 86 7f 97 8d 8e 0b 0c 0d 0e 0f 1_ 10 11 12 13 9d 85 08 87 18 19 92 8f 1c 1d 1E 1f 2_ 80 81 82 83 84 0a 17 1b 88 89 8a 8b 8c 05 06 07 3_ 90 91 16 93 94 95 96 04 98 99 9A 9b 14 15 9e 1a 4_ 20 A0 E2 E4 E0 E1 E3 E5 E7 F1 A2 2e 3c 28 2b 7c 5_ 26 E9 EA Eb E8 Ed EE EF EC Df 21 24 2a 29 3b AC 6_ 2d 2f C2 C4 C0 C1 C3 C5 C7 D1 A6 2c 25 5f 3e 3f 7_ F8 C9 Ca. CB C8 CD Ce Vgl CC 60 3a 23 40 27 3d 22 8_ D8 61 62 63 64 65 66 67 68 69 Ab BB F0 FD Fe B1 9_ B0 6a 6b 6c 6d 6e 6F 70 71 72 Aa Ba E6 B8 C6 A4 EIN_ B5 7e 73 74 75 76 77 78 79 7A A1 Bf D0 Dd De Ae B_ 5e A3 A5 B7 A9 A7 B6 BC Bd SEIN 5b 5d Af A8 B4 D7 C_ 7b 41 42 43 44 45 46 47 48 49 ANZEIGE F4 F6 F2 F3 F5 D_ 7d 4a 4b 4c 4d 4e 4f 50 51 52 B9 FB Fc F9 FA Ff E_ 5c F7 53 54 55 56 57 58 59 5a B2 D4 D6 D2 D3 D5 F_ 30 31 32 33 34 35 36 37 38 39 B3 Db DC D9 Da 9f
Varianten und Beziehung zu anderen Codeseiten
Es gibt mehrere andere Codeseiten, die auf Code Seite 37 mit einigen ausgetauschten Zeichen belaufen. Insbesondere codiert Code Seite 37 die Harte Halterungen ([]
) bei baverhexen und BBverhexen, während andere Varianten andere Codierungen für die Hardklassen verwenden. Zum Beispiel, Code Seite 1047 ist eine Variante, die von der verwendet wird MVS Open Systems Compiler.[10] Es unterscheidet sich von Code Seite 37 in sechs Positionen: Ý
und [
Wechseln Sie wie auch ¨
und ]
die harten Klammern bei der Anzeige platzierenverhexen und bdverhexen; Die Pfarr- und Nicht -Zeichen wechseln auch die Plätze[11][12] Diese Codierung der Klammern wurde aus dem 3270 -Display -System geerbt.[13] Obwohl IBM Code beabsichtigt, dass Seite 1047 nur zur Erfüllung bestimmter Anforderungen verwendet wird, und nicht als Ersatz für die Code Seiten 37 und 500,[3] Die Teilmenge der Code Seite 1047 codiert die ASCII Repertoire wurde für die Single-Byte-grafischen Codes in verwendet UTF-EBCDIC.[10]
Ein Mischung aus Code Seiten 37 und 1047, die in Kombination mit verwendet werden mit Code Seite 310 auf das 3279 -System wurde von anerkannt von TEILEN, aber nicht offiziell als Code -Seite von IBM bezeichnet und wird manchmal als als bezeichnet Code Seite 37-2 durch Transcodierung Software.[13] Es entspricht hauptsächlich mit Code Seite 1047, außer dass die Pflege und das Nicht -Zeichen invertiert werden, um die Code -Seite 37 zu entsprechen.[13][14]
Code Seite 500, bekannt als "International Ebcdic",[5] "International Latin-1" oder "International Nummer 5",[13] ist die andere wichtige Ebcdic-Codierung für das ISO/IEC 8859-1 Repertoire. Es wird in verwendet Belgien, Schweiz und weiter AS/400 Systeme in Kanada.[5] Es bezieht sich auf Code Seite 37 und hat das gleiche Repertoire, unterscheidet sich jedoch in sieben Positionen. Insbesondere codiert es [
und ]
bei 4averhexen und 5averhexen jeweils für die verwendet werden Cent Zeichen (¢
) und Ausrufezeichen (!
) in Code Seite 37. Die Pflege (^
) ist auch bei 5f codiertverhexen, ähnlich wie die Code Seite 37-2 und 1047. Die ¢
ist bei B0 codiertverhexen, das ¬
bei baverhexen, das !
bei 4fverhexen und die Pfeifencharakter (|
) bei BBverhexen.[15][16] Code Seite 500 bezieht sich wiederum mit dem Deutschen Code Seite 273, die mehrere Charakterpaare auf eine Weise ausgetauscht, die den Unterschieden zwischen den Unterschieden entspricht DRV8 und ISO/IEC 8859-1, was zur Platzierung der Hardklammern bei 63 führtverhexen und FCverhexen.[17]
Eine Variante von Code Seite 37 mit dem Eurozeichen (€
) Zeichen bei der 9F hinzugefügtverhexen Position, ersetzen die Universelles Währungszeichen (¤
) ist Code Seite 1140.[18][19] Ähnlich, Code Seite 1148 führt die gleiche Änderung an Code Seite 500 vor,[20][21] und Code Seite 1141 tut dies zu Code Seite 273.[22]
Eine Ebcdic -Code -Seite mit der ISO/IEC 8859-15 Repertoire, einschließlich des Euro -Zeichens, ist Code Seite 924; Dies bezieht sich auf die Code Seite 1047, aber mit den ISO/IEC 8859-1 Zeichen, die durch ihre ISO/IEC 8859-15 ersetzt wurden, durch ¢ und ¬ Verschleppt auf ihre Code 500-Standorte bei B0verhexen und baverhexen jeweils und mit ý auf 4a bewegtverhexen.[23]
Siehe auch
Verweise
- ^ a b Iana -Charakter -Sets
- ^ Stephens, David (2011), "Lost in Translation 1 - Ebcdic -Code -Seiten", Longex Mainframe Quarterly, Longpela Expertise
- ^ a b "Code -Seiten -Kennungen - CPGID 1047". IBM. Archiviert von das Original Am 2015-06-07.
Diese Code -Seite ist für eine begrenzte Verwendung gedacht, um bestimmte Anforderungen zu erfüllen. Es ist nicht als Ersatz für die Code Seite 00037 gedacht. Dies ist die erforderliche Code -Seite für die Vereinigten Staaten und mehrere andere Länder oder Code Seite 00500
- ^ "Codierte Zeichensatzkennungen - CCSID 37". IBM. Archiviert von das Original Am 2014-11-29.
- ^ a b c "Codierte Zeichensatzkennungen - CCSID 500". IBM. Archiviert von das Original Am 2014-12-01.
- ^ "Zuordnungen | Anbieter | Microsoft | Ebcdic". Unicode -Konsortium.
- ^ "Codecs - Codec -Registrierung und Basisklassen § Standardcodierungen". Python -Dokumentation. Python Software Foundation.
- ^ Code Seite CPGID 00037 (PDF) (PDF), IBM
- ^ Code Seite CPGID 00037 (TXT), IBM
- ^ a b Umamaheswaran, V.S. (2002-04-16). "UTF-EBCDIC". Unicode -Konsortium. Unicode Technischer Bericht Nr. 16.
Die Karte bewahrt die Invarianz für einen Satz von 82 Grafikzeichen (einschließlich Raum) (bekannt als IBM Syntactic Graphic Character Set) und behält die Konsistenz mit der Seite IBM MVS Open Systems Code (CPGID 1047) für die Varianten von innerhalb des ASCII bei Repertoire.
- ^ "IBM-1047". Internationale Komponenten für Unicode. Konverter Explorer. Unicode -Konsortium.
- ^ "Code Seite 1047" (PDF). IBM. Archiviert (PDF) vom Original am 2015-07-08. Abgerufen 2021-06-09.
- ^ a b c d XLATE - Transliterate Inhalt von Datensätzen, IBM Corporation, 2010 [1986], archiviert vom Original am 2019-06-16, abgerufen 2016-10-18
- ^ "x3270 Zeichensatz". x3270 Dokumentation. Archiviert von das Original Am 2018-11-10.
- ^ "IBM-500". Internationale Komponenten für Unicode. Konverter Explorer. Unicode -Konsortium.
- ^ "Code Seite 500" (PDF). IBM. Archiviert (PDF) vom Original am 2015-07-08. Abgerufen 2021-06-09.
- ^ "IBM-273". Internationale Komponenten für Unicode. Konverter Explorer. Unicode -Konsortium.
- ^ "IBM-1140". Internationale Komponenten für Unicode. Konverter Explorer. Unicode -Konsortium.
- ^ "Code Seite 1140" (PDF). IBM. Archiviert (PDF) vom Original am 2015-07-08. Abgerufen 2021-06-09.
- ^ "IBM-1140". Internationale Komponenten für Unicode. Konverter Explorer. Unicode -Konsortium.
- ^ "Code Seite 1148" (PDF). IBM. Archiviert (PDF) vom Original am 2015-07-08. Abgerufen 2021-06-09.
- ^ "IBM-1141". Internationale Komponenten für Unicode. Konverter Explorer. Unicode -Konsortium.
- ^ "Code Seite 924" (PDF). IBM. Archiviert (PDF) vom Original am 2015-07-08. Abgerufen 2021-06-09.