EBCDIC
Einstufung | 8 Bit Grundlatein Codierungen (nicht ascii) |
---|---|
Vorausgegangen von | BCD |
Erweiterter binär codierter Dezimalstauschcode[1] (Ebcdic;[1] /ˈɛbsɪdɪk/) ist acht-bisschen Zeichenkodierung hauptsächlich auf IBM Mainframe und IBM Midrange -Computer Betriebssysteme. Es stammte aus dem mit verwendeten Code herab mit geschlagene Karten und das entsprechende Sechs-Bit-Binärcodierte Dezimalzahl Code verwendet mit den meisten IBMs Computerperipheriegeräte der späten 1950er und frühen 1960er Jahre.[2] Es wird von verschiedenen Nicht-IBM-Plattformen unterstützt, wie z. Fujitsu-Siemens' BS2000/OSD, OS-IV, MSP und MSP-EX, die SDS Sigma -Serie, Unisys Vs/9, Unisys MCP und ICL Vme.
Geschichte
Ebcdic wurde 1963 und 1964 von entwickelt von IBM und wurde mit der Veröffentlichung der angekündigt IBM System/360 Mainframe -Linie Computers. Es ist eine acht-Bit-Charakter-Codierung, die getrennt vom sieben-Bit entwickelt wurde ASCII Codierungsschema. Es wurde erstellt, um die bestehenden zu erweitern Binärcodierte Dezimalzahl (BCD) Austauschcode oder BCDIC, was selbst als effizientes Mittel zur Kodierung der beiden entwickelt wurde Zone und Nummer Schläge auf geschlagene Karten in sechs Teile. Die unterschiedliche Codierung von 's' und 's' (mit Position 2 anstelle von 1) wurde von geschlagenen Karten gepflegt, wo es wünschenswert war, nicht zu nahe an einander Lochschläge zu haben, um die Integrität der physischen Karte zu gewährleisten.
Während IBM ein Hauptvertreter des ASCII -Standardisierungsausschusses war,[3] Das Unternehmen hatte keine Zeit, ASCII -Peripheriegeräte (wie Kartenpunschmaschinen) mit seinem System/360 Computern zu versenden, sodass sich das Unternehmen für EBCDIC entschieden hat.[2] Das System/360 wurde sehr erfolgreich, zusammen mit Klonen wie RCA -Spektren 70, ICL System 4und Fujitsu Facom, so auch Ebcdic.
Alles IBM Mainframe und mittlerer Bereich Betriebssysteme Verwenden Sie Ebcdic als ihre inhärente Kodierung[4] (Zum Beispiel mit Toleranz für ASCII Ispf in Z/OS kann sowohl EBCDIC- als auch ASCII -codierte Dateien durchsuchen und bearbeiten). Software kann zu und von Codings und modernen Mainframes übersetzen (wie z. Ibm z) Einbeziehung von Prozessoranweisungen auf Hardwareebene, um die Übersetzung zwischen Zeichensätzen zu beschleunigen.
Es gibt ein Ebcdic-orientiert Unicode -Transformationsformat genannt UTF-EBCDIC vorgeschlagen von der Unicode -Konsortium, entwickelt, um eine einfache Aktualisierung der EBCDIC -Software zu ermöglichen Unicode, aber nicht in gezwungenem Austauschumgebungen verwendet werden. Selbst auf Systemen mit umfangreicher EBCDIC -Unterstützung war es nicht beliebt. Zum Beispiel unterstützt Z/OS Unicode (bevorzugt UTF-16 insbesondere), aber Z/OS hat nur eine begrenzte Unterstützung für UTF-EBCDIC.
Nicht alle IBM -Produkte verwenden EBCDIC; IBM AIX, Linux auf ibm z, und Linux auf Strom Alle verwenden ASCII.
Kompatibilität mit ASCII
Es gab zahlreiche Schwierigkeiten beim Schreiben von Software, die sowohl in ASCII als auch in Ebcdic funktionieren würden.
- Die Lücken zwischen Buchstaben machten einfache Code, die in ASCII funktionierten, bei EBCDIC. Zum Beispiel
for (c = 'A'; c <= 'Z'; ++c) putchar(c);
Würde das Alphabet von A bis Z drucken, wenn ASCII verwendet wird, aber 41 Zeichen (einschließlich einer Reihe von nicht zugewiesenen) in Ebcdic. Wenn Sie dies beheben, musste der Code mit Funktionsaufrufen kompliziert werden, was von den Programmierern stark widerstanden wurde. - Sortieren von Ebcdic stellen Kleinbuchstaben vor Großbuchstaben und Buchstaben vor Zahlen, genau das Gegenteil von ASCII.
- Programmiersprachen und Dateiformate und Netzwerkprotokolle, die für ASCII entwickelt wurden { und }) Das existierte in Ebcdic nicht und erschwerte die Übersetzung in Ebcdic -Systeme. Umgekehrt hatte Ebcdic ein paar Charaktere wie ¢ (US Cent) Das wurde auf IBM -Systemen verwendet und konnte nicht in ASCII übersetzt werden.
- Die am häufigsten verwendete Newline -Konvention mit EBCDIC ist die Verwendung a Nel (Nächste Zeile) Code zwischen den Zeilen. Konverter zu anderen Codierungen ersetzen häufig NEL durch Lf oder Cr/lfAuch wenn die Zielcodierung ein Nel enthält. Dies führt dazu, dass LF und NEL zum gleichen Charakter übersetzt werden und nicht unterschieden werden können.
- Wenn sieben-Bit-ASCII verwendet wurde, gab es in 8-Bit-Bytes ein "unbenutztes" Hochstück, und viele Software-Teile speichern dort andere Informationen. Die Software würde auch die sieben Bits einpacken und den achten Satz verwerfen, z. B. das Verpacken von fünf sieben-Bit-ASCII-Zeichen in a 36-Bit Wort.[5] Auf der PDP-11 Bytes mit dem hohen Bit -Set wurden als negative Zahlen behandelt, Verhalten, das kopiert wurde C, was unerwartete Probleme verursacht, wenn das hohe Bit festgelegt wurde. Dies alles machte es schwierig, von ASCII auf das 8-Bit-Ebcdic zu wechseln (und es auch schwierig machte, auf 8-Bit umzusteigen erweiterte ASCII Codierungen).
Code -Seitenlayout
Es gibt Hunderte von EBCDIC -Code -Seiten, die auf der ursprünglichen Ebcdic -Codierung basieren. Es gibt eine Vielzahl von Ebcdic Codeseiten Für die Verwendung in verschiedenen Teilen der Welt bestimmt, einschließlich Code-Seiten für Nicht-Latin-Skripte wie Chinesen, Japanisch (z. B. Ebcdic 930, JEF und Keis), Koreanisch und Griechisch (Ebcdic 875). Es gibt auch eine große Anzahl von Variationen mit den Buchstaben, die ohne erkennbare Grund umgetauscht wurden.
Die folgende Tabelle zeigt die "invariante Teilmenge"[6] von ebcdic, die Charaktere sind, die sollte Haben Sie die gleichen Zuordnungen auf allen EBCDIC -Codeseiten, auf denen das lateinische Alphabet verwendet wird. (Dies schließt den größten Teil der ein ISO/IEC 646 Invariante Repertoire außer dem Ausrufezeichen.) Es zeigt auch (in grau) fehlende ASCII- und Ebcdic -Interpunktion, wo sie sich befinden Code Seite 37 (Eine der Code -Seitenvarianten von EBCDIC). Die leeren Zellen sind mit regionspezifischen Zeichen in den Varianten gefüllt, aber die Charaktere in Grau werden oft auch herumgetauscht oder ersetzt.
Ebcdic | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Soh | Stx | ETX | Sel | Ht | RNL | Del | Ge | Sps | Rpt | Vt | Ff | Cr | ALSO | Si |
1x | Dle | DC1 | DC2 | DC3 | Res/ Enp | Nl | BS | Poc | KANN | Em | UBS | Cu1 | Ifs | IGs | IRS | Ius/ ITB |
2x | Ds | SOS | Fs | Wus | BYP/ INP | Lf | ETB | ESC | Sa | Sfe | Sm/ SW | CSP | MFA | Enq | Ack | Bel |
3x | Syn | Ir | Pp | Trn | NBS | Eot | SBS | ES | RFF | Cu3 | DC4 | Nak | Sub | |||
4x | Sp | ¢ | . | < | ( | + | | | |||||||||
5x | & | ! | $ | * | ) | ; | ¬ | |||||||||
6x | - | / | ¦ | , | % | _ | > | ? | ||||||||
7x | ` | : | # | @ | ' | = | " | |||||||||
8x | a | b | c | d | e | f | g | h | i | ± | ||||||
9x | j | k | l | m | n | o | p | q | r | |||||||
Axt | ~ | s | t | u | v | w | x | y | z | |||||||
BX | ^ | [ | ] | |||||||||||||
CX | { | A | B | C | D | E | F | G | H | I | ||||||
Dx | } | J | K | L | M | N | O | P | Q | R | ||||||
Ex | \ | S | T | U | V | W | X | Y | Z | |||||||
Fx | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | Eo |
Definitionen von Nicht-ASCII-eBCDIC-Kontrollen
Im Folgenden finden Sie die Definitionen von EBCDIC -Steuerzeichen, die entweder nicht auf das abbilden ASCII -Steuerzeichen, oder zusätzliche Verwendungszwecke haben. Wenn diese auf Unicode zugeordnet sind, werden diese meist in eine Weise auf C1 -Kontrollzeichen in einer Weise zugeordnet, die durch die IBM -Architektur der Charakterdatenrepräsentation (CDRA) angegeben ist.[7][8]
Obwohl die Standardzuordnung der neuen Zeile (NL) dem ISO/IEC 6429 Next Line (NEL) -Scharakter entspricht (dessen Verhalten auch in Unicode Anhang 14 angegeben, aber nicht erforderlich ist),[9] Die meisten dieser C1-Made-Steuerelemente entsprechen weder denen in der ISO/IEC 6429 C1 SETnoch diejenigen in anderen registrierten C1 -Kontrollsätzen wie z. ISO 6630.[10] Obwohl dies effektiv die Nicht-ASCII-EBCDIC-Steuerung zu einem einzigartigen C1-Kontrollsatz macht, gehören sie nicht zu den C1-Kontrollsätzen, die in der registriert sind ISO-IR Registrierung,[11] was bedeutet, dass sie keine zugewiesene Steuerungssequenz für die Steuerungssatz haben (wie angegeben von ISO/IEC 2022, und optional erlaubt in ISO/IEC 10646 (Unicode)).[12]
Neben U+0085 (nächste Zeile) verschreibt der Unicode -Standard keine Interpretation von C1 -Kontrollzeichen, wodurch ihre Interpretation auf höhere Ebenenprotokolle zurücklässt (dies ist nicht erforderlich, ihre ISO/IEC 6429 -Interpretationen in Abwesenheit von Nutzung für nicht erforderlich andere Zwecke),[13] Diese Zuordnung ist also in Unicode zulässig, aber nicht von ihnen angegeben.
Mnemonisch | Ebcdic | CDRA -Paarung[7][8] | Name | Beschreibung[14] |
---|---|---|---|---|
Sel | 04 | 009c | Auswählen | Gerätesteuerzeichen Nehmen Sie einen Einzel-Byte-Parameter. |
Pf | Abstellen | An diesem Ort aufgeführt von GOST 19768-93.[15] | ||
RNL | 06 | 0086 | Erforderliche neue Linie | Zurücksetzen des Zeilenaufbruchs Tabelle Registerkarte Modus |
LC | Kleinbuchstaben | An diesem Ort aufgeführt von GOST 19768-93.[15] | ||
Ge | 08 | 0097 | Grafische Flucht | Nicht abgestufte Verschiebung, die die Interpretation des folgenden Zeichens ändert (siehe z. Code Seite 310). Vergleichen Sie ISO/IEC 6429 SS2 (008e). |
Sps | 09 | 008d | Superscript | Beginnen Sie Superscript oder rückgängig. Vergleichen Sie ISO/IEC 6429 Plu (008c). |
Rpt | 0a | 008e | Wiederholen | Wechseln Sie zu einem Betriebsmodus, der einen Druckpuffer wiederholt |
Smm | Beginn der manuellen Nachricht | An diesem Ort aufgeführt von GOST 19768-93.[15] | ||
Res/enp | 14 | 009d | Wiederherstellen, Präsentation aktivieren | Wiederaufnahmeleistung (nach BYP/INP)) |
Nl | 15 | 0085 (000A) | Neue Zeile | Zeilenumbruch. Standard Mapping (0085) entspricht ISO/IEC 6429's Nel. Zuordnungen, die manchmal mit Linien -Feed (EBCDIC 0x25) gemäß der Unix -Linien -Breaking -Konvention ausgetauscht werden.[7] |
Poc | 17 | 0087 | Programmbetreiber Kommunikation | Gefolgt von zwei Ein-Byte-Operatoren, die die spezifische Funktion identifizieren, z. B. einen Licht- oder Funktionstaste. Kontrast zu ISO/IEC 6429's CSI (009b), OSC (009d) und APC (009f). |
Il | Leerlauf | An diesem Ort aufgeführt von GOST 19768-93.[15] | ||
UBS | 1a | 0092 | Einheit Rückraum | Ein fraktionaler Rückraum. |
CC | Cursorkontrolle | An diesem Ort aufgeführt von GOST 19768-93.[15] | ||
Cu1 | 1b | 008f | Kunden verwenden einen | Nicht von IBM verwendet; für den Kundengebrauch. |
Ius/itb | 1f | 001f | Austauscheinheitseparator, Zwischenübertragungsblock | Entweder als Informationsabscheider verwendet, um einen Block namens "Einheit" zu beenden (als in ASCII; siehe auch Ir) oder als Übertragungskontrollcode verwendet, um das Ende eines Zwischenblocks abzugrenzen. |
Ds | 20 | 0080 | Ziffernauswahl | Verwendet von S/360 CPU Edit (ED) Anweisung |
SOS | 21 | 0081 | Signifikanzstart | Verwendet von S/360 CPU Edit (ED) Anweisung. (Hinweis: Unterscheidet sich von ISO/IEC 6429 SOS; Wenn es notwendig ist, sie zu unterscheiden, ist IBM -Abkürzes Start von Bedeutung als SOS. (mit einem Punkt) und Beginn der String als SOS sonst werden sie gleich abgekürzt.)[16] |
Fs,[14] Fds[15] | 22 | 0082 | Feldabscheider | Verwendet von S/360 CPU Edit (ED) Anweisung. (Notiz: (Interchange) Dateitrennzeichen, wie abgekürzte FS in ASCII, bei 0x1c und abgekürzt ifs.)[14] |
Wus | 23 | 0083 | Wort unterstreichen | Unterstreicht das unmittelbare vorhergehende Wort. Kontrast zu ISO/IEC 6429's SGR. |
BYP/INP | 24 | 0084 | Bypass, Hemmung der Präsentation | Deaktiviert die Ausgabe, d. H. Ignoriert alle grafischen Zeichen und Kontrollzeichen neben den Übertragungssteuercodes und Res/ENP bis zum nächsten Res/enp. |
Sa | 28 | 0088 | Setzen Sie das Attribut | Markiert den Beginn einer Gerätespezifischen Steuersequenz mit fester Länge. Veraltet zugunsten von CSP. |
Sfe | 29 | 0089 | Startfeld erweitert | Markiert den Beginn einer Gerätespezifischen Steuersequenz mit variabler Länge. Veraltet zugunsten von CSP. |
SM/SW | 2a | 008a | Modus einstellen, Schalter | Gerätespezifische Steuerung, die eine Betriebsart wie einen Pufferschalter festlegt. |
Cu2 | 2b | 008B | Kunden verwenden zwei | Dies erscheint in einigen Spezifikationen, wie z. GOST 19768-93;[15] Neuere IBM-Spezifikationen für EBCDIC-Steuercodes listen nur Cu1 und Cu3 als Kundennutzung auf und verwenden diese Position für CSP.[14] |
CSP | Kontrollsequenz Präfix | Markiert den Beginn einer Gerätespezifischen Steuersequenz mit variabler Länge. Gefolgt von einem Klassen -Byte, das eine Kategorie von Kontrollfunktion angibt, ein Zählbyte, das die Sequenzlänge (einschließlich Zähl- und Typ Bytes, nicht das Klassenbyte oder das anfängliche CSP), ein Typ -Byte, der eine Steuerfunktion innerhalb dieser Kategorie identifiziert, und Null oder Weitere Parameter -Bytes. Kontrast zu ISO/IEC 6429's DCS (0090) und CSI (009b). | ||
MFA | 2c | 008c | Das Feld Attribut ändern | Markiert den Beginn einer Gerätespezifischen Steuersequenz mit variabler Länge. Veraltet zugunsten von CSP. |
30 | 0090 | (reserviert) | Reserviert für die zukünftige Verwendung von IBM | |
31 | 0091 | (reserviert) | Reserviert für die zukünftige Verwendung von IBM | |
Ir | 33 | 0093 | Indexrückgabe | Beide Bewegung zum Start der nächsten Zeile (siehe auch Nl) oder eine Informationseinheit beenden (siehe auch Ius/itb). |
Pp | 34 | 0094 | Präsentationsposition | Gefolgt von zwei Ein-Byte-Parametern (zuerst Funktion, zweitens Anzahl der Spalten oder Zeile), um die aktuelle Position festzulegen. Kontrast zu ISO/IEC 6429's Cup und HVP. |
Pn | Stanzen | An diesem Ort aufgeführt von GOST 19768-93.[15] | ||
Trn | 35 | 0095 | Transparent | Gefolgt von einem Byte -Parameter, der die Anzahl der Bytes transparenter Daten angibt, die folgen. |
RST | Leser Stopp | An diesem Ort aufgeführt von GOST 19768-93.[15] | ||
NBS | 36 | 0096 | Numerischer Rückraum | Bewegen Sie die Breite einer Ziffer rückwärts. |
UC | Oberer Fall | An diesem Ort aufgeführt von GOST 19768-93.[15] | ||
SBS | 38 | 0098 | Index | Beginnen Sie ein Index oder den SuperScript. Vergleichen Sie ISO/IEC 6429 PLD (008b). |
ES | 39 | 0099 | Tabelle Registerkarte | Nutze den Strom und alle folgenden Zeilen, bis RNL oder RFF wird angetroffen. |
RFF | 3a | 009a | Erforderlicher Formfutter | RETT-SETTING Tabelle Registerkarte Modus. |
Cu3 | 3b | 009b | Kunden verwenden drei | Nicht von IBM verwendet; für den Kundengebrauch. |
3e | 009e | (reserviert) | Reserviert für die zukünftige Verwendung von IBM | |
Eo | Ff | 009f | Acht | Alle als Füllstoff verwendeten Zeichen |
Codeseiten mit Latin-1-Zeichensätzen
Die folgenden Codeseiten haben die volle Latin-1-Zeichenset (ISO/IEC 8859-1). Die erste Spalte gibt die ursprüngliche Code -Seitennummer an. Die zweite Spalte gibt die Anzahl der mit dem aktualisierten Code -Seite an Eurozeichen (€) Ersetzen des Universales Währungszeichen (¤) (oder im Fall von EBCDIC 924, wobei der zu übereinstimmende Set geändert wurde ISO 8859-15))
Ccsid | Euro aktualisieren | Länder |
---|---|---|
037 | 1140 | Australien, Brasilien, Kanada, Neuseeland, Portugal, Südafrika, USA |
273 | 1141 | Österreich, Deutschland |
277 | 1142 | Dänemark, Norwegen |
278 | 1143 | Finnland, Schweden |
280 | 1144 | Italien |
284 | 1145 | Lateinamerika, Spanien |
285 | 1146 | Irland, Vereinigtes Königreich |
297 | 1147 | Frankreich |
500 | 1148 | International |
871 | 1149 | Island |
1047 | 924 | Offene Systeme (MVS C Compiler) |
Kritik und Humor
Quelloffene Software Anwalt und Softwareentwickler Eric S. Raymond schreibt in seine Jargon -Datei Dieser Ebcdic wurde von Hackern verabscheut, mit denen er meinte[17] Mitglieder einer Subkultur begeisterter Programmierer. Die Jargon -Datei 4.4.7 enthält die folgende Definition:[18]
Ebcdic: /eb´s@· dik /, /eb´see`dik /, /eb´k@· dik /, n. [Abkürzung, erweiterter binär codierter Dezimal -Austauschcode] Ein angeblicher Zeichensatz für IBM -Dinosaurier. Es existiert in mindestens sechs gegenseitig inkompatiblen Versionen, die alle Köstlichkeiten wie nicht zusammenhängende Buchstabensequenzen und das Fehlen mehrerer ASCII-Zeichenzeichen für moderne Computersprachen aufweisen anschauen). IBM adaptierte EBCDIC in den frühen 1960er Jahren aus dem Lochkartencode und verkündete ihn als Kundenkontroll-Taktik (siehe Verschwörung der Steckdose), verschmutzt den bereits festgelegten ASCII -Standard. Heute behauptet IBM, ein zu sein Open-Systems Firma, aber IBMs eigene Beschreibung der EBCDIC-Varianten und der Konvertierung zwischen ihnen ist immer noch intern die streng geheime Verbrennung und das Lesen. Hacker blanchieren am sehr Name von ebcdic und betrachten es als Manifestation des reinsten Bösen.
-Die Jargon -Datei 4.4.7
Das EBCDIC -Design war auch die Quelle vieler Witze. Ein solcher Witz, der in der Unix gefunden wurde Reichtum Datei von 4.3bsd Tahoe (1990)[19] ging:
Professor: "Also ging die amerikanische Regierung zu IBM, um eine zu finden Verschlüsselungsstandardund sie kamen ... "
Student: "Ebcdic!"
Verweise auf das EBCDIC -Charakter -Set werden in der Computerspielreihe von 1979 erstellt Zork. Im "Maschinenraum" in Zork II, Ebcdic wird verwendet, um eine unverständliche Sprache zu implizieren:
Dies ist ein großer Raum voller verschiedener schwerer Maschinen, die laut surren. Der Raum riecht nach verbrannten Widerständen. An einer Wand befinden sich drei Knöpfe, die jeweils rund, dreieckig und quadratisch sind. Natürlich befinden sich über diesen Schaltflächen Anweisungen in Ebcdic ...
Im Jahr 2021 wurde es öffentlich, dass eine belgische Bank im Jahr 2019 immer noch Ebcdic in intern Umlaut, was die Bank weggelassen hat. Der Kunde reichte eine Beschwerde ein, die die Garantie in der Garantie zitierte Datenschutz-Grundverordnung des Rechts auf rechtzeitige "Berichtigung ungenauer personenbezogener Daten". Die Bank argumentierte teilweise, dass sie nicht einhalten könne, da ihr Computersystem nur mit EBCDIC kompatibel sei, was nicht geraute Buchstaben unterstützt. Das Berufungsgericht entschied zugunsten des Kunden.[20][21]
Siehe auch
Verweise
- ^ a b Mackenzie, Charles E. (1980). Codierte Zeichensätze, Geschichte und Entwicklung (PDF). Die Systems -Programmierreihen (1 ed.). Addison-Wesley Publishing Company, Inc. ISBN 0-201-14460-3. Lccn 77-90165. Abgerufen 2022-04-06.
- ^ a b Bemer, Bob. "Ebcdic und der P -Bit (der größte Computer aller Zeiten) - Computergeschichte Vignetten". Archiviert von das Original Am 2018-05-13. Abgerufen 2013-07-02.
... aber ihre Drucker und Schläge waren nicht bereit, ASCII zu bewältigen, und IBM musste sich nur ankündigen.
- ^ "X3.4-1963". 1963. p. 4. (Nb. IBM hatte vier Mitarbeiter im letzten 21-köpfigen ASA X3.2-Unterausschuss.)
- ^ IBMNT (2008). "IBM bestätigt die Verwendung von EBCDIC in ihren Mainframes als Standardpraxis". Abgerufen 2008-06-16.[Dead Link]
- ^ PDP-10-Referenzhandbuch, Buch 2: Zusammenstellen des Quellprogramms (PDF). Digital Equipment Corporation. p. 221.
- ^ "Invariante Charakter -Set". IBM Knowledge Center. 2018-08-14.
- ^ a b c Umamaheswaran, V.S. (1999-11-08). "3.3 Schritt 2: Byte -Konvertierung". UTF-EBCDIC. Unicode -Konsortium. Unicode Technischer Bericht Nr. 16.
Die 64 Kontrollzeichen ... Das ASCII lösche Charakter (U+007F) ... wie in den Ebcdic -Konventionen, wie in der Architektur der IBM -Zeichendatenrepräsentation, CDRA, mit einer Ausnahme - die Paarung von Ebcdic Line -Feed und neue Linie definiert - Steuerzeichen werden von ihren CDRA -Standardpaarungen gegen ISO/IEC 6429 Line -Feed (U+000A) und nächste Zeile (U+0085) -Kontrollzeichen ausgetauscht
- ^ a b Steele, Shawn (1996-04-24). CP037_IBMUSCANADA ZU UNICODE -TABELLE. Microsoft/Unicode -Konsortium.
- ^ Henener, Andy (2019-02-15). "NL: Nächste Zeile (a) (nicht zu tungürtlich)". UNICODE LINE BREAKTION -ALGORITHM. Revision 43. Unicode -Konsortium. Unicode Standard Anhang Nr. 14.
- ^ ISO/TC 46 (1986-02-01). Zusätzliche Kontrollfunktionen für die bibliografische Verwendung gemäß den internationalen Standard -ISO 6630 (PDF). Itcj/Ipsj. ISO-IR-124.
- ^ ISO/IEC Internationales Register codierter Zeichensätze, die mit Escape -Sequenzen verwendet werden sollen (PDF), Itcj/Ipsj, Iso-ir
- ^ ISO/IEC JTC 1/SC 2 (2017). "12.4: Identifizierung der Kontrollfunktionssatz". Informationstechnologie - Universal Coded Character Set (UCS) (5. Aufl.). ISO. S. 19–20. ISO/IEC 10646.
Für andere C0- oder C1 -Sätze wird das endgültige Oktett F aus dem internationalen Register der codierten Zeichensätze erhalten. Wenn eine solche Escape -Sequenz innerhalb einer Code -Einheit -Sequenz erscheint, die diesem internationalen Standard entspricht Klausel 11.
- ^ Unicode -Konsortium (2019). 23.1: Kontrollcodes (PDF). Der Unicode -Standard (12.0.0 ed.). S. 868–870. ISBN 978-1-936213-22-1.
- ^ a b c d "Anhang G-1. Ebcdic Control Character Definitionen". Architektur der Charakterdatenrepräsentation. IBM Corporation. Archiviert von das Original Am 2018-09-11.
- ^ a b c d e f g h i j Gost (1993). "Ин jähr (auf Russisch). GOST 19768-93.
{{}}
: Journal zitieren erfordert|journal=
(Hilfe) - ^ IBM. "Charakterdatenrepräsentationsarchitektur (CDRA)". IBM. p. 327.
Das Mnemonik für den Start des Signifikanzkontrollcharakters in EBCDIC wurde am Ende (SOS.) Einen Punkt (.) Einbezogen. Dies wurde getan, um es von der in ISO-8 verwendeten SOS-Mnemonik zu unterscheiden, um zum Start des String Control-Zeichens zu beginnen. Der Punkt verändert die Eigenschaft der Kontrolle in keiner Weise.
- ^ Raymond, Eric S. (1997). "Das Wörterbuch des neuen Hackers". p. 310.
- ^ "Ebcdic". Jargon -Datei. Archiviert vom Original am 2018-05-13. Abgerufen 2018-05-13.
- ^ 4.3bsd-Reno/Share/Games/Fortune/Vermögen
- ^ "Berufungsgericht von Brüssel - 2019/AR/1006 - GDPRHUB".
- ^ "Ebcdic ist mit DSGVO - Terence Edens Blog nicht kompatibel".. 2021-10-25.
Externe Links
- Architektur der Charakterdatenrepräsentation (CDRA) von IBM Bei der Wayback -Maschine (Archiviert 2018-05-13). Enthält die offiziellen Informationen von IBM zu Codeseiten und Zeichensätzen.
- Hostcode -Seitenreferenz Aus IBM zeigt Code-Diagramme für mehrere Single-Byte-Ebcdic-Seiten an.
- "Code -Seiten". IBM. aus "IBM I Globalisierung". IBM.
- ICU Converter Explorer Enthält weitere Informationen zu EBCDIC, die von der CDRA von IBM abgeleitet wurden, einschließlich DBCS EBCDIC (Double Byte -Zeichenset EBCDIC)
- ICU -Charset -Mapping -Tabellen Enthält computer -lesbare Unicode -Mapping -Tabellen für EBCDIC und viele andere Zeichensätze
- EBCDIC -Charakterliste, einschließlich Dezimal- und Hex -Werte, symbolischer Name und Zeichen/Funktion Bei der Wayback -Maschine (Archiviert 2016-03-03)
- EBCDIC-Code-Seiten mit Latin-1-Charset (JavaScript) Bei der Wayback -Maschine (Archiviert 2018-04-18)
- Alle EBCDIC -Codeseiten und 3270 Grafik -Escape -Codes Bei der Wayback -Maschine (Archiviert 27. August 2016)