EBCDIC

Ebcdic Codierungsfamilie
Einstufung 8 Bit Grundlatein Codierungen (nicht ascii)
Vorausgegangen von BCD

Erweiterter binär codierter Dezimalstauschcode[1] (Ebcdic;[1] /ˈɛbsɪdɪk/) ist acht-bisschen Zeichenkodierung hauptsächlich auf IBM Mainframe und IBM Midrange -Computer Betriebssysteme. Es stammte aus dem mit verwendeten Code herab mit geschlagene Karten und das entsprechende Sechs-Bit-Binärcodierte Dezimalzahl Code verwendet mit den meisten IBMs Computerperipheriegeräte der späten 1950er und frühen 1960er Jahre.[2] Es wird von verschiedenen Nicht-IBM-Plattformen unterstützt, wie z. Fujitsu-Siemens' BS2000/OSD, OS-IV, MSP und MSP-EX, die SDS Sigma -Serie, Unisys Vs/9, Unisys MCP und ICL Vme.

Geschichte

Lochkarte mit der Hollerith -Codierung des Ebcdic -Charakters von 1964. Der Kontrast oben wird verbessert, um die gedruckten Zeichen anzuzeigen.

Ebcdic wurde 1963 und 1964 von entwickelt von IBM und wurde mit der Veröffentlichung der angekündigt IBM System/360 Mainframe -Linie Computers. Es ist eine acht-Bit-Charakter-Codierung, die getrennt vom sieben-Bit entwickelt wurde ASCII Codierungsschema. Es wurde erstellt, um die bestehenden zu erweitern Binärcodierte Dezimalzahl (BCD) Austauschcode oder BCDIC, was selbst als effizientes Mittel zur Kodierung der beiden entwickelt wurde Zone und Nummer Schläge auf geschlagene Karten in sechs Teile. Die unterschiedliche Codierung von 's' und 's' (mit Position 2 anstelle von 1) wurde von geschlagenen Karten gepflegt, wo es wünschenswert war, nicht zu nahe an einander Lochschläge zu haben, um die Integrität der physischen Karte zu gewährleisten.

Während IBM ein Hauptvertreter des ASCII -Standardisierungsausschusses war,[3] Das Unternehmen hatte keine Zeit, ASCII -Peripheriegeräte (wie Kartenpunschmaschinen) mit seinem System/360 Computern zu versenden, sodass sich das Unternehmen für EBCDIC entschieden hat.[2] Das System/360 wurde sehr erfolgreich, zusammen mit Klonen wie RCA -Spektren 70, ICL System 4und Fujitsu Facom, so auch Ebcdic.

Alles IBM Mainframe und mittlerer Bereich Betriebssysteme Verwenden Sie Ebcdic als ihre inhärente Kodierung[4] (Zum Beispiel mit Toleranz für ASCII Ispf in Z/OS kann sowohl EBCDIC- als auch ASCII -codierte Dateien durchsuchen und bearbeiten). Software kann zu und von Codings und modernen Mainframes übersetzen (wie z. Ibm z) Einbeziehung von Prozessoranweisungen auf Hardwareebene, um die Übersetzung zwischen Zeichensätzen zu beschleunigen.

Es gibt ein Ebcdic-orientiert Unicode -Transformationsformat genannt UTF-EBCDIC vorgeschlagen von der Unicode -Konsortium, entwickelt, um eine einfache Aktualisierung der EBCDIC -Software zu ermöglichen Unicode, aber nicht in gezwungenem Austauschumgebungen verwendet werden. Selbst auf Systemen mit umfangreicher EBCDIC -Unterstützung war es nicht beliebt. Zum Beispiel unterstützt Z/OS Unicode (bevorzugt UTF-16 insbesondere), aber Z/OS hat nur eine begrenzte Unterstützung für UTF-EBCDIC.

Nicht alle IBM -Produkte verwenden EBCDIC; IBM AIX, Linux auf ibm z, und Linux auf Strom Alle verwenden ASCII.

Kompatibilität mit ASCII

Es gab zahlreiche Schwierigkeiten beim Schreiben von Software, die sowohl in ASCII als auch in Ebcdic funktionieren würden.

  • Die Lücken zwischen Buchstaben machten einfache Code, die in ASCII funktionierten, bei EBCDIC. Zum Beispiel for (c = 'A'; c <= 'Z'; ++c) putchar(c); Würde das Alphabet von A bis Z drucken, wenn ASCII verwendet wird, aber 41 Zeichen (einschließlich einer Reihe von nicht zugewiesenen) in Ebcdic. Wenn Sie dies beheben, musste der Code mit Funktionsaufrufen kompliziert werden, was von den Programmierern stark widerstanden wurde.
  • Sortieren von Ebcdic stellen Kleinbuchstaben vor Großbuchstaben und Buchstaben vor Zahlen, genau das Gegenteil von ASCII.
  • Programmiersprachen und Dateiformate und Netzwerkprotokolle, die für ASCII entwickelt wurden { und }) Das existierte in Ebcdic nicht und erschwerte die Übersetzung in Ebcdic -Systeme. Umgekehrt hatte Ebcdic ein paar Charaktere wie ¢ (US Cent) Das wurde auf IBM -Systemen verwendet und konnte nicht in ASCII übersetzt werden.
  • Die am häufigsten verwendete Newline -Konvention mit EBCDIC ist die Verwendung a Nel (Nächste Zeile) Code zwischen den Zeilen. Konverter zu anderen Codierungen ersetzen häufig NEL durch Lf oder Cr/lfAuch wenn die Zielcodierung ein Nel enthält. Dies führt dazu, dass LF und NEL zum gleichen Charakter übersetzt werden und nicht unterschieden werden können.
  • Wenn sieben-Bit-ASCII verwendet wurde, gab es in 8-Bit-Bytes ein "unbenutztes" Hochstück, und viele Software-Teile speichern dort andere Informationen. Die Software würde auch die sieben Bits einpacken und den achten Satz verwerfen, z. B. das Verpacken von fünf sieben-Bit-ASCII-Zeichen in a 36-Bit Wort.[5] Auf der PDP-11 Bytes mit dem hohen Bit -Set wurden als negative Zahlen behandelt, Verhalten, das kopiert wurde C, was unerwartete Probleme verursacht, wenn das hohe Bit festgelegt wurde. Dies alles machte es schwierig, von ASCII auf das 8-Bit-Ebcdic zu wechseln (und es auch schwierig machte, auf 8-Bit umzusteigen erweiterte ASCII Codierungen).

Code -Seitenlayout

Es gibt Hunderte von EBCDIC -Code -Seiten, die auf der ursprünglichen Ebcdic -Codierung basieren. Es gibt eine Vielzahl von Ebcdic Codeseiten Für die Verwendung in verschiedenen Teilen der Welt bestimmt, einschließlich Code-Seiten für Nicht-Latin-Skripte wie Chinesen, Japanisch (z. B. Ebcdic 930, JEF und Keis), Koreanisch und Griechisch (Ebcdic 875). Es gibt auch eine große Anzahl von Variationen mit den Buchstaben, die ohne erkennbare Grund umgetauscht wurden.

Die folgende Tabelle zeigt die "invariante Teilmenge"[6] von ebcdic, die Charaktere sind, die sollte Haben Sie die gleichen Zuordnungen auf allen EBCDIC -Codeseiten, auf denen das lateinische Alphabet verwendet wird. (Dies schließt den größten Teil der ein ISO/IEC 646 Invariante Repertoire außer dem Ausrufezeichen.) Es zeigt auch (in grau) fehlende ASCII- und Ebcdic -Interpunktion, wo sie sich befinden Code Seite 37 (Eine der Code -Seitenvarianten von EBCDIC). Die leeren Zellen sind mit regionspezifischen Zeichen in den Varianten gefüllt, aber die Charaktere in Grau werden oft auch herumgetauscht oder ersetzt.

Ebcdic
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x Nul Soh Stx ETX Sel   Ht  RNL Del   Ge  Sps Rpt   Vt    Ff    Cr    ALSO    Si  
1x Dle DC1 DC2 DC3 Res/
Enp
  Nl     BS  Poc KANN   Em  UBS Cu1   Ifs   IGs   IRS Ius/
ITB
2x   Ds  SOS   Fs  Wus BYP/
INP
  Lf  ETB ESC   Sa  Sfe Sm/
SW
CSP MFA Enq Ack Bel
3x Syn    Ir    Pp  Trn NBS Eot SBS    ES  RFF Cu3 DC4 Nak Sub
4x  Sp  ¢ . < ( + |
5x & ! $ * ) ; ¬
6x - / ¦ , % _ > ?
7x ` : # @ ' = "
8x a b c d e f g h i ±
9x j k l m n o p q r
Axt ~ s t u v w x y z
BX ^ [ ]
CX { A B C D E F G H I
Dx } J K L M N O P Q R
Ex \ S T U V W X Y Z
Fx 0 1 2 3 4 5 6 7 8 9   Eo 

Definitionen von Nicht-ASCII-eBCDIC-Kontrollen

Im Folgenden finden Sie die Definitionen von EBCDIC -Steuerzeichen, die entweder nicht auf das abbilden ASCII -Steuerzeichen, oder zusätzliche Verwendungszwecke haben. Wenn diese auf Unicode zugeordnet sind, werden diese meist in eine Weise auf C1 -Kontrollzeichen in einer Weise zugeordnet, die durch die IBM -Architektur der Charakterdatenrepräsentation (CDRA) angegeben ist.[7][8]

Obwohl die Standardzuordnung der neuen Zeile (NL) dem ISO/IEC 6429 Next Line (NEL) -Scharakter entspricht (dessen Verhalten auch in Unicode Anhang 14 angegeben, aber nicht erforderlich ist),[9] Die meisten dieser C1-Made-Steuerelemente entsprechen weder denen in der ISO/IEC 6429 C1 SETnoch diejenigen in anderen registrierten C1 -Kontrollsätzen wie z. ISO 6630.[10] Obwohl dies effektiv die Nicht-ASCII-EBCDIC-Steuerung zu einem einzigartigen C1-Kontrollsatz macht, gehören sie nicht zu den C1-Kontrollsätzen, die in der registriert sind ISO-IR Registrierung,[11] was bedeutet, dass sie keine zugewiesene Steuerungssequenz für die Steuerungssatz haben (wie angegeben von ISO/IEC 2022, und optional erlaubt in ISO/IEC 10646 (Unicode)).[12]

Neben U+0085 (nächste Zeile) verschreibt der Unicode -Standard keine Interpretation von C1 -Kontrollzeichen, wodurch ihre Interpretation auf höhere Ebenenprotokolle zurücklässt (dies ist nicht erforderlich, ihre ISO/IEC 6429 -Interpretationen in Abwesenheit von Nutzung für nicht erforderlich andere Zwecke),[13] Diese Zuordnung ist also in Unicode zulässig, aber nicht von ihnen angegeben.

Mnemonisch Ebcdic CDRA -Paarung[7][8] Name Beschreibung[14]
Sel 04 009c Auswählen Gerätesteuerzeichen Nehmen Sie einen Einzel-Byte-Parameter.
Pf Abstellen An diesem Ort aufgeführt von GOST 19768-93.[15]
RNL 06 0086 Erforderliche neue Linie Zurücksetzen des Zeilenaufbruchs Tabelle Registerkarte Modus
LC Kleinbuchstaben An diesem Ort aufgeführt von GOST 19768-93.[15]
Ge 08 0097 Grafische Flucht Nicht abgestufte Verschiebung, die die Interpretation des folgenden Zeichens ändert (siehe z. Code Seite 310). Vergleichen Sie ISO/IEC 6429 SS2 (008e).
Sps 09 008d Superscript Beginnen Sie Superscript oder rückgängig. Vergleichen Sie ISO/IEC 6429 Plu (008c).
Rpt 0a 008e Wiederholen Wechseln Sie zu einem Betriebsmodus, der einen Druckpuffer wiederholt
Smm Beginn der manuellen Nachricht An diesem Ort aufgeführt von GOST 19768-93.[15]
Res/enp 14 009d Wiederherstellen, Präsentation aktivieren Wiederaufnahmeleistung (nach BYP/INP))
Nl 15 0085 (000A) Neue Zeile Zeilenumbruch. Standard Mapping (0085) entspricht ISO/IEC 6429's Nel. Zuordnungen, die manchmal mit Linien -Feed (EBCDIC 0x25) gemäß der Unix -Linien -Breaking -Konvention ausgetauscht werden.[7]
Poc 17 0087 Programmbetreiber Kommunikation Gefolgt von zwei Ein-Byte-Operatoren, die die spezifische Funktion identifizieren, z. B. einen Licht- oder Funktionstaste. Kontrast zu ISO/IEC 6429's CSI (009b), OSC (009d) und APC (009f).
Il Leerlauf An diesem Ort aufgeführt von GOST 19768-93.[15]
UBS 1a 0092 Einheit Rückraum Ein fraktionaler Rückraum.
CC Cursorkontrolle An diesem Ort aufgeführt von GOST 19768-93.[15]
Cu1 1b 008f Kunden verwenden einen Nicht von IBM verwendet; für den Kundengebrauch.
Ius/itb 1f 001f Austauscheinheitseparator, Zwischenübertragungsblock Entweder als Informationsabscheider verwendet, um einen Block namens "Einheit" zu beenden (als in ASCII; siehe auch Ir) oder als Übertragungskontrollcode verwendet, um das Ende eines Zwischenblocks abzugrenzen.
Ds 20 0080 Ziffernauswahl Verwendet von S/360 CPU Edit (ED) Anweisung
SOS 21 0081 Signifikanzstart Verwendet von S/360 CPU Edit (ED) Anweisung. (Hinweis: Unterscheidet sich von ISO/IEC 6429 SOS; Wenn es notwendig ist, sie zu unterscheiden, ist IBM -Abkürzes Start von Bedeutung als SOS. (mit einem Punkt) und Beginn der String als SOSsonst werden sie gleich abgekürzt.)[16]
Fs,[14] Fds[15] 22 0082 Feldabscheider Verwendet von S/360 CPU Edit (ED) Anweisung. (Notiz: (Interchange) Dateitrennzeichen, wie abgekürzte FS in ASCII, bei 0x1c und abgekürzt ifs.)[14]
Wus 23 0083 Wort unterstreichen Unterstreicht das unmittelbare vorhergehende Wort. Kontrast zu ISO/IEC 6429's SGR.
BYP/INP 24 0084 Bypass, Hemmung der Präsentation Deaktiviert die Ausgabe, d. H. Ignoriert alle grafischen Zeichen und Kontrollzeichen neben den Übertragungssteuercodes und Res/ENP bis zum nächsten Res/enp.
Sa 28 0088 Setzen Sie das Attribut Markiert den Beginn einer Gerätespezifischen Steuersequenz mit fester Länge. Veraltet zugunsten von CSP.
Sfe 29 0089 Startfeld erweitert Markiert den Beginn einer Gerätespezifischen Steuersequenz mit variabler Länge. Veraltet zugunsten von CSP.
SM/SW 2a 008a Modus einstellen, Schalter Gerätespezifische Steuerung, die eine Betriebsart wie einen Pufferschalter festlegt.
Cu2 2b 008B Kunden verwenden zwei Dies erscheint in einigen Spezifikationen, wie z. GOST 19768-93;[15] Neuere IBM-Spezifikationen für EBCDIC-Steuercodes listen nur Cu1 und Cu3 als Kundennutzung auf und verwenden diese Position für CSP.[14]
CSP Kontrollsequenz Präfix Markiert den Beginn einer Gerätespezifischen Steuersequenz mit variabler Länge. Gefolgt von einem Klassen -Byte, das eine Kategorie von Kontrollfunktion angibt, ein Zählbyte, das die Sequenzlänge (einschließlich Zähl- und Typ Bytes, nicht das Klassenbyte oder das anfängliche CSP), ein Typ -Byte, der eine Steuerfunktion innerhalb dieser Kategorie identifiziert, und Null oder Weitere Parameter -Bytes. Kontrast zu ISO/IEC 6429's DCS (0090) und CSI (009b).
MFA 2c 008c Das Feld Attribut ändern Markiert den Beginn einer Gerätespezifischen Steuersequenz mit variabler Länge. Veraltet zugunsten von CSP.
30 0090 (reserviert) Reserviert für die zukünftige Verwendung von IBM
31 0091 (reserviert) Reserviert für die zukünftige Verwendung von IBM
Ir 33 0093 Indexrückgabe Beide Bewegung zum Start der nächsten Zeile (siehe auch Nl) oder eine Informationseinheit beenden (siehe auch Ius/itb).
Pp 34 0094 Präsentationsposition Gefolgt von zwei Ein-Byte-Parametern (zuerst Funktion, zweitens Anzahl der Spalten oder Zeile), um die aktuelle Position festzulegen. Kontrast zu ISO/IEC 6429's Cup und HVP.
Pn Stanzen An diesem Ort aufgeführt von GOST 19768-93.[15]
Trn 35 0095 Transparent Gefolgt von einem Byte -Parameter, der die Anzahl der Bytes transparenter Daten angibt, die folgen.
RST Leser Stopp An diesem Ort aufgeführt von GOST 19768-93.[15]
NBS 36 0096 Numerischer Rückraum Bewegen Sie die Breite einer Ziffer rückwärts.
UC Oberer Fall An diesem Ort aufgeführt von GOST 19768-93.[15]
SBS 38 0098 Index Beginnen Sie ein Index oder den SuperScript. Vergleichen Sie ISO/IEC 6429 PLD (008b).
ES 39 0099 Tabelle Registerkarte Nutze den Strom und alle folgenden Zeilen, bis RNL oder RFF wird angetroffen.
RFF 3a 009a Erforderlicher Formfutter RETT-SETTING Tabelle Registerkarte Modus.
Cu3 3b 009b Kunden verwenden drei Nicht von IBM verwendet; für den Kundengebrauch.
3e 009e (reserviert) Reserviert für die zukünftige Verwendung von IBM
Eo Ff 009f Acht Alle als Füllstoff verwendeten Zeichen

Codeseiten mit Latin-1-Zeichensätzen

Die folgenden Codeseiten haben die volle Latin-1-Zeichenset (ISO/IEC 8859-1). Die erste Spalte gibt die ursprüngliche Code -Seitennummer an. Die zweite Spalte gibt die Anzahl der mit dem aktualisierten Code -Seite an Eurozeichen (€) Ersetzen des Universales Währungszeichen (¤) (oder im Fall von EBCDIC 924, wobei der zu übereinstimmende Set geändert wurde ISO 8859-15))

Ccsid Euro
aktualisieren
Länder
037 1140 Australien, Brasilien, Kanada, Neuseeland, Portugal, Südafrika, USA
273 1141 Österreich, Deutschland
277 1142 Dänemark, Norwegen
278 1143 Finnland, Schweden
280 1144 Italien
284 1145 Lateinamerika, Spanien
285 1146 Irland, Vereinigtes Königreich
297 1147 Frankreich
500 1148 International
871 1149 Island
1047 924 Offene Systeme (MVS C Compiler)

Kritik und Humor

Quelloffene Software Anwalt und Softwareentwickler Eric S. Raymond schreibt in seine Jargon -Datei Dieser Ebcdic wurde von Hackern verabscheut, mit denen er meinte[17] Mitglieder einer Subkultur begeisterter Programmierer. Die Jargon -Datei 4.4.7 enthält die folgende Definition:[18]

Ebcdic: /eb´s@· dik /, /eb´see`dik /, /eb´k@· dik /, n. [Abkürzung, erweiterter binär codierter Dezimal -Austauschcode] Ein angeblicher Zeichensatz für IBM -Dinosaurier. Es existiert in mindestens sechs gegenseitig inkompatiblen Versionen, die alle Köstlichkeiten wie nicht zusammenhängende Buchstabensequenzen und das Fehlen mehrerer ASCII-Zeichenzeichen für moderne Computersprachen aufweisen anschauen). IBM adaptierte EBCDIC in den frühen 1960er Jahren aus dem Lochkartencode und verkündete ihn als Kundenkontroll-Taktik (siehe Verschwörung der Steckdose), verschmutzt den bereits festgelegten ASCII -Standard. Heute behauptet IBM, ein zu sein Open-Systems Firma, aber IBMs eigene Beschreibung der EBCDIC-Varianten und der Konvertierung zwischen ihnen ist immer noch intern die streng geheime Verbrennung und das Lesen. Hacker blanchieren am sehr Name von ebcdic und betrachten es als Manifestation des reinsten Bösen.

-Die Jargon -Datei 4.4.7

Das EBCDIC -Design war auch die Quelle vieler Witze. Ein solcher Witz, der in der Unix gefunden wurde Reichtum Datei von 4.3bsd Tahoe (1990)[19] ging:

Professor: "Also ging die amerikanische Regierung zu IBM, um eine zu finden Verschlüsselungsstandardund sie kamen ... "
Student: "Ebcdic!"

Verweise auf das EBCDIC -Charakter -Set werden in der Computerspielreihe von 1979 erstellt Zork. Im "Maschinenraum" in Zork II, Ebcdic wird verwendet, um eine unverständliche Sprache zu implizieren:

Dies ist ein großer Raum voller verschiedener schwerer Maschinen, die laut surren. Der Raum riecht nach verbrannten Widerständen. An einer Wand befinden sich drei Knöpfe, die jeweils rund, dreieckig und quadratisch sind. Natürlich befinden sich über diesen Schaltflächen Anweisungen in Ebcdic ...

Im Jahr 2021 wurde es öffentlich, dass eine belgische Bank im Jahr 2019 immer noch Ebcdic in intern Umlaut, was die Bank weggelassen hat. Der Kunde reichte eine Beschwerde ein, die die Garantie in der Garantie zitierte Datenschutz-Grundverordnung des Rechts auf rechtzeitige "Berichtigung ungenauer personenbezogener Daten". Die Bank argumentierte teilweise, dass sie nicht einhalten könne, da ihr Computersystem nur mit EBCDIC kompatibel sei, was nicht geraute Buchstaben unterstützt. Das Berufungsgericht entschied zugunsten des Kunden.[20][21]

Siehe auch

Verweise

  1. ^ a b Mackenzie, Charles E. (1980). Codierte Zeichensätze, Geschichte und Entwicklung (PDF). Die Systems -Programmierreihen (1 ed.). Addison-Wesley Publishing Company, Inc. ISBN 0-201-14460-3. Lccn 77-90165. Abgerufen 2022-04-06.
  2. ^ a b Bemer, Bob. "Ebcdic und der P -Bit (der größte Computer aller Zeiten) - Computergeschichte Vignetten". Archiviert von das Original Am 2018-05-13. Abgerufen 2013-07-02. ... aber ihre Drucker und Schläge waren nicht bereit, ASCII zu bewältigen, und IBM musste sich nur ankündigen.
  3. ^ "X3.4-1963". 1963. p. 4. (Nb. IBM hatte vier Mitarbeiter im letzten 21-köpfigen ASA X3.2-Unterausschuss.)
  4. ^ IBMNT (2008). "IBM bestätigt die Verwendung von EBCDIC in ihren Mainframes als Standardpraxis". Abgerufen 2008-06-16.[Dead Link]
  5. ^ PDP-10-Referenzhandbuch, Buch 2: Zusammenstellen des Quellprogramms (PDF). Digital Equipment Corporation. p. 221.
  6. ^ "Invariante Charakter -Set". IBM Knowledge Center. 2018-08-14.
  7. ^ a b c Umamaheswaran, V.S. (1999-11-08). "3.3 Schritt 2: Byte -Konvertierung". UTF-EBCDIC. Unicode -Konsortium. Unicode Technischer Bericht Nr. 16. Die 64 Kontrollzeichen ... Das ASCII lösche Charakter (U+007F) ... wie in den Ebcdic -Konventionen, wie in der Architektur der IBM -Zeichendatenrepräsentation, CDRA, mit einer Ausnahme - die Paarung von Ebcdic Line -Feed und neue Linie definiert - Steuerzeichen werden von ihren CDRA -Standardpaarungen gegen ISO/IEC 6429 Line -Feed (U+000A) und nächste Zeile (U+0085) -Kontrollzeichen ausgetauscht
  8. ^ a b Steele, Shawn (1996-04-24). CP037_IBMUSCANADA ZU UNICODE -TABELLE. Microsoft/Unicode -Konsortium.
  9. ^ Henener, Andy (2019-02-15). "NL: Nächste Zeile (a) (nicht zu tungürtlich)". UNICODE LINE BREAKTION -ALGORITHM. Revision 43. Unicode -Konsortium. Unicode Standard Anhang Nr. 14.
  10. ^ ISO/TC 46 (1986-02-01). Zusätzliche Kontrollfunktionen für die bibliografische Verwendung gemäß den internationalen Standard -ISO 6630 (PDF). Itcj/Ipsj. ISO-IR-124.
  11. ^ ISO/IEC Internationales Register codierter Zeichensätze, die mit Escape -Sequenzen verwendet werden sollen (PDF), Itcj/Ipsj, Iso-ir
  12. ^ ISO/IEC JTC 1/SC 2 (2017). "12.4: Identifizierung der Kontrollfunktionssatz". Informationstechnologie - Universal Coded Character Set (UCS) (5. Aufl.). ISO. S. 19–20. ISO/IEC 10646. Für andere C0- oder C1 -Sätze wird das endgültige Oktett F aus dem internationalen Register der codierten Zeichensätze erhalten. Wenn eine solche Escape -Sequenz innerhalb einer Code -Einheit -Sequenz erscheint, die diesem internationalen Standard entspricht Klausel 11.
  13. ^ Unicode -Konsortium (2019). 23.1: Kontrollcodes (PDF). Der Unicode -Standard (12.0.0 ed.). S. 868–870. ISBN 978-1-936213-22-1.
  14. ^ a b c d "Anhang G-1. Ebcdic Control Character Definitionen". Architektur der Charakterdatenrepräsentation. IBM Corporation. Archiviert von das Original Am 2018-09-11.
  15. ^ a b c d e f g h i j Gost (1993). "Ин jähr (auf Russisch). GOST 19768-93. {{}}: Journal zitieren erfordert |journal= (Hilfe)
  16. ^ IBM. "Charakterdatenrepräsentationsarchitektur (CDRA)". IBM. p. 327. Das Mnemonik für den Start des Signifikanzkontrollcharakters in EBCDIC wurde am Ende (SOS.) Einen Punkt (.) Einbezogen. Dies wurde getan, um es von der in ISO-8 verwendeten SOS-Mnemonik zu unterscheiden, um zum Start des String Control-Zeichens zu beginnen. Der Punkt verändert die Eigenschaft der Kontrolle in keiner Weise.
  17. ^ Raymond, Eric S. (1997). "Das Wörterbuch des neuen Hackers". p. 310.
  18. ^ "Ebcdic". Jargon -Datei. Archiviert vom Original am 2018-05-13. Abgerufen 2018-05-13.
  19. ^ 4.3bsd-Reno/Share/Games/Fortune/Vermögen
  20. ^ "Berufungsgericht von Brüssel - 2019/AR/1006 - GDPRHUB".
  21. ^ "Ebcdic ist mit DSGVO - Terence Edens Blog nicht kompatibel".. 2021-10-25.

Externe Links