Nationaler Ersatzcharaktersatz
Alias (e) | Nationaler Ersatzcharaktersatz |
---|---|
Vorausgegangen von | US-Ascii |
gefolgt von | ISO 8859, ISO 10646 |
Andere verwandte Kodierungen (en) | ISO 646 |
Das Nationaler Ersatzcharaktersatz (NRCS) war ein Merkmal, das von späteren Modellen von unterstützt wurde Digital (Dez.) Computerterminal Systeme, beginnend mit dem VT200 -Serie 1983 erlaubte NRCs einzelne Charaktere von einem Zeichensatz durch einen anderen Satz ersetzt werden, sodass die Konstruktion verschiedener Zeichensätze im laufenden Fliegen entsteht. Es wurde verwendet, um das Zeichen an verschiedenen lokalen Sprachen anzupassen, ohne das Terminal ändern zu müssen Rom Für verschiedene Länder oder abwechselnd enthalten viele verschiedene Sets in ein größeres ROM. Viele Terminals der dritten Partei und Terminalemulatoren Die Unterstützung von VT200 -Codes unterstützte auch NRCs.
Beschreibung
ASCII ist ein 7-Bit-Standard, der insgesamt 128 Zeichen im Zeichensatz ermöglicht. Einige davon sind als reserviert als Steuerzeichen, abreist 96 druckbare Zeichen. Dieser Satz von 96 druckbaren Zeichen umfasst obere und untere Fallbuchstaben, Zahlen sowie grundlegende Mathematik und Zeichensetzung.
ASCII hat nicht genügend Raum, um andere gemeinsame Zeichen wie multinationale Währungssymbole oder die verschiedenen in europäischen Sprachen üblichen Akzentschreiben einzubeziehen. Dies führte zu einer Reihe von länderspezifischen Sorten von 7-Bit-ASCII mit bestimmten Zeichen. Zum Beispiel ersetzte der britische Standard einfach die Hash -Marke von ASCII, #
, mit dem Pfundsymbol, £
. Dies führte normalerweise zu verschiedenen Modellen eines bestimmten Computerterminals oder zu verschiedenen Modellen Drucker, unterscheidet sich nur in den in ROM gespeicherten Glyphen. Einige davon wurden als Teil von standardisiert ISO/IEC 646.[1][2]
Auf an 8-Bit sauber Serienverbindung, ASCII kann erweitert werden, um insgesamt 256 Zeichen zu unterstützen. In diesem Fall werden in der originalen druckbaren Zeichen von 32 bis 127 neue Zeichen im Bereich von 128 bis 255 hinzugefügt. Dies bietet genug Platz für einen einzelnen Charakter, der alle in Nordamerika und Westeuropa verwendeten Charaktere umfasst. Diese Fähigkeit führte zur Einführung der ISO/IEC 8859-1 Standardcharakter -Set mit 191 Zeichen von dem, was das "lateinische Alphabet Nr. 1" nennt, aber normalerweise als "ISO Latin" bezeichnet wird. Windows-1252 ist ein leicht erweitertes Superset von ISO Latein.[2]
NRCS wurde eingeführt, um das Problem zu lösen, unterschiedliche Terminals für jedes Land zu verlangen, indem Charaktere in der grundlegenden 7-Bit Multinationaler Charaktersatz (MCS). Dies bedeutete, dass das ROM nur zwei Charakter -Sets, Standard -ASCII und MCs, speichern musste und alle erforderlichen lokalen ASCII -Varianten im laufenden Flug aufbauen konnte. Anstatt beispielsweise eine separate "UK ASCII" -Version mit einem modifizierten Glyphen in ROM zu haben, enthielt das Terminal ein NRCS mit Anweisungen zum Ersetzen des Hash -Mark -Glyphees durch das Pfund. Wenn in Großbritannien verwendet, tippen Schicht 3
Produzierte das Pfund, die gleichen Schlüssel, die auf einen US -amerikanischen Terminal erzeugt wurden.[2]
Die NRCs könnten über einen Setup -Befehl oder häufiger eingestellt werden, indem die Tastatur durch ein Modell ersetzt wird gebootet. Auf diese Weise stecken die NRCs einfach eine britische Tastatur ein, die ein Pfundzeichen auf der 3 -Taste auf der 3 -Taste auf demselben Ersatz einstellte.[2]
NRC -Sets
Die Dec -Terminals aus dem VT220 auf hatten 12 verschiedene NRCS -Sätze zusätzlich zu Standard -ASCII:[2]
Zeichensatz | Codepage | Standard | 0x23 | 0x40 | 0x5b | 0x5c | 0x5d | 0x5e | 0x5f | 0x60 | 0x7b | 0x7c | 0x7d | 0x7e |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Standard ASCII[3] | 367 | ASCII, ISO 646-us Ir 6 | # | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ~ |
Vereinigtes Königreich[4][3] | 1101[5] | Dec, iso[6] | £ | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ~ |
Dänemark/Norwegen[4][3] (Wechseln) | 1107[7] | Dec, iso[6] | # | @ | Æ | Ø | Å | ^ | _ | ` | æ | ø | å | ~ |
Dänemark/Norwegen | 1105[8] | Dez | # | Ä | Æ | Ø | Å | Ü | _ | ä | æ | ø | å | ü |
Niederländisch[4] | 1102[9] | Dez | £ | ¾ | ij [4][9] | ½ | | [9] | ^ | _ | ` | ¨ | ƒ | ¼ | ´ [9] |
finnisch[4][3] | 1103[10] | Dez[6] | # | @ | Ä | Ö | Å | Ü | _ | é | ä | ö | å | ü |
Französisch[4][3] | 1104[11] | Dec, iso[6] | £ | à | ° [11] | ç | § | ^ | _ | ` | é | ù | è | ¨ [11] |
Franko Kanadier[4][3] | 1020[12] | Dez[6] | # | à | â | ç | ê | î | _ | ô | é | ù | è | û |
Deutsch[4][3] | 1011,[13] 20106[14][15][16] | ISO 646-de Ir 21,[17][18] LÄRM 66003 | # | § | Ä | Ö | Ü | ^ | _ | ` | ä | ö | ü | ß |
Italienisch[4][3] | 1012[19] | ISO 646-it Ir 15,[17][18] UNI 0204-70 | £ | § | ° [19] | ç | é | ^ | _ | ù | à | ò | è | ì |
Portugiesisch[2][3] | [NB 1] | Dez[6] | # | @ [2][3][NB 1] | Ã | Ç | Õ | ^ | _ | ` | ã | ç | õ | ~ |
Spanisch[4][3] | 1023[20] | Dec, iso[6] | £ | § | ¡ | Ñ | ¿ | ^ | _ | ` | ˚ [20] (°)) | ñ | ç | ~ |
Schwedisch[4][3] | 1106[21] | Dec, iso[6] | # | É | Ä | Ö | Å | Ü | _ | é | ä | ö | å | ü |
schweizerisch[4][3] | 1021[22] | Dez[6] | ù | à | é | ç | ê | î | è | ô | ä | ö | ü | û |
Siehe auch
- 7-Bit-Dez. Griechisch[6]
- 7-Bit Dec Hebräisch[6] (SI 960, Hebräisch-7)
- 7-Bit Dec Turkish[6] (TR7DEC)
- 7-Bit-Dec-kyrillisch (KOI-7)
Anmerkungen
- ^ a b Dieser DEC -Charakter -Satz ähnelt der ISO 646-PT2/ Ir 84 AKA IBM Code Seite 1015, mit Ausnahme des Codepunkts 64 (0x40), der "@" im DEC -Zeichensatz zugeordnet ist, aber im ISO -Zeichen "´".
Verweise
- ^ Hartman Kennelly, Cynthia (1991). Unch, Jacqueline (Hrsg.). Digitaler Leitfaden zur Entwicklung internationaler Software (1 ed.). Digital Equipment Corporation. ISBN 1-55558-063-7. EY-F577E-DP.
- ^ a b c d e f g Dezember (Juni 1987). "Anhang E". VT320 -Programmierzusammenfassung. Digitale Presse. (Der bereitgestellte Link geht an eine digitalisierte Version, die einige subtile OCR -Fehler enthält, daher keine zuverlässige Referenz für die Zeichensatzzuordnungen.)
- ^ a b c d e f g h i j k l m Dezember (Februar 1992) [November 1989]. "Kapitel 2: Charaktercodierung - Nationale Ersatzcharaktersätze (NRC -Sets) (nur weltweite Modelle)". VT420 Programmer Referenzhandbuch (PDF) (2 ed.). Digital Equipment Corporation. p. 28. EK -VT420 - RM.002. Archiviert (PDF) vom Original am 2017-01-29. Abgerufen 2017-01-29.
- ^ a b c d e f g h i j k l "VT220 Programmer Referenzhandbuch" (2 ed.). Digital Equipment Corporation (Dez). 1984 [1983].
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01101 / Name: British NRC Set". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [1] [2] [3]
- ^ a b c d e f g h i j k l Digital Equipment Corporation (Dez). "7. Zeichensätze". VT510 Video Terminal Programmer Information. Abgerufen 2017-02-18.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01107 / Name: Norwegische / dänische NRC Alternate". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [4] [5] [6]
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01105 / Name: Norwegisch / dänischer NRC -Set". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [7] [8] [9]
- ^ a b c d "SBCS -Code -Seiteninformationen - CPGID: 01102 / Name: Dutch NRC Set". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [10] [11] [12]
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01103 / Name: Finnisch -NRC -Set". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [13] [14] [15]
- ^ a b c "SBCS -Code -Seiteninformationen - CPGID: 01104 / Name: French NRC Set". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [16] [17] [18]
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01020 / Name: Canadian (Französisch) Variante". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [19] [20]
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01011 / Name: 7 -Bit Deutschland F.R." IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ "Code -Seiten -Identifikatoren". Microsoft Developer Network. Microsoft. 2014. Archiviert Aus dem Original am 2016-06-19. Abgerufen 2016-06-19.
- ^ "Webcodings - Internet Explorer - Codings". Waswg Wiki. 2012-10-23. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Deutsche (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ a b Bemer, Robert William (1980). "Kapitel 1: Inside ASCII". Allzweck -Software (PDF). Best of Interface Age. Vol. 2. Portland oder, USA: Dilithium Press. S. 1–50. ISBN 0-918398-37-1. Lccn 79-67462. Archiviert von das Original am 2016-08-27. Abgerufen 2016-08-27, aus: Bemer, Robert William (Mai 1978). "Inside ASCII - Teil I". Schnittstellenalter. Portland, OR, USA: Dilithium Press. 3 (5): 96–102., Bemer, Robert William (Juni 1978). "Inside ASCII - Teil II". Schnittstellenalter. Portland, OR, USA: Dilithium Press. 3 (6): 64–74., Bemer, Robert William (Juli 1978). "Inside ASCII - Teil III". Schnittstellenalter. Portland, OR, USA: Dilithium Press. 3 (7): 80–87.
- ^ a b "HP PCL/PJL Referenz PCL 5 Vergleichshandbuch" (PDF) (2 ed.). Hewlett-Packard Company, LP. Juni 2003. HP Teilnummer 502-0378. Archiviert von das Original (PDF) am 2016-08-10. Abgerufen 2016-08-10.
- ^ a b "SBCS -Code -Seiteninformationen - CPGID: 01012 / Name: 7 -Bit Italien". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ a b "SBCS -Code -Seiteninformationen - CPGID: 01023 / Name: Spanienvariante". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [21] [22] [23]
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01106 / Name: Swedish British NRC Set". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [24] [25] [26]
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01021 / Name: Schweizvariante". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05. [27] [28] [29]