ISO/IEC 646
Standard | ISO/IEC 646, Itu t.50 |
---|---|
Einstufung | 7-Bit Grundlegende lateinische Codierung |
Vorausgegangen von | US-Ascii |
gefolgt von | ISO/IEC 8859, ISO/IEC 10646 |
Andere verwandte Kodierungen (en) | Dec nrcs, World System TeleText Anpassungen an andere Alphabete: ELOT 927, Symbol, KOI-7, Srpscii und makscii, ASMO 449, SI 960 |
ISO/IEC 646 ist der Name eines Satzes von ISO/IEC Standards, beschrieben als als Informationstechnologie-ISO 7-Bit-codiertes Zeichen für den Informationsaustausch und entwickelt in Zusammenarbeit mit ASCII Zumindest seit 1964.[1][2] Seit seiner ersten Ausgabe im Jahr 1967[3] es hat eine 7-bisschen Charaktercode, aus dem mehrere nationale Standards abgeleitet sind.
ISO/IEC 646 wurde ebenfalls von ratifiziert ECMA wie ECMA-6. Die erste Version von ECMA-6 wurde 1965 veröffentlicht.[4] Basierend auf Arbeiten hat das technische Komitee des ECMA seit Dezember 1960 TC1 durchgeführt.[4]
Zeichen im ISO/IEC 646 Basic Character Set sind invariante Charaktere.[5] Da dieser Teil von ISO/IEC 646 das ist, ist das das Invariante Charakter -Set von allen Ländern geteilt, nur die in der verwendeten Buchstaben angegeben ISO Basic Latin Alphabet, Länder, die zusätzliche Buchstaben verwenden, um nationale Varianten von ISO/IEC 646 zu erstellen, um ihre nativen Skripte zu verwenden. Da die Übertragung und Speicherung von 8-Bit-Codes zu diesem Zeitpunkt nicht Standard war, mussten die nationalen Charaktere in die Einschränkungen von 7 Bit passen, was bedeutet, dass einige Zeichen, die in erscheinen ASCII Erscheinen Sie nicht in anderen nationalen Varianten von ISO/IEC 646.
Geschichte
ISO/IEC 646 und sein Vorgänger ASCII (ASA X3.4) Die bestehende Praxis in Bezug Telekommunikation Industrie.
Da ASCII keine Reihe von Zeichen für andere Sprachen als Englisch bereitstellte, wurden einige nationale Varianten hergestellt, die einige weniger verwendete Zeichen durch die benötigten ersetzt. Aufgrund der Inkompatibilität der verschiedenen nationalen Varianten wurde eine internationale Referenzversion (IRV) von ISO/IEC 646 eingeführt, um zumindest den Ersatz auf die gleichen Zeichen in allen Varianten einzuschränken. Die Originalversion (ISO 646 IRV) unterschied sich von ASCII Nur in diesem Codepunkt 0x24, ASCIIs Dollarzeichen ($) wurde durch die ersetzt Internationales Währungssymbol (¤). Die letzte Version von 1991 des Code ISO/IEC 646: 1991 ist auch als bekannt als Itu t.50, International Referenz Alphabet oder IRA, früher Internationales Alphabet Nr. 5 (IA5). Mit diesem Standard können Benutzer die 12 Variablenzeichen ausüben (d. H. Zwei alternative grafische Zeichen und 10 nationale definierte Zeichen). Unter diesen Übungen ist ISO 646: 1991 IRV (internationale Referenzversion) explizit definiert und identisch mit ASCII.[6]
Das ISO/IEC 8859 Serie von Standards für 8-Bit-Charakter-Codierungen ersetzen den ISO/IEC 646 International Standard und seine nationalen Varianten, indem 96 zusätzliche Zeichen mit dem zusätzlichen Bit bereitgestellt und somit eine Substitution von ASCII-Codes vermieden werden. Das ISO/IEC 10646 Standard, in direktem Zusammenhang mit Unicodeersetzt alle ISO 646- und ISO/IEC 8859-Sets mit einer einheitlichen Anzahl von Zeichenkodierungen unter Verwendung eines größeren 21-Bit-Werts.
Ein Vermächtnis von ISO/IEC 646 ist an Fenstern sichtbar, wo in vielen ostasiatischen Gegenden die Backslash Charakter verwendet in Dateinamen wird als ¥ oder andere Zeichen wie z. ₩. Trotz der Tatsache, dass ein anderer Code für ¥ auch auf den ursprünglichen IBM -PCs verfügbar war Code Seite 437und ein separater Doppel-Byte-Code für ¥ ist in erhältlich Schicht jis (Obwohl dies oft verwendet Alternative Mapping), so viel Text wurde mit dem für ¥ ¥ verwendeten Backslash -Code erstellt (da revers_jis offiziell auf ISO 646: JP basiert, obwohl Microsoft ihn als ASCII ordnet), dass selbst moderne Windows -Schriftarten es für notwendig empfunden haben, den Code auf diese Weise zu rendern. Eine ähnliche Situation existiert mit ₩ und EUC-kr. Ein anderes Erbe ist die Existenz von Trigraphen in dem C Programmiersprache.
Veröffentlichte Standards
- ISO/R646-1967[3]
- ISO 646: 1972[7]
- ISO 646: 1983[8]
- ISO/IEC 646: 1991[7][9]
- ECMA-6 (1965-04-30), Erstausgabe[4]
- ECMA-6 (1967-06), zweite Ausgabe[3][4]
- ECMA-6 (1970-07), dritte Ausgabe[4][10]
- ECMA-6 (1973-08), vierte Ausgabe[4][10]
- ECMA-6 (1984-12, 1985-03), fünfte Ausgabe[4]
- ECMA-6 (1991-12, 1997-08), Sechste Ausgabe[7]
Code -Seitenlayout
Die folgende Tabelle zeigt das ISO/IEC 646 -Invariante -Zeichensatz. Jeder Charakter wird mit seinem dargestellt Unicode Äquivalent. Nationale Codepunkte sind grau mit dem ASCII -Zeichen, das ersetzt wird. Gelb zeigt einen Charakter an, der in einigen Regionen mit einem früheren Charakter als kombiniert werden könnte diakritisch Verwendung der Rücktaste Charakter, der sich auswirken kann Glyphe Auswahl.
Zusätzlich zu den invarianten festgelegten Einschränkungen ist 0x23 entweder beschränkt # oder £ und 0x24 ist entweder beschränkt $ oder ¤ In ECMA-6: 1991 entspricht ISO/IEC 646: 1991.[11] Diese Einschränkungen folgen jedoch nicht alle nationalen Varianten.[12][13]
ISO/IEC 646 (-inv) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Soh | Stx | ETX | Eot | Enq | Ack | Bel | BS | Ht | Lf | Vt | Ff | Cr | ALSO | Si |
1x | Dle | DC1 | DC2 | DC3 | DC4 | Nak | Syn | ETB | KANN | Em | Sub | ESC | Fs | Gs | Rs & | UNS |
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | Del |
Verwandte Codierungsfamilien
Nationaler Ersatzcharaktersatz
Das Nationaler Ersatzcharaktersatz (NRCS) ist eine Familie von 7-Bit Dez mit dem VT200 Reihe von Computerterminals. Es ist eng mit ISO/IEC 646 verwandt und basiert auf einer ähnlichen invarianten Untergruppe von ASCII, die sich in der Haltedauer unterscheidet $
als unveränderlich, aber nicht _
(Obwohl die meisten NRCS -Varianten die behalten _
und daher dem ISO/IEC 646 -Invariante -Set einhalten). Die meisten NRCS Niederländische Variante.
World System TeleText
Das Europäischer Telekommunikationsstandard ETS 300 706, "Enhanced TeleText Specification", definiert lateinische, griechische, kyrillische, arabische und hebräische Code -Sätze mit mehreren nationalen Varianten sowohl für Latein- als auch für kyrillisch.[14] Wie NRCs und ISO/IEC 646 innerhalb der lateinischen Varianten der Familie der Codierungen, die als die bekannt sind G0 -Set basieren auf einer ähnlichen invarianten Untergruppe von ASCII, behalten aber auch nicht bei $
Noch _
als Invariante. Im Gegensatz zu NRCs unterscheiden sich Varianten häufig erheblich von den entsprechenden nationalen ISO/IEC -646 -Varianten.
Variantencodes und Beschreibungen
ISO/IEC 646 Nationale Varianten
Einige nationale Varianten von ISO/IEC 646 sind wie folgt:
Code | ISO-IR | ISO/IEC ESC | Genehmigt | Nationaler Standard | Beschreibung |
---|---|---|---|---|---|
Ca. | 121 | Esc 2/8 7/7 | ISO 646 | CSA Z243.4-1985-1 | Kanada (Nr. 1 Alternative mit "î") (Französisch, klassisch) (Code Seite 1020[15])) |
CA2 | 122 | Esc 2/8 7/8 | ISO 646 | CSA Z243.4-1985-2 | Kanada (Nr. 2 Alternative mit "é") (Französisch, reformierte Orthographie) |
CN | 57[16] | Esc 2/8 5/4 | ? | Gb/t 1988-80 | Volksrepublik China (Grundlatein) |
Cu | 151 | Esc 2/8 2/1 4/1 | ISO 646 | NC 99-10: 81 / NC NC00-10: 81 | Kuba (Spanisch)) |
Dano | 9-1[17] | Esc 2/8 4/5[17] | Schwester? | Nats-Dano | Norwegen und Dänemark (Journalistische Texte). Invariante Codepunkt 0x22 wird als angezeigt « , (vergleichen " im IRV). Es gilt jedoch immer noch als doppeltes Zitatzeichen.[18] Begleitet SEFI (NATS-SEFI). |
De | 21[17][16] | Esc 2/8 4/11[17] | ISO 646 | LÄRM 66003 | Deutschland (Deutsch) (Code Seite 1011,[19] 20106[20][21][22])) |
DK | - | ? | DS 2089[23][24] | Dänemark (dänisch) (Code Seite 1017[25])) | |
Es | 17[17] | Esc 2/8 5/10[17] | ECMA | Olivetti | Spanisch (International) (Code Seite 1023[26])) |
Es2 | 85[16] | Esc 2/8 6/8 | ECMA | IBM | Spanien (baskisch, Kastilier, katalanisch, galizisch) (Code Seite 1014[27])) |
Fi | 10[16] | ISO 646 | SFS 4017 | Finnland (Grundversion) (Code Seite 1018[28])) | |
Fr | 69[16] | Esc 2/8 6/6 | ISO 646 | Afnor NF Z 62010-1982 | Frankreich (Französisch) (Code Seite 1010[29])) |
Fr1 | 25[17][16] | Esc 2/8 5/2[17] | ISO 646 | Afnor NF Z 62010-1973 | Frankreich (veraltet seit April 1985) (Code Seite 1104[30])) |
Gb | 4[17][16] | Esc 2/8 4/1[17] | ISO 646 | BS 4730 | Vereinigtes Königreich (Englisch) (Code Seite 1013[31])) |
Hu | 86 | Esc 2/8 6/9 | ISO 646 | MSZ 7795/3 | Ungarn (ungarisch)) |
Dh | 207 | ? | NSAI 433: 1996 | Irland (irisch)) | |
Inv | 170 | Esc 2/8 2/1 4/2 | ISO 646 | ISO 646: 1983 | Invariante Teilmenge |
(IRV) | 2[17][16] | Esc 2/8 4/0[17] | ISO 646 | ISO 646: 1973 | Internationale Referenzversion. 0x7e als Überlinie (ISO-IR-002).[32] |
? | ? | ISO 646 | ISO 646: 1983 | Internationale Referenzversion. 0x7e als Tilde (Code Seite 1009,[33] 20105[20][21][34]). | |
ISO 646: 1991 Die internationale Referenzversion entspricht der US -Variante (siehe unten). | |||||
IST | ? | ? | ? | Island (isländisch)) | |
ES | 15[17][16] | Esc 2/8 5/9[17] | ECMA | UNI 0204-70 / Olivetti? | Italienisch (Code Seite 1012[35])) |
JP | 14[17][16] | Esc 2/8 4/10[17] | ISO 646 | Jis C 6220: 1969-RO | Japan (Romaji) (Code Seite 895[36]). Wird auch als 8-Bit-Code mit verwendet das entsprechende Katakana -Zusatzsatz. |
JP-OCR-B | 92 | Esc 2/8 6/14 | ISO 646 | Jis C 6229-1984-B | Japan (OCR-B) |
Kr | - | ? | KS C 5636-1989 | Südkorea | |
Mt | - | ? | ? | Malta (maltesisch, Englisch)) | |
Nl | - | ECMA | IBM | Niederlande (Niederländisch) (Code Seite 1019[37])) | |
NEIN | 60[16] | Esc 2/8 6/0 | ISO 646 | NS 4551 Version 1[16] | Norwegen (Code Seite 1016[38])) |
NO2 | 61[16] | Esc 2/8 6/1 | ISO 646 | NS 4551 Version 2[16] | Norwegen (Veraltet seit Juni 1987) (Code -Seite 20108[20][21][39])) |
Pl | - | BN-74/3101-01 | Polen (Polnisch hat 18 Buchstaben mit diakritischen Markierungen, aber nur 9 Kleinbuchstaben werden aus Code -Raum -Gründen normalisiert.) | ||
Pt | 16[16] | Esc 2/8 4/12 | ECMA | Olivetti | Portugiesisch (International) |
Pt2 | 84[16] | Esc 2/8 6/7 | ECMA | IBM | Portugal (Portugiesisch, Spanisch) (Code Seite 1015[40])) |
Se | 10[17][16] | Esc 2/8 4/7[17] | ISO 646 | Sen 850200 Anhang B, Schwester 63 61 27 | Schweden (Basic Schwedisch) (Code Seite 1018,[28] D47) |
SE2 | 11[17][16] | Esc 2/8 4/8[17] | ISO 646 | Sen 850200 Anhang C, Schwester 63 61 27 | Schweden (erweitert Schwedisch für Namen) (Code -Seite 20107,[20][21][41] E47) |
Sefi | 8-1[17] | Esc 2/8 4/3[17] | Schwester | Nats-sefi | Schweden und Finnland (Journalistische Texte). Begleitet Dano (Nats-Dano). |
T.61-7bit | 102 | Esc 2/8 7/5 | ? | Itu/Ccitt T.61 Empfehlung | International (Teletex). Auch verwendet mit der entsprechende ergänzende Satz als 8-Bit-Code. |
TW | - | ? | ZNS 5205-1996 | Republik China (Taiwan)) | |
USA/ (IRV) | 6[17][16] | Esc 2/8 4/2[17] | ISO 646 | Ansi X3.4-1968 und ISO 646: 1983 (auch IRV in ISO/IEC 646: 1991) | Vereinigte Staaten (ASCII, Code Seite 367,[42] 20127[20][21][43])) |
Yu | 141 | Esc 2/8 7/10 | ISO 646 | JUS I.B1.002 (Yuscii)) | Ehemaliger Jugoslawien (kroatisch, Slowene, serbisch, bosnisch)) |
Inis | 49 | Esc 2/8 5/7 | Iaea | Inis | ISO 646 IRV -Untergruppe |
Nationale Derivate
Es gibt auch einige nationale Charakter -Sets, die auf ISO/IEC 646 basieren, aber nicht strikt seinem invarianten Satz folgen (siehe auch § Derivate für andere Alphabete):
Zeichensatz | ISO-IR | ISO ESC | Genehmigt | Nationaler Standard | Beschreibung |
---|---|---|---|---|---|
BS_ViewData | 47 | Esc 2/8 5/6 | Britisches Postamt | Daten anzeigen und Teletetext. ViewData Square (⌗) ersetzt normalerweise invariante Unterstriche (_), die nicht auf der Zielhardware angezeigt werden kann.[44] Dies ist eigentlich die Codierung von Microsofts WST_ELLL. | |
Gr / Greek7 | 88 | Esc 2/8 6/10 | ? | Hos ELOT 927 | Griechenland (zurückgezogen im November 1986). Verwendet griechische Buchstaben anstelle von römischen[45] und ist daher nicht genau genommen eine ISO 646 -Variante. |
Griechisch 7-alt | 18 | Esc 2/8 5/11 | ECMA | ? | Griechischer Grafiksatz. Ähnlich im Konzept wie Griechisch7verwendet aber eine andere Zuordnung von Buchstaben. Außerdem folgt der obere Fall dem unteren Fall. |
Lateingriechter | 19 | Esc 2/8 5/12 | ECMA | ? | Lateingriechische kombinierte Grafiken (nur Hauptstädte). Folgt Griechisch 7-alt, aber lateinische Hauptstädte ohne Modifikation und griechische Hauptstädte über den lateinischen unteren Fall. |
Lateingriechischer-1 | 27[17] | Esc 2/8 5/5[17] | ECMA | Honeywell-Bull | Lateingriechische Grafik (nur griechische Hauptstädte).[17] Vereint visuell griechische Hauptstädte mit lateinischen Hauptstädten, wo möglich, und fügt die verbleibenden griechischen Hauptstädte hinzu. Im Gegensatz zu den anderen griechischen Versionen bleiben alle grundlegenden lateinischen Buchstaben intakt. Ersetzt invariante Interpunktion sowie nationale Charaktere jedoch,[46] und daher ist immer noch nicht genau genommen eine ISO 646 -Variante. |
Swi | - | ECMA | Olivetti | Schweiz (Französisch, Deutsch) (Code Seite 1021[47]) Invariante Codepunkt 0x5f wird aus geändert _ zu è . Ist ein Dec nrcs Variante, eng mit ISO 646 verwandt, fehlt jedoch ein vollständiges ISO 646 -konformes Äquivalent. |
Steuerzeichen
Alle oben aufgeführten Varianten sind ausschließlich grafische Zeichensätze und sind mit a verwendet zu werden C0 -Kontrollcharakter Setze wie in der folgenden Tabelle eingestellt:
ISO-IR | ISO ESC | Genehmigt | Beschreibung |
---|---|---|---|
1[17] | Esc 2/1 4/0[17] | ISO 646 | ISO 646 Kontrollen[17] ("ASCII -Kontrollen") |
7[17] | Esc 2/1 4/1[17] | ISO 646 | Skandinavische Zeitungskontrollen (NATS)[17] |
26[17] | Esc 2/1 4/3[17] | ISO 646 | IPTC Kontrollen[17] |
Zugeordnete ergänzende Zeichensätze
In der folgenden Tabelle werden ergänzende grafische Zeichensätze aufgeführt, die nach dem gleichen Standard wie spezifische ISO/IEC -646 -Varianten definiert sind. Diese würden unter Verwendung eines Mechanismus wie ausgewählt, z. verschieben oder die Nats Super Shift (Einzelschicht),[48] oder indem Sie das achte Bit in Umgebungen festlegen, in denen man verfügbar war:
ISO-IR | ISO/IEC ESC | Nationaler Standard | Beschreibung |
---|---|---|---|
8-2[17] | Esc 2/8 4/4[17] | NATS-SEFI-ADD | Ergänzungscode mit NATS-SEFI verwendet. |
9-2[17] | Esc 2/8 4/6[17] | Nats-Dano-Add | Ergänzungscode mit Nats-Dano verwendet. |
13[17][16] | Esc 2/8 4/9[17] | Jis C 6220: 1969-JP | Katakana, verwendet als Ergänzungscode mit ISO-646-JP. |
103 | Esc 2/8 7/6 | Itu/Ccitt T.61 Empfehlung, Ergänzungssatz | Ergänzungscode mit T.61 verwendet. |
Variante -Vergleichstabelle
Die Einzelheiten der Änderungen für einige dieser Varianten sind in der folgenden Tabelle angegeben. Zeichenzuweisungen, die über alle aufgeführten Varianten unverändert sind (d. H. Die gleich bleiben wie ASCII), werden nicht angezeigt.
Zum einfachen Vergleich umfassen die detaillierten Varianten nationale Varianten von ISO/IEC 646, die eng verwandte Dezember Nationaler Ersatzcharaktersatz (NRCS) -Serie verwendet auf VT200 Terminals der verwandte Europäer World System TeleText Codierungsreihe definiert in ETS 300 706 und einige andere eng verwandte Codierungen basierend auf ISO/IEC 646. Einzelne Code -Diagramme sind aus der zweiten Spalte verknüpft. Die Zellen mit nicht weißem Hintergrund betonen die Unterschiede aus US-Ascii (auch die Grundlatein Teilmenge von ISO/IEC 10646 und Unicode).
Mehrere Zeichen könnten als verwendet werden als Charaktere kombinieren, wenn er mit einem vorgegangen ist oder folgt Rücktaste C0 -Kontrolle. Dies wird in den Code -Diagrammen für IRV, GB, FR1, CA und CA2 bestätigt, die feststellen, dass dies festgestellt wird "',^
würde sich wie das verhalten Diaerese, Akuter Akzent, Cedilla und Zirkumflex (statt Anführungszeichen, a Komma und ein Aufwärtsspitze) Wenn ein Rückraum vorausgegangen ist oder gefolgt. Der Tilde -Charakter (~) war ähnlich als diakritisch eingeführt (˜). Diese Codierungsmethode entstand in der Schreibmaschine/Teletyp Ära, wenn die Verwendung von Rückenraum einen Glyphen überstempeln und berücksichtigt werden kann veraltet.
Später, als breitere Zeichensätze mehr Akzeptanz erlangten, ISO/IEC 8859, Lieferantenspezifische Zeichensets und schließlich Unicode wurde die bevorzugten Methoden zur Kodierung der meisten dieser Varianten.
Variantencode | Codediagramm | Zeichen für jedes ISO 646 / NRCS -kompatibel oder abgeleitete Zeichen | |||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
US/ IRV (1991) | ISO-IR-006[49] | ! | " | # | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ~ |
Ältere internationale Referenzversionen | |||||||||||||||||||
IRV (1973) | ISO-IR-002[32] | ! | " | # | ¤ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
IRV (1983) | CP01009[50] | ! | " | # | ¤ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ~ |
Invariante und andere IRV -Untergruppen | |||||||||||||||||||
Inv | ISO-IR-170[51] | ! | " | & | : | ? | _ | ||||||||||||
Inv (NRCS)[a] | --- | ! | " | $ | & | : | ? | ||||||||||||
Inv (Teletetext)[a] | ETS WST[52] | ! | " | & | : | ? | |||||||||||||
INIS -Untergruppe[a] | ISO-IR-049[53] | $ | : | [ | ] | | | |||||||||||||
T.61 | ISO-IR-102[54] | ! | " | # | ¤ | & | : | ? | @ | [ | ] | _ | | | ||||||
Ostasiate | |||||||||||||||||||
JP | ISO-IR-014[55] | ! | " | # | $ | & | : | ? | @ | [ | ¥ | ] | ^ | _ | ` | { | | | } | ‾ |
JP-OCR-B | ISO-IR-092[56] | ! | " | # | $ | & | : | ? | @ | [ | ¥ | ] | ^ | _ | { | | | } | ||
Kr | (KS x 1003)[57] | ! | " | # | $ | & | : | ? | @ | [ | ₩ | ] | ^ | _ | ` | { | | | } | ‾ |
CN | ISO-IR-057[13] | ! | " | # | ¥ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
TW | (ZNS 5205)[57] | ! | " | # | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
Britisch und Iren | |||||||||||||||||||
Gb | ISO-IR-004[58] | ! | " | £ | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
GB (NRCS)) | CP01101[59] | ! | " | £ | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ~ |
Daten anzeigen[b][c] | ISO-IR-047[44] | ! | " | £ | $ | & | : | ? | @ | ← | ½ | → | ↑ | ⌗ | - - | ¼ | ‖ | ¾ | ÷ |
Dh | ISO-IR-207[60] | ! | " | £ | $ | & | : | ? | Ö | É | ICH | Ú | EIN | _ | Ö | é | ich | ú | a |
Italophon oder Frankophon | |||||||||||||||||||
ES[d] | ISO-IR-015[61] | ! | " | £ | $ | & | : | ? | § | ° | c | é | ^ | _ | ù | a | Ö | è | ich |
ES (Teletetext)[c] | ETS WST[14] | ! | " | £ | $ | & | : | ? | é | ° | c | → | ↑ | ⌗ | ù | a | Ö | è | ich |
FR (1983) | ISO-IR-069[62] | ! | " | £ | $ | & | : | ? | a | ° | c | § | ^ | _ | µ | é | ù | è | ¨ |
FR (1973)[d] | ISO-IR-025[63] | ! | " | £ | $ | & | : | ? | a | ° | c | § | ^ | _ | ` | é | ù | è | ¨ |
Fr Teletetext[c] | ETS WST[14] | ! | " | é | ich | & | : | ? | a | ë | ê | ù | ich | ⌗ | è | a | Ö | û | c |
Ca.[d] | ISO-IR-121[64] | ! | " | # | $ | & | : | ? | a | a | c | ê | ich | _ | Ö | é | ù | è | û |
CA2 | ISO-IR-122[65] | ! | " | # | $ | & | : | ? | a | a | c | ê | É | _ | Ö | é | ù | è | û |
Frankophon-Germanophon | |||||||||||||||||||
swi (NRCS)[c] | CP01021[66] | ! | " | ù | $ | & | : | ? | a | é | c | ê | ich | è | Ö | a | Ö | ü | û |
Germanophon | |||||||||||||||||||
De[d][e] | ISO-IR-021[67] | ! | " | # | $ | & | : | ? | § | EIN | Ö | Ü | ^ | _ | ` | a | Ö | ü | ß |
Nordisch (östlich) und Ostsee | |||||||||||||||||||
Fi/ se | ISO-IR-010[68] | ! | " | # | ¤ | & | : | ? | @ | EIN | Ö | EIN | ^ | _ | ` | a | Ö | a | ‾ |
SE2[f] | ISO-IR-011[69] | ! | " | # | ¤ | & | : | ? | É | EIN | Ö | EIN | Ü | _ | é | a | Ö | a | ü |
SE (NRCS)) | CP01106[70] | ! | " | # | $ | & | : | ? | É | EIN | Ö | EIN | Ü | _ | é | a | Ö | a | ü |
Fi (NRCS)) | CP01103[71] | ! | " | # | $ | & | : | ? | @ | EIN | Ö | EIN | Ü | _ | é | a | Ö | a | ü |
Sefi (Nats)[g] | ISO-IR-008-1[72] | ! | " | # | $ | & | : | ? | | EIN | Ö | EIN | ■ | _ | | a | Ö | a | – |
EE (Teletetext)[c] | ETS WST[14] | ! | " | # | Ö | & | : | ? | S | EIN | Ö | Ž | Ü | Ö | s | a | Ö | ž | ü |
LV/ LT (Teletetext)[c] | ETS WST[14] | ! | " | # | $ | & | : | ? | S | ė | ę | Ž | c | ū | s | a | ų | ž | ich |
Nordisch (Western) | |||||||||||||||||||
DK | CP01017[73] | ! | " | # | ¤ | & | : | ? | @ | Æ | Ö | EIN | Ü | _ | ` | Æ | Ö | a | ü |
Dk/nein (NRCS)) | CP01105[74] | ! | " | # | $ | & | : | ? | EIN | Æ | Ö | EIN | Ü | _ | a | Æ | Ö | a | ü |
DK/No-Alt (NRCS)) | CP01107[75] | ! | " | # | $ | & | : | ? | @ | Æ | Ö | EIN | ^ | _ | ` | Æ | Ö | a | ~ |
NEIN | ISO-IR-060[76] | ! | " | # | $ | & | : | ? | @ | Æ | Ö | EIN | ^ | _ | ` | Æ | Ö | a | ‾ |
NO2 | ISO-IR-061[12] | ! | " | § | $ | & | : | ? | @ | Æ | Ö | EIN | ^ | _ | ` | Æ | Ö | a | | |
Dano (Nats)[g][h] | ISO-IR-009-1[18] | ! | « | » | $ | & | : | ? | | Æ | Ö | EIN | ■ | _ | | Æ | Ö | a | – |
IST | [77] | ! | " | # | ¤ | & | : | ? | D | Þ | \ | Æ | Ö | _ | d | Þ | | | Æ | Ö |
Hispanophon | |||||||||||||||||||
Es[d] | ISO-IR-017[78] | ! | " | £ | $ | & | : | ? | § | ¡ | N | ¿ | ^ | _ | ` | ° | n | c | ~ |
Es2 | ISO-IR-085[79] | ! | " | # | $ | & | : | ? | · | ¡ | N | C | ¿ | _ | ` | ´ | n | c | ¨ |
Cu | ISO-IR-151[80] | ! | " | # | ¤ | & | : | ? | @ | ¡ | N | ] | ¿ | _ | ` | ´ | n | [ | ¨ |
Hispanophon-Lusophon | |||||||||||||||||||
Es/Pt Teletetext[c] | ETS WST[14] | ! | " | c | $ | & | : | ? | ¡ | a | é | ich | Ö | ú | ¿ | ü | n | è | a |
Lusophon | |||||||||||||||||||
Pt | ISO-IR-016[81] | ! | " | # | $ | & | : | ? | § | EIN | C | Ö | ^ | _ | ` | a | c | Ö | ° |
Pt2 | ISO-IR-084[82] | ! | " | # | $ | & | : | ? | ´ | EIN | C | Ö | ^ | _ | ` | a | c | Ö | ~ |
Pt (NRCS)) | --- | ! | " | # | $ | & | : | ? | @ | EIN | C | Ö | ^ | _ | ` | a | c | Ö | ~ |
griechisch | |||||||||||||||||||
Latein-gr-gemischt[c] | ISO-IR-027[46] | Ξ | " | Γ | ¤ | & | Ψ | Π | Δ | Ω | Θ | Φ | Λ | Σ | ` | { | | | } | ‾ |
ISO-IR-088 (GR / ELOT 927), ISO-IR-018 und ISO-IR-019 Ersetzen Sie römische Buchstaben durch griechische Buchstaben und sind sind detailliert in einem separaten Diagramm. | |||||||||||||||||||
Slawisches (lateinisches Skript) | |||||||||||||||||||
Yu | ISO-IR-141[83] | ! | " | # | $ | & | : | ? | Ž | S | Đ | C | C | _ | ž | s | đ | c | c |
Yu Teletetext[c] | ETS WST[14] | ! | " | # | Ë | & | : | ? | C | C | Ž | Đ | S | ë | c | c | ž | đ | s |
Yu-Alt Teletetext[c] | ETS WST[14] | ! | " | # | $ | & | : | ? | C | C | Ž | Đ | S | ë | c | c | ž | đ | s |
CS/CZ/SK (Teletetext)[c] | ETS WST[14] | ! | " | # | ů | & | : | ? | c | t | ž | ý | ich | r | é | a | ě | ú | s |
Pl | BN-74/3101-01[77] | ! | " | # | Zł | & | : | ? | ę | ź | \ | n | s | _ | a | Ö | ł | ż | c |
Pl Teletetext[c] | ETS WST[14] | ! | " | # | n | & | : | ? | a | Ƶ | S | Ł | c | Ö | ę | ż | s | ł | ź |
Anpassungen für die kyrillische Schrift ersetzen römische Buchstaben und sind detailliert in einem separaten Diagramm | |||||||||||||||||||
Sonstiges | |||||||||||||||||||
Nl | CP01019[84] | ! | " | # | $ | & | : | ? | @ | [ | \ | ] | ^ | _ | ` | { | | | } | ‾ |
Nl NRCS | CP01102[85] | ! | " | £ | $ | & | : | ? | ¾ | ij | ½ | | | ^ | _ | ` | ¨ | ƒ | ¼ | ´ |
Hu | ISO-IR-086[86] | ! | " | # | ¤ | & | : | ? | EIN | É | Ö | Ü | ^ | _ | a | é | Ö | ü | ˝ |
Mt | [77] | ! | " | # | $ | & | : | ? | @ | g | ż | h | ^ | _ | c | G | Ż | H | C |
RO (Teletetext)[c] | ETS WST[14] | ! | " | # | ¤ | & | : | ? | T | EIN | S | EIN | ICH | ich | t | a | s | a | ich |
TR (Teletetext)[c] | ETS WST[14] | ! | " | Tl | g | & | : | ? | ICH | S | Ö | C | Ü | G | ich | s | Ö | c | ü |
- ^ a b c Ist eine Teilmenge einer der internationalen Referenzversionen von ISO 646, enthält jedoch nicht alle Zeichen, die im invarianten Satz vorhanden sind. Zum Vergleich eingeschlossen.
- ^ Auch Großbritannien Teletext.
- ^ a b c d e f g h i j k l m n Entspricht nicht vollständig dem invarianten Satz, ist aber ein eng verwandtes Derivat von ISO 646. Zum Vergleich enthalten.
- ^ a b c d e ISO 646 Variante identisch mit der NRCS -Variante.
- ^ Auch World System TeleText (DE)
- ^ Auch World System TeleText (SE/FI/HU)
- ^ a b Die Nats-Charsets (z. B. Nats-SEFI[72]) ersetzen
@
(0x40) und`
(0x60) mit "Einheitraum A" (UA) und "Einheit Space B" (UB). Der einfache Raum (0x20) erweitert die Rechtfertigung. UA und UB sind für feste Breiten, UA muss mindestens so breit wie UB sein. RFC 1345 Karten UA und UB zu ISO 10646 (UCS) Codepunkte U+E002 und U+E003, beide in der Privatnutzungsbereichjeweils (obwohl es auch PUA -Zuordnungen für mehrere andere Zeichen auflistet, die jetzt UCS -Codepunkte haben). Unicode enthält Eine Reihe von Raumzeichen das könnte ungefähr entsprechen. - ^ Die Übereinstimmung mit dem ISO 646 -invarianten Set ist fraglich, aber es ist ein eng verwandtes Derivat von ISO 646. Hier zum Vergleich enthalten.
Derivate für andere Alphabete
Einige 7-Bit-Zeichensätze für Nicht-Latin-Alphabete stammen aus dem ISO/IEC 646-Standard: Diese bilden nicht selbst ISO/IEC 646, da sie nicht den invarianten Codepunkten verfolgt werden (oft ersetzen die Buchstaben von mindestens einem Fall). Aufgrund der Unterstützung unterschiedlicher Alphabete, für die die nationalen Codepunkte nicht genügend Codierungsraum bieten. Beispiele beinhalten:
- 7-Bit-Turkmen (ISO-IR-230).[87]
- 7-Bit Griechisch.
- Im ELOT 927 (ISO-IR-088),[45] das griechisches Alphabet wird in alphabetischer Reihenfolge (mit Ausnahme des End-Sigma) auf die Positionen 0x61–0x71 und 0x73–0x79 auf den lateinischen Kleinbuchstaben abgebildet.
- ISO-IR-018[88] Karten Sie das griechische Alphabet über beide Buchstabenfälle unter Verwendung eines anderen Schemas (nicht in alphabetischer Reihenfolge, aber nach Möglichkeit, griechische Buchstaben über römische Buchstaben zu entsprechen, die in gewissem Sinne entsprechen) und ISO-IR-019[89] Karten Sie das griechische Großbuchstaben Alphabet über die lateinischen Kleinbuchstaben mit demselben Schema wie ISO-IR-018.
- Die untere Hälfte der Symbol Schriftart -Charakter -Codierung[90] Verwendet ein eigenes Schema, um griechische Buchstaben beider Fälle über die ASCII -Römischen Buchstaben zuzuordnen, und versucht auch, griechische Buchstaben über römische Buchstaben zuzuordnen, die in gewissem Sinne entsprechen, aber in dieser Hinsicht unterschiedliche Entscheidungen treffen (siehe Tabelle unten). Es ersetzt auch invariante Codepunkte 0x22 und 0x27 und fünf nationale Codepunkte durch mathematische Symbole. Obwohl sie nicht für die Verwendung von griechischer Prosa verwendet werden, wird sie manchmal zu diesem Zweck verwendet.
- ISO-IR-027[46] (detailliert in der obigen Tabelle und nicht unten) enthält das lateinische Alphabet unverändert, fügt jedoch einige griechische Großbuchstaben hinzu, die nicht mit Latein-Skript dargestellt werden können Homoglyphen; Während es explizit auf ISO/IEC 646 basiert, werden einige davon auf Codepunkte zugeordnet, die in ISO/IEC 646 (0x21, 0x3a und 0x3f) invariant sind, und es ist daher keine echte ISO/IEC 646 -Variante.
- Das World System TeleText Die Codierung für Griechisch verwendet ein weiteres Schema der Abbildung griechischer Buchstaben in alphabetischer Reihenfolge über die ASCII -Buchstaben beider Fälle, insbesondere mehrere Buchstaben mit Diakritik.[91]
- 7-Bit-kyrillisch
- KOI-7 oder kurz KOI, verwendet für Russisch. Die kyrillischen Zeichen sind auf die Positionen 0x60–0x7e auf den lateinischen Kleinbuchstaben abgebildet und passen, wo möglich homologe Buchstaben (wo в auf W, nicht V, abgebildet ist). Abgelöst von der KOI-8 Varianten.
- Srpscii und makscii, Cyrillische Varianten von yuscii (die lateinische Variante ist Yu/ISO-IR-141 im obigen Diagramm), verwendet für serbisch und mazedonisch beziehungsweise. Weitgehend homolog zur lateinischen Variante von yuscii (nach serbisch Digraphia Regeln), ausser für Љ (lj), Њ (NJ), Џ (dž) und ѕ (DZ), die Digraphen in entsprechen Latein-Skript-Orthographieund werden über Buchstaben kartiert, die nicht in serbisch oder mazedonisch (q, w, x, y) verwendet werden.
- Die G0 setzt für die World System TeleText Codierungen für russisch/bulgarisch[92] und ukrainisch[93] Verwenden Sie G0-Sätze ähnlich wie KOI-7 mit einigen Modifikationen. Der entsprechende G0 -Set für serbische Kyrillika[a][94] Verwendet ein Schema, das auf der Teletext-Codierung für lateinamerikanisches Skript basiert Serbo-Kroatischer und Sloweneim Gegensatz zu den signifikant unterschiedlichen Yuscii.
- 7-Bit Hebräisch, SI 960. Das Hebräisch Alphabet wird auf die Positionen 0x60–0x7a auf den lateinischen Buchstaben (und schwerer Akzent für Aleph) abgebildet. 7-Bit-Hebräisch wurde immer in visueller Reihenfolge aufbewahrt. Diese Zuordnung mit dem hohen Bit -Set, d. H. Mit den hebräischen Buchstaben in 0xe0–0xfa, ist ISO/IEC 8859-8. Das World System TeleText Coding für Hebräisch verwendet die gleichen Buchstaben-Zuordnungen, verwendet jedoch BS_ViewData als Basiskodierung (während Si 960 US-ASCII verwendet) und enthält a Schekelzeichen bei 0x7b.
- 7-Bit-Arabisch, ASMO 449 (ISO-IR-089).[95] Das Arabisches Alphabet wird auf die Positionen 0x41–0x5a und 0x60–0x6a auf sowohl Groß- als auch Kleinbuchstaben lateinamerikanisch abgebildet.
Ein Vergleich einiger dieser Kodierungen finden Sie unten. Es wird nur ein Fall angezeigt, außer in Fällen, in denen die Fälle auf verschiedene Buchstaben zugeordnet sind. In solchen Fällen wird zuerst die Zuordnung mit dem kleinsten Code angezeigt. Mögliche Transkriptionen werden für einige Buchstaben angegeben; Wo dies weggelassen wird, kann der Buchstabe dem römischen, über den er zugeordnet ist, entspricht.
Englisch (ASCII) | Kyrillische Alphabete | griechisches Alphabet | hebräisch | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Halbtransliterativ | Natürlich geordnet | ||||||||||
Russisch (KOI-7) | Russisch, bulgarisch (Wst Ru/bg) | ukrainisch (WST UKR) | serbisch (Srpscii) | mazedonisch (Makscii) | Serbisch, mazedonisch[a] (WST SRP) | griechisch (Symbol) | griechisch (IR-18[88]) | griechisch (ELOT 927) | griechisch (Wst El) | hebräisch (SI 960)) | |
@ ` | Ю (Ju/Yu) | Ю (Ju/Yu) | Ю (Ju/Yu) | Ж (ž) | Ж (ž) | Ч (č) | ≅ ‾ | ´ ` | @ ` | ΐ ΰ | א (ʾ/ʔ) |
A | А | A (a/á) | А | А | А | А | Α | Α | Α | Α | ב (b) |
B | Б | Б | Б | Б | Б | Б | Β | Β | Β | Β | ג (g) |
C | Ц (c/ts) | Ц (c/ts) | Ц (c/ts) | Ц (c/ts) | Ц (c/ts) | Ц (c/ts) | Χ (ch/kh) | Ψ (ps) | Γ (g) | Γ (g) | ד (d) |
D | Д | Д | Д | Д | Д | Д | Δ | Δ | Δ | Δ | ה (h) |
E | Е (je/ye) | Е (je/ye) | Е (e) | Е (e) | Е (e) | Е (e) | Ε | Ε | Ε | Ε | ו (w) |
F | Ф | Ф | Ф | Ф | Ф | Ф | Φ (pH/f) | Φ (pH/f) | Ζ (z) | Ζ (z) | ז (z) |
G | Г | Г | Г | Г | Г | Γ | Γ | Γ | Η (ē) | Η (ē) | ח (ch/kh) |
H | Х (h/kh/ch) | Х (h/kh/ch) | Х (h/kh/ch) | Х (h/kh/ch) | Х (h/kh/ch) | Х (h/kh/ch) | Η (ē) | Η (ē) | Θ (th) | Θ (th) | ט (TT) |
I | И | И | И (y) | И | И | И | Ι | Ι | Ι | Ι | י (j/y) |
J | Й (j/y) | Й (j/y) | Й (j/y) | Ј (j/y) | Ј (j/y) | Ј (j/y) | ϑ (th) ϕ (ph/f) | Ξ (x/ks) | Κ (k) | ך (k Finale) | |
K | К | К | К | К | К | К | Κ | Κ | Κ | Λ (l) | כ |
L | Л | Л | Л | Л | Л | Л | Λ | Λ | Λ | Μ (m) | ל |
M | М | М | М | М | М | М | Μ | Μ | Μ | Ν (n) | ם (M endgültig) |
N | Н | Н | Н | Н | Н | Н | Ν | Ν | Ν | Ξ (x/ks) | מ (m) |
O | О | О | О | О | О | О | Ο | Ο | Ξ (x/ks) | Ο | ן (n Finale) |
P | П | П | П | П | П | П | Π | Π | Ο (o) | Π | נ (n) |
Q | Я (ja/ya) | Я (ja/ya) | Я (ja/ya) | Љ (lj/ly) | Љ (lj/ly) | Ќ (ḱ/kJ) | Θ (th) | ͺ ( | Π (p) | Ρ (r) | ס (s) |
R | Р | Р | Р | Р | Р | Р | Ρ | Ρ | Ρ | ʹ ς (s endgültig) | ע (ʽ/ŋ) |
S | С | С | С | С | С | С | Σ | Σ | Σ | Σ | ף (P Finale) |
T | Т | Т | Т | Т | Т | Т | Τ | Τ | Τ | Τ | פ (p) |
U | У | У | У | У | У | У | Υ | Θ (th) | Υ | Υ | ץ (ṣ/ts endgültig) |
V | Ж (ž) | Ж (ž) | Ж (ž) | В | В | В | ς (s endgültig) ϖ (p) | Ω (ō) | Φ (f/ph) | Φ (f/ph) | צ (ṣ/ts) |
W | (V) | (V) | (V) | Њ (NJ/NY/ñ) | Њ (NJ/NY/ñ) | Ѓ (ǵ/gj) | Ω (ō) | ς (s endgültig) | ς (s endgültig) | Χ (ch/kh) | ק (q) |
X | Ь (’) | Ь (’) | Ь (’) | Џ (Dž) | Џ (Dž) | Љ (lj/ly) | Ξ | Χ (ch/kh) | Χ (ch/kh) | Ψ (ps) | ר (r) |
Y | Ы (y/ı) | Ъ ("/ǎ/ŭ) | І (i) | S (DZ) | S (DZ) | Њ (NJ/NY/ñ) | Ψ (ps) | Υ (u) | Ψ (ps) | Ω (ō) | ש (Š/sh) |
Z | З | З | З | З | З | З | Ζ | Ζ | Ω (ō) | Ϊ | ת (t) |
[ { | Ш (Š/sh) | Ш (Š/sh) | Ш (Š/sh) | Ш (Š/sh) | Ш (Š/sh) | Ћ (ć) | [ { | ῏ ῟ | [ { | Ϋ | [ { |
\ | | Э (e) | Э (e) | Є (je/ye) | »(Đ/dj) | Ѓ (ǵ/gj) | Ж (ž) | ∴ | | ᾿ ῾ (h) | \ | | ά ό | \ | |
] } | Щ (Šč) | Щ (Šč) | Щ (Šč) | Ћ (ć) | Ќ (ḱ/kJ) | »(Đ/dj) | ] } | ῎ ῞ | ] } | έ ύ | ] } |
^ ~ | Ч (č) | Ч (č) | Ч (č) | Ч (č) | Ч (č) | Ш (Š/sh) | ⊥ ~ | ˜ ¨ | ^ ‾ | ή ώ | ^ ‾ |
_ | Ъ (") | Ы (y/ı) | Ї (ji/yi) | _ | _ | Џ (Dž) | _ | _ | _ | ί | _ |
Siehe auch
- ISO/IEC 2022 Informationstechnologie: Charaktercode -Struktur und Erweiterungstechniken
- ISO/IEC 6937 (ANSI)
- ISO/IEC JTC 1/SC 2
Fußnoten
- ^ a b Bezeichnete "Cyrillic G0 Primary Set - Option 1 - Serbisch/Kroatisch", enthält jedoch jedoch mazedonisch Briefe Ќ und Ѓ (aber nicht Ѕ). Eine Untergruppe römischer Buchstaben, hauptsächlich solche ohne Homoglyphen im G0 -Set, sind im G1 -Set (15.6.7 Tabelle 41) einschließlich enthalten S/s bei 0x6b/7b. Kroatisch ist in geschrieben Lateinisches Skript.
Verweise
- ^ Mullendore, Ralph Elvin (1964) [1963]. Ptak, John F. (Hrsg.). "Über die frühe Entwicklung von ASCII - die Geschichte von ASCII". JF Ptak Science Books (veröffentlicht März 2012). Archiviert vom Original am 2016-05-26. Abgerufen 2016-05-26.
- ^ 6- und 7 -Bit -codierte Zeichensätze für Informationsverarbeitungsaustausch (Entwurf), Internationale Standardisierungsorganisation, Juli 1964 (NB. 21 Seiten. Mit Anschreiben für die Mitglieder der X3.2 und der Aufgabengruppen von Eric Clamons.)
- ^ a b c Mackenzie, Charles E. (1980). Codierte Zeichensätze, Geschichte und Entwicklung. Die Systems -Programmierreihen (1 ed.). Addison-Wesley Publishing Company, Inc. S. 7, 9, 412. ISBN 0-201-14460-3. Lccn 77-90165. Abgerufen 2016-05-22. [1]
- ^ a b c d e f g Standard ECMA-6: 7-Bit-codierter Zeichensatz (PDF) (5. Aufl.). Genf, Schweiz: Europäische Computerherstellervereinigung (ECMA). März 1985. Archiviert (PDF) vom Original am 2016-05-29. Abgerufen 2016-05-29.
Das technische Komitee TC1 von ECMA Im Dezember 1960 zum ersten Mal getroffen, um Standardcodes für Eingangs-/Ausgangszwecke vorzubereiten. Am [30] April 1965 wurde Standard ECMA-6 von der Generalversammlung von ECMA übernommen.
- ^ Bodfish, John; Wilson, Mark; Gregory, Stephen; Nye, Julie Blume. Bodfish, John (Hrsg.). "Invariante Charakterhandling". Niso Zirkulationstauschprotokoll. Colorado Department of Education, USA: NCIP Standing Committee (NCIP-SC). Archiviert von das Original Am 2013-12-24. Abgerufen 2016-05-30.
- ^ Demchenko, Yuri (2000) [1997]. "Internationale Standardisierung von 7-Bit-Codes, ISO 646". Ternea. 4. Archiviert vom Original am 2016-06-17. Abgerufen 2012-08-13.
- ^ a b c Standard ECMA-6: 7-Bit-codierter Zeichensatz (PDF) (6. Aufl.). Genf, Schweiz: Europäische Computerherstellervereinigung (ECMA). August 1997 [Dezember 1991]. Archiviert (PDF) vom Original am 2016-05-29. Abgerufen 2016-05-29.
- ^ "Informationsverarbeitung-ISO 7-Bit-codiertes Zeichen für Informationswechselscheiben". 1983-07-01. ISO 646: 1983. Archiviert vom Original am 2016-05-30. Abgerufen 2016-05-30.
- ^ "Informationstechnologie-ISO 7-Bit-codiertes Zeichen für Informationsaustausch" (3. Aufl.). 1991-12-16. ISO/IEC 646: 1991. Archiviert vom Original am 2016-05-30. Abgerufen 2016-05-30.
- ^ a b Standard ECMA-6: 7-Bit-Eingangs-/Ausgangscoded-Zeichensatz (PDF) (4. Aufl.). Genf, Schweiz: Europäische Computerherstellervereinigung (ECMA). August 1973. Archiviert (PDF) vom Original am 2016-05-29. Abgerufen 2016-05-29.
- ^ ECMA (1991). "7-Bit-codierter Zeichensatz" (PDF). ECMA-6.
- ^ a b Norge Standardiseringforbund (1982-06-01). Norwegischer Standard NS 4551 Version 2 (PDF). Itcj/Ipsj. ISO-IR-61.
- ^ a b China Association for Standardisierung (1982-06-01). 7-Bit-codierter Zeichen für Informationsaustausch (PDF). Itcj/Ipsj. ISO-IR-57.
- ^ a b c d e f g h i j k l "15.6.2 Latin National Option Subsets, Tabelle 36", ETS 300 706: Verbesserte TeleText -Spezifikation (PDF), Europäische Telekommunikationsstandards Institute (ETSI), p. 115
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01020 / Name: Canadian (Französisch) Variante". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ a b c d e f g h i j k l m n o p q r s t "HP PCL/PJL Referenz PCL 5 Vergleichshandbuch" (PDF) (2 ed.). Hewlett-Packard Company, LP. Juni 2003. HP Teilnummer 502-0378. Archiviert von das Original (PDF) am 2016-08-10. Abgerufen 2016-08-10.
- ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab AC Anzeige ae af Ag Ah ai AJ AK al bin ein ao AP Bemer, Robert William (1980). "Kapitel 1: Inside ASCII". Allzweck -Software (PDF). Best of Interface Age. Vol. 2. Portland oder, USA: Dilithium Press. S. 1–50. ISBN 0-918398-37-1. Lccn 79-67462. Archiviert von das Original am 2016-08-27. Abgerufen 2016-08-27, aus: Bemer, Robert William (Mai 1978). "Inside ASCII - Teil I". Schnittstellenalter. Portland, OR, USA: Dilithium Press. 3 (5): 96–102., Bemer, Robert William (Juni 1978). "Inside ASCII - Teil II". Schnittstellenalter. Portland, OR, USA: Dilithium Press. 3 (6): 64–74., Bemer, Robert William (Juli 1978). "Inside ASCII - Teil III". Schnittstellenalter. Portland, OR, USA: Dilithium Press. 3 (7): 80–87.
- ^ a b Sveriges standardiseringskommission (1975). Die Nats -Hauptgrafik -Set von Zeichen für Zeitungstextübertragung in Dänemark und Norwegen (PDF). Itcj/Ipsj. ISO-IR-9-1.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01011 / Name: 7 -Bit Deutschland F.R." IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ a b c d e "Code -Seiten -Identifikatoren". Microsoft Developer Network. Microsoft. 2014. Archiviert Aus dem Original am 2016-06-19. Abgerufen 2016-06-19.
- ^ a b c d e "Webcodings - Internet Explorer - Codings". Waswg Wiki. 2012-10-23. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Deutsche (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Dänischer Standard DS 2089: Anwendung von ISO 7-Bit-codiertem Zeichensatz. Februar 1974. UDC 681.3: 003.62.
- ^ Stroustrup, Bjarne (1994-03-29). Design und Entwicklung von C ++ (1. Aufl.). Addison-Wesley Publishing Company. ISBN 0-201-54330-3.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01017 / Name: 7 -Bit Dänemark". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01023 / Name: Spanienvariante". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01014 / Name: 7 -Bit -Spanien". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-10-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ a b "SBCS -Code -Seiteninformationen - CPGID: 01018 / Name: 7 -Bit Finnland / Schweden". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01010 / Name: 7 -Bit Frankreich". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01104 / Name: French NRC Set". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-21. Abgerufen 2016-06-21.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01013 / Name: 7 -Bit Großbritannien". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ a b ISO/TC 97/SC 2 (1975). Der Grafiksatz von Zeichen der internationalen Referenzversion von ISO 646 (PDF). Itcj/Ipsj. ISO-IR-2.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01009 / Name: ISO IRV". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1990-04-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ Foller, Antonin (2014) [2011]. "Westeuropäische (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01012 / Name: 7 -Bit Italien". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 00895 / Name: Japan 7 -Bit Latin". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1986-10-01. Archiviert vom Original am 2016-06-18. Abgerufen 2016-06-18.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01019 / Name: 7 -Bit Niederlande". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01016 / Name: 7 -Bit Norwegen". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ Foller, Antonin (2014) [2011]. "Norwegische (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01015 / Name: 7 -Bit -Portugal". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1987-08-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ Foller, Antonin (2014) [2011]. "Swedish (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 00367 / Name: ASCII". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1978-01-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ Foller, Antonin (2014) [2011]. "US -Ascii -Codierung - Windows -Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ a b BSI (1981-06-01). Alphanumeriker für ViewData und Rundfunk Teletetext (PDF). Itcj/Ipsj. ISO-IR-47.
- ^ a b ELOT (1984-07-01). Griechischer Charakter für die griechische Sprache (PDF). Itcj/Ipsj. ISO-IR-88.
- ^ a b c ECMA (1976). Lateingriechischer Grafiksatz (nur griechische Großbuchstaben) (PDF). Itcj/Ipsj. ISO-IR-27.
- ^ "SBCS -Code -Seiteninformationen - CPGID: 01021 / Name: Schweizvariante". IBM -Software: Globalisierung: codierte Zeichensätze und verwandte Ressourcen: Code Seiten nach CPGID: Code -Seiten -Kennungen. 1. IBM. 1992-10-01. Archiviert vom Original am 2016-06-17. Abgerufen 2016-06-17.
- ^ Sveriges standardiseringskommission (1975). NATS -Steuerelement für Zeitungstextübertragung (PDF). Itcj/Ipsj. ISO-IR-7.
- ^ Ansi (1975). ASCII -Grafikzeichensatz (PDF). Itcj/Ipsj. ISO-IR-6.
- ^ IBM (1990). "Code Seite 01009" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ Dansk standardiseringsråd (1993-01-21). ISO/IEC 646 Basic Character Set (PDF). Itcj/Ipsj. ISO-IR-170.
- ^ "15.6.1 Latin G0 Set", ETS 300 706: Verbesserte TeleText -Spezifikation (PDF), Europäische Telekommunikationsstandards Institute (ETSI), p. 114
- ^ Internationale Atomenergiebehörde (1981-07-15). ISO 646 Untereinsatz für Inis (PDF). Itcj/Ipsj. ISO-IR-49.
- ^ Internationale Telekommunikationsunion (1985-08-01). TeletEx Primärer Grafikzeichen (PDF). Itcj/Ipsj. ISO-IR-102.
- ^ Japanische Industriestandardskomitee (1975). Die japanische römische Grafik von Charakteren (PDF). Itcj/Ipsj. ISO-IR-14.
- ^ ISO/TC 97/SC 2 (1985-08-01). Japanische OCR-B Basic Grafic Character Set (PDF). Itcj/Ipsj. ISO-IR-92.
- ^ a b Lunde, Ken (2008). "3. Charakter-Set-Standards (§ CJKV-roman)". CJKV -Informationsverarbeitung (2. Aufl.). O'Reilly Media. S. 91–92. ISBN 9780596514471.
- ^ BSI (1975-12-01). Der Satz grafischer Zeichen des 7-Bit-Datencode des Vereinigten Königreichs (PDF). Itcj/Ipsj. ISO-IR-4.
- ^ IBM (1992). "Code Seite 01101" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ NSAI (1999-12-07). Variante des ISO 7-Bit-Codierten Zeichens für die irische gälische Sprache (PDF). Itcj/Ipsj. ISO-IR-207.
- ^ ECMA (1976). Variante des ISO 7-Bit-codierten Zeichensatzes (nur Grafiken) für die italienische Sprache (PDF). Itcj/Ipsj. ISO-IR-fünfzehn.
- ^ Afnor (1983-06-01). Jeu de Caractères Graphiques Français pour la langue français (PDF). Itcj/Ipsj. ISO-IR-69.
- ^ Afnor (1975). Französische Reihe grafischer Charaktere für die französische Sprache (PDF). Itcj/Ipsj. ISO-IR-25.
- ^ Standardsrat von Kanada (1986-02-01). Alternativer primärer Grafiksatz nr. 1 (PDF). Itcj/Ipsj. ISO-IR-121.
- ^ Standardsrat von Kanada (1986-02-01). Alternativer primärer Grafiksatz nr. 2 (PDF). Itcj/Ipsj. ISO-IR-122.
- ^ IBM (1992). "Code Seite 01021" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ LÄRM (1975). Deutsche Referenzversion des ISO 7-Bit-codierten Zeichensatzes (nur Grafiken) für die deutsche Sprache im Sinne des deutschen Standards DIN 66 003-Juni 1974 (PDF). Itcj/Ipsj. ISO-IR-21.
- ^ Sveriges standardiseringskommission (1975). Der schwedische grundlegende Grafiksatz von Zeichen (PDF). Itcj/Ipsj. ISO-IR-10.
- ^ Sveriges standardiseringskommission (1975). Die schwedische Grafikmenge von Charakteren für das offizielle Schreiben von Namen (PDF). Itcj/Ipsj. ISO-IR-11.
- ^ IBM (1992). "Code Seite 01106" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ IBM (1992). "Code Seite 01103" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ a b Sveriges standardiseringskommission (1975). Die Hauptgrafik -Grafik -Set von Charakteren für Zeitungstextübertragung in Finnland und Schweden (PDF). Itcj/Ipsj. ISO-IR-8-1.
- ^ IBM (1987). "Code Seite 01017" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ IBM (1992). "Code Seite 01105" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ IBM (1992). "Code Seite 01107" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ Norge Standardiseringforbund (1982-06-01). Norwegischer Standard NS 4551 - Version 1 (PDF). Itcj/Ipsj. ISO-IR-60.
- ^ a b c Dagienė, Valentina; Grigas, Gintautas; Jevsikova, Tatjana (2010). "3.2.2. ISO 646 Koduotė". Programme įrangos lokalizavimas (PDF) (auf Litauisch). Matematikos IR Informatikos Institutas. p. 67. ISBN 978-9986-680-47-5. (Hinweis: Die Diagramm, die manchmal angegeben ist, vermischt sich Brieffälle, z.B. ġ und ġ beide als ġ in der maltesischen Reihe oder ä und ä sowohl als Ä in den schwedischen Reihen erscheinen)
- ^ ECMA (1976). Variante des ISO 7-Bit-codierten Zeichensatzes (nur Grafiken) für die spanische Sprache (PDF). Itcj/Ipsj. ISO-IR-17.
- ^ ECMA (1984-07-01). Grafisches Zeichen für die spanischen Sprachen (PDF). Itcj/Ipsj. ISO-IR-85.
- ^ Úrad Pro Normalizaci A Měřeni (1989-07-01). Grafische Zeichenset der Republik Kuba (PDF). Itcj/Ipsj. ISO-IR-151.
- ^ ECMA (1976-12-30). Grafisches Zeichen für die portugiesische Sprache (PDF). Itcj/Ipsj. ISO-IR-16.
- ^ ECMA (1984-07-01). Grafisches Zeichen für die portugiesische Sprache (PDF). Itcj/Ipsj. ISO-IR-84.
- ^ Bundeseinrichtung für Standardisierung (1987-11-01). Serbocroatian und slowenisches lateinisches Alphabet (PDF). Itcj/Ipsj. ISO-IR-141.
- ^ IBM (1987). "Code Seite 01019" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ IBM (1992). "Code Seite 01102" (PDF). Registrierung: Grafische Zeichensätze und Codeseiten.
- ^ Ungarisches Büro für Standardisierung (1984-07-01). Ungarische Referenzversion von ISO 646 (HRV) (PDF). Itcj/Ipsj. ISO-IR-86.
- ^ TurkmenstandArtlary (2000-09-14). Turkmen -Alphabet (PDF). Itcj/Ipsj. ISO-IR-230.
- ^ a b ECMA (1976). Griechischer Grafiksatz (PDF). Itcj/Ipsj. ISO-IR-18.
- ^ ECMA (1976). Lateingriechter Grafiksatz (nur Großbuchstaben) (PDF). Itcj/Ipsj. ISO-IR-19.
- ^ "Karte (externe Version) vom Mac OS -Symbol Zeichen auf Unicode 4.0 und später".
- ^ "15.6.8: Griechisch G0 Set", ETS 300 706: Verbesserte TeleText -Spezifikation (PDF), Europäische Telekommunikationsstandards Institute (ETSI), p. 121
- ^ "15.6,5: Cyrillic G0 Set - Option 2 - Russisch/Bulgarisch", ETS 300 706: Verbesserte TeleText -Spezifikation (PDF), Europäische Telekommunikationsstandards Institute (ETSI), p. 118
- ^ "15.6.6: Cyrillic G0 Set - Option 3 - Ukrainisch", ETS 300 706: Verbesserte TeleText -Spezifikation (PDF), Europäische Telekommunikationsstandards Institute (ETSI), p. 119
- ^ "15.6.4: Cyrillic G0 Set - Option 1 - Serbisch/Kroatisch", ETS 300 706: Verbesserte TeleText -Spezifikation (PDF), Europäische Telekommunikationsstandards Institute (ETSI), p. 117
- ^ ASMO (1985-01-01). 7-Bit-codierter arabischer Charakter, der für den Informationsaustausch gesetzt ist (PDF). Itcj/Ipsj. ISO-IR-89.
Weitere Lektüre
- Fischer, Eric, hrsg. (1975) [1972]. Quelldokumente zur Geschichte der Charaktercodes, 1972–1975 (Zusammenstellung). Abgerufen 2020-06-07 Quelldokumente zur Geschichte der Charaktercodes, 1972-1975: Zusammengestellt von Eric Fischer: Kostenloser Download, Ausleihen und Streaming: Internetarchiv (79 Seiten) einschließlich: Bemer, Robert William (1972). "Ein Blick auf die Geschichte des ISO -Charakters". Honeywell Computer Journal. Phoenix, Arizona, USA: Honeywell Information Systems. 6 (4): 274–286, 287–291. (13+5 Seiten) und viele andere Dokumente und Korrespondenz.
Externe Links
- ISO/IEC 646: 1991 Informationstechnologie-ISO 7-Bit-codiertes Zeichen für den Informationsaustausch
- Zeichenensatz Nachs ISO 646 (ASCII) (auf Deutsch)
- Geschichte bei Gnu Aspell Webseite
- ISO646 Charakter Tabellen Charaktertabellen von Koichi Yasuoka (安岡孝) (sehen Inländische ISO646 -Charaktertische und Quasi-ISO646 Charaktertische)
- Türkischer Text Deasciifier Ein Tool (basierend auf der statistischen Pentagrammanalyse der türkischen Sprache), das einen ascii'fied türkischen Text zurückkehrt, indem die entsprechenden (aber mehrdeutigen) Diakritika festgelegt werden, die normalerweise im türkischen, aber im US-ASCII-Satz fehlt.