ISO 2033

Das ISO 2033: 1983 Standard ("Codierung von maschinenlesbaren Zeichen (mic und OCR)")[1] Definiert Zeichensätze zum Gebrauch mit Optische Zeichenerkennung oder Magnetische Tintenzeichenerkennung Systeme. Der japanische Standard JIS X 9010: 1984 ("Codierung von maschinenlesbaren Zeichen (OCR und mic)", ursprünglich bezeichnet JIS C 6229-1984) ist eng verwandt.[2]

Charakter-Set für OCR-A

Die Version der Codierung für die OCR-A-Schrift registriert mit dem ISO-IR Registrierung als ISO-IR-91 ist die japanische (jis x 9010 / jis c 6229) -Version, die sich von der durch ISO 2033 definierten Codierung nur unter Hinzufügen von a unterscheidet Yen Zeichen bei 5c.[2]

ISO 2033 und JIS C 6229 OCR-A SET
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x Nul Soh Stx ETX Eot Enq Ack Bel BS Ht Lf Vt Ff Cr ALSO Si
1x Dle DC1 DC2 DC3 DC4 Nak Syn ETB KANN Em Sub ESC Fs Gs Rs UNS
2x  Sp  " £
00A3
$ % & ' {
007b
}
007d
* + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ;
2440
=
2441
?
4x A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z ¥
00A5

2442
6x
7x | Del
 Neu definiert im Vergleich zu Jis-roman

Zeichensatz für OCR-B

Die Version der G0 -Set für die OCR-B-Schrift registriert mit dem ISO-IR Registrierung als ISO-IR-92 ist die japanische (jis x 9010 / jis c 6229) -Version, die sich von der durch ISO 2033 definierten Codierung nur in der Basis von Basis unterscheidet Jis-roman (mit einer Dollarzeichen bei 0x24 und a Yen Zeichen bei 0x5c) und nicht auf der ISO 646 IRV (mit a Backslash bei 0x5c und zu dieser Zeit a Universelles Währungszeichen (¤) bei 0x24).[3] Neben diesen Codepunkten unterscheidet es sich von ASCII Nur beim Weglassen der Backtick (`) und Tilde (~).[3] Ein zusätzlicher zusätzlicher Satz registriert als ISO-IR-93 weist die zu Pfund-Zeichen (£), universelles Währungszeichen (¤) und Abschnittszeichen (§) zu ihren ISO-8859-1 Codepoint und der Backslash zum ISO-8859-1 CodePoint für das Yen-Zeichen.[4]

Zeichen für JIS x 9008 (JIS C 6257)

JIS X 9010 (JIS C 6229) definiert auch Zeichensätze für die JIS X 9008: 1981 (ehemals JIS C 6257-1981) "handgedruckte" OCR-Schriftart.[5]: Fn1 Dazu gehören Untergruppen der Jis x 0201 Römisches Set (registriert als ISO-IR-94 und weglassen Backtick (`), Kleinbuchstaben, Geschweifte Klammern ({,}) und Überlinie (‾)),[5] und Kana -Set (registriert als ISO-IR-96 und das Ostasiatische Komma (、) und den vollen Stopp (。) weglassen, die Interpunkt (・) Und das kleine Kana),[6] Zusätzlich zu einem Satz (registriert als ISO-IR-95) enthält nur den Backslash, der demselben Codepunkt wie in ISO-IR-93 zugeordnet ist.[7]

Der JIS C 6527 -Schriftart stylen den Schrägstrich[5] und Backslash[7] Charaktere mit einem doppelten Aussehen. Die angegebenen Charakternamen sind "Solidus"[5] und "Reverse Solidus",[7] Übereinstimmung mit den Unicode -Zeichennamen für den ASCII -Schrägstrich und den Backslash.[8] Der Unicode Optische Zeichenerkennung Block enthält einen zusätzlichen Codepunkt für einen "OCR Double Backslash" (⑊), obwohl nicht für einen Doppel (vorwärts) Schrägstriche,[9] Obwohl ein doppelter Schrägstrich anderswo erhältlich ist wie U+2AFD Doppeler Solidus -Operator.

Zeichen für E-13b festgelegt

Die mic-E-13B-Schriftart, die das ISO-IR-98-Charakterrepertoire zeigt.

Das ISO-IR-98 Codierung durch ISO 2033 codiert das Charakterrepertoire der E13B Schriftart, wie verwendet mit Magnetische Tintenzeichenerkennung.[10] Obwohl ISO 2033 auch andere Codierungen angibt, ist die Codierung für E-13b die Codierung als als ISO_2033_1983 durch Perl Libintl,[11] und wie ISO_2033-1983 oder csISO2033 bis zum Iana.[12] Andere registrierte Etiketten umfassen iso-ir-98, es ist ISO-IR Registrierungsnummer und einfach e13b.[12]

Die Ziffern sind in ihren erhalten ASCII Standorte. Buchstaben und Symbole, die in der E13B -Schriftart nicht verfügbar sind Bankschecks In der E13B -Schrift wird hinzugefügt. Die gleichen Symbole sind in erhältlich Unicode in dem Optischer Charaktererkennungsblock.

ISO 2033: 1983 E-13B Set[11]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x Nul Soh Stx ETX Eot Enq Ack Bel BS Ht Lf Vt Ff Cr ALSO Si
1x Dle DC1 DC2 DC3 DC4 Nak Syn ETB KANN Em Sub ESC Fs Gs Rs UNS
2x  Sp 
3x 0 1 2 3 4 5 6 7 8 9
2446

2447

2448

2449
4x
5x
6x
7x Del
 Neu definiert im Vergleich zu ASCII

Verweise

  1. ^ ISO/IEC JTC 1/SC 2 (1983). Informationsverarbeitung - Codierung von maschinenlesbaren Zeichen (MICR und OCR). ISO. ISO 2033: 1983.
  2. ^ a b ISO/TC97/SC2 (1985-08-01). ISO-IR-91: Japanisches OCR-A-Grafikzeichensatz (PDF). Itcj/Ipsj.
  3. ^ a b ISO/TC97/SC2 (1985-08-01). ISO-IR-92: Japanische OCR-B Basic Grafic Character Set (PDF). Itcj/Ipsj.
  4. ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-93: Japanisches OCR-B-Zusätzlicher Grafikzeichensatz (PDF). Itcj/Ipsj.
  5. ^ a b c d ISO/TC97/SC2 (1985-08-01). ISO-IR-94: Japanische grundlegende handgedruckte Grafikzeichen für OCR (PDF). Itcj/Ipsj.
  6. ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-96: Katakana handgedruckter Grafikzeichen für OCR (PDF). Itcj/Ipsj.
  7. ^ a b c ISO/TC97/SC2 (1985-08-01). ISO-IR-95: Japaner zusätzlicher handgedruckter Grafikzeichen für OCR (PDF). Itcj/Ipsj.
  8. ^ Unicode -Konsortium. "C0 -Kontrollen und Grundlatein" (PDF). Der Unicode -Standard.
  9. ^ Unicode -Konsortium. "Optische Zeichenerkennung" (PDF). Der Unicode -Standard.
  10. ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-98: Ein Satz von 14 grafischen Zeichen der E13B-Schriftart (PDF). Itcj/Ipsj.
  11. ^ a b Flohr, Guido. "Conversion Routinen für ISO_2033_1983". libintl. Locale :: Recodedata :: ISO_2033_1983.
  12. ^ a b "Charaktersätze". Iana.

Externe Links