ISO 2033
Das ISO 2033: 1983 Standard ("Codierung von maschinenlesbaren Zeichen (mic und OCR)")[1] Definiert Zeichensätze zum Gebrauch mit Optische Zeichenerkennung oder Magnetische Tintenzeichenerkennung Systeme. Der japanische Standard JIS X 9010: 1984 ("Codierung von maschinenlesbaren Zeichen (OCR und mic)", ursprünglich bezeichnet JIS C 6229-1984) ist eng verwandt.[2]
Charakter-Set für OCR-A
Die Version der Codierung für die OCR-A-Schrift registriert mit dem ISO-IR Registrierung als ISO-IR-91 ist die japanische (jis x 9010 / jis c 6229) -Version, die sich von der durch ISO 2033 definierten Codierung nur unter Hinzufügen von a unterscheidet Yen Zeichen bei 5c.[2]
ISO 2033 und JIS C 6229 OCR-A SET | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Soh | Stx | ETX | Eot | Enq | Ack | Bel | BS | Ht | Lf | Vt | Ff | Cr | ALSO | Si |
1x | Dle | DC1 | DC2 | DC3 | DC4 | Nak | Syn | ETB | KANN | Em | Sub | ESC | Fs | Gs | Rs | UNS |
2x | Sp | " | £ 00A3 | $ | % | & | ' | { 007b | } 007d | * | + | , | - | . | / | |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | ⑀ 2440 | = | ⑁ 2441 | ? |
4x | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | ¥ 00A5 | ⑂ 2442 | |||
6x | ||||||||||||||||
7x | | | Del |
Zeichensatz für OCR-B
Die Version der G0 -Set für die OCR-B-Schrift registriert mit dem ISO-IR Registrierung als ISO-IR-92 ist die japanische (jis x 9010 / jis c 6229) -Version, die sich von der durch ISO 2033 definierten Codierung nur in der Basis von Basis unterscheidet Jis-roman (mit einer Dollarzeichen bei 0x24 und a Yen Zeichen bei 0x5c) und nicht auf der ISO 646 IRV (mit a Backslash bei 0x5c und zu dieser Zeit a Universelles Währungszeichen (¤) bei 0x24).[3] Neben diesen Codepunkten unterscheidet es sich von ASCII Nur beim Weglassen der Backtick (`) und Tilde (~).[3] Ein zusätzlicher zusätzlicher Satz registriert als ISO-IR-93 weist die zu Pfund-Zeichen (£), universelles Währungszeichen (¤) und Abschnittszeichen (§) zu ihren ISO-8859-1 Codepoint und der Backslash zum ISO-8859-1 CodePoint für das Yen-Zeichen.[4]
Zeichen für JIS x 9008 (JIS C 6257)
JIS X 9010 (JIS C 6229) definiert auch Zeichensätze für die JIS X 9008: 1981 (ehemals JIS C 6257-1981) "handgedruckte" OCR-Schriftart.[5]: Fn1 Dazu gehören Untergruppen der Jis x 0201 Römisches Set (registriert als ISO-IR-94 und weglassen Backtick (`), Kleinbuchstaben, Geschweifte Klammern ({,}) und Überlinie (‾)),[5] und Kana -Set (registriert als ISO-IR-96 und das Ostasiatische Komma (、) und den vollen Stopp (。) weglassen, die Interpunkt (・) Und das kleine Kana),[6] Zusätzlich zu einem Satz (registriert als ISO-IR-95) enthält nur den Backslash, der demselben Codepunkt wie in ISO-IR-93 zugeordnet ist.[7]
Der JIS C 6527 -Schriftart stylen den Schrägstrich[5] und Backslash[7] Charaktere mit einem doppelten Aussehen. Die angegebenen Charakternamen sind "Solidus"[5] und "Reverse Solidus",[7] Übereinstimmung mit den Unicode -Zeichennamen für den ASCII -Schrägstrich und den Backslash.[8] Der Unicode Optische Zeichenerkennung Block enthält einen zusätzlichen Codepunkt für einen "OCR Double Backslash" (⑊), obwohl nicht für einen Doppel (vorwärts) Schrägstriche,[9] Obwohl ein doppelter Schrägstrich anderswo erhältlich ist wie U+2AFD ⫽ Doppeler Solidus -Operator.
Zeichen für E-13b festgelegt
Das ISO-IR-98 Codierung durch ISO 2033 codiert das Charakterrepertoire der E13B Schriftart, wie verwendet mit Magnetische Tintenzeichenerkennung.[10] Obwohl ISO 2033 auch andere Codierungen angibt, ist die Codierung für E-13b die Codierung als als ISO_2033_1983
durch Perl Libintl,[11] und wie ISO_2033-1983
oder csISO2033
bis zum Iana.[12] Andere registrierte Etiketten umfassen iso-ir-98
, es ist ISO-IR Registrierungsnummer und einfach e13b
.[12]
Die Ziffern sind in ihren erhalten ASCII Standorte. Buchstaben und Symbole, die in der E13B -Schriftart nicht verfügbar sind Bankschecks In der E13B -Schrift wird hinzugefügt. Die gleichen Symbole sind in erhältlich Unicode in dem Optischer Charaktererkennungsblock.
ISO 2033: 1983 E-13B Set[11] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Soh | Stx | ETX | Eot | Enq | Ack | Bel | BS | Ht | Lf | Vt | Ff | Cr | ALSO | Si |
1x | Dle | DC1 | DC2 | DC3 | DC4 | Nak | Syn | ETB | KANN | Em | Sub | ESC | Fs | Gs | Rs | UNS |
2x | Sp | |||||||||||||||
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ⑆ 2446 | ⑇ 2447 | ⑈ 2448 | ⑉ 2449 | ||
4x | ||||||||||||||||
5x | ||||||||||||||||
6x | ||||||||||||||||
7x | Del |
Verweise
- ^ ISO/IEC JTC 1/SC 2 (1983). Informationsverarbeitung - Codierung von maschinenlesbaren Zeichen (MICR und OCR). ISO. ISO 2033: 1983.
- ^ a b ISO/TC97/SC2 (1985-08-01). ISO-IR-91: Japanisches OCR-A-Grafikzeichensatz (PDF). Itcj/Ipsj.
- ^ a b ISO/TC97/SC2 (1985-08-01). ISO-IR-92: Japanische OCR-B Basic Grafic Character Set (PDF). Itcj/Ipsj.
- ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-93: Japanisches OCR-B-Zusätzlicher Grafikzeichensatz (PDF). Itcj/Ipsj.
- ^ a b c d ISO/TC97/SC2 (1985-08-01). ISO-IR-94: Japanische grundlegende handgedruckte Grafikzeichen für OCR (PDF). Itcj/Ipsj.
- ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-96: Katakana handgedruckter Grafikzeichen für OCR (PDF). Itcj/Ipsj.
- ^ a b c ISO/TC97/SC2 (1985-08-01). ISO-IR-95: Japaner zusätzlicher handgedruckter Grafikzeichen für OCR (PDF). Itcj/Ipsj.
- ^ Unicode -Konsortium. "C0 -Kontrollen und Grundlatein" (PDF). Der Unicode -Standard.
- ^ Unicode -Konsortium. "Optische Zeichenerkennung" (PDF). Der Unicode -Standard.
- ^ ISO/TC97/SC2 (1985-08-01). ISO-IR-98: Ein Satz von 14 grafischen Zeichen der E13B-Schriftart (PDF). Itcj/Ipsj.
- ^ a b Flohr, Guido. "Conversion Routinen für ISO_2033_1983". libintl. Locale :: Recodedata :: ISO_2033_1983.
- ^ a b "Charaktersätze". Iana.
Externe Links
- ISO 2033 von ISO verteilt
- Jis x 9010 vertrieben von Afnor