ARIB STD B24 Zeichensatz

ARIB STB-B24 Codierung
Standard ARIB STB-B24 Volumen 1
Einstufung ISO 2022 Profil/Erweiterung
Transformationen / codiert ARIB STB-B24 Kanji, Kana und Mosaik, Sets,
Jis x 0201
ARIB STB-B24 Kanji Set
ARIB Extended Font (Weather Symbols) ja.svg
Wettersymbole: Einige der erweiterten Symbole enthalten.
Sprachen) japanisch, Englisch, Russisch
Teilweise Unterstützung: griechisch, Chinesisch
Standard ARIB STB-B24 Volumen 1
Einstufung ISO-2022-strukturiert CJK DBCs
Erweitert Jis x 0208
Codierungsformate
  • ARIB STB-B24-Codierung (ISO 2022 basiert)
  • Schicht jis (Arib -Variante)[1]

Band 1 der Verband der Radioindustrien und Unternehmen (EINE RIPPE) STD-B24-Standard für Sendung Markup -Sprache[2] Gibt unter anderem a an a Zeichenkodierung zum Einsatz in japanischsprachiger Rundfunk. Es wurde eingeführt 1999-10-26.[2] Die neueste Revision ist Version 6.3 ab 2016-07-06.

Es enthält eine Reihe von einer Reihe von ARIB erweiterte Charaktere (ARIB外字, ARIB gaiji) nicht in den Basisstandards gefunden (Jis x 0208 und Jis x 0201). Es war der Quellstandard für viele Symbolzeichen, die hinzugefügt wurden Unicode, einschließlich Teilen der Verschiedene Symbole, Beigefügte alphanumerische Ergänzung und Geschlossene ideografische Ergänzung Blöcke.[3] Seine Beiträge überschneiden sich teilweise den Unicode Emoji, wurden aber ein Jahr zuvor in Unicode 5.2 hinzugefügt.[4]

Faszikel 1 des 2014 veröffentlichten ARIB STD-B62-Standards definiert Unicode-Zuordnungen für eine Auswahl der erweiterten Zeichen der B24 (ohne beispielsweise diejenigen, die von dupliziert werden von Jis x 0213) sowie ein paar erweiterte Kanji.[5] Es enthält auch eine Zuordnung von verwendeten Zeichen außerhalb der Grundlegende mehrsprachige Ebene zu den BMPs Privatnutzungsbereich.

Sätze und Codes

Der ARIB STD B24 -Standard definiert mehrere Zeichensätze und eine Methode zum Umschalten zwischen ihnen. Dazu gehören ein Kanji -Set (eine Erweiterung von Jis x 0208), ein alphanumerisches Set, ein Hiragana -Set, Katakana -Sets von zwei unterschiedlichen Layouts und vier Mosaik- Sets.[6] Die Sets werden mit Verwendung ausgewählt ISO 2022 Mechanismen für 94 Sätze unter Verwendung der folgenden Codes (proportionale Sets verwenden das gleiche Layout wie die entsprechenden nicht proportionalen):[7]

Satz Typ Code (Spalte/Zeile) Code (Hexadezimal) Code (ASCII -Zeichen) Kommentare
Kanji 2-byte 4/2 42 B Der Fluchtcode B verwendet für das Arib Kanji -Set[7] wird für die 1983er Version von JIS C 6226 (Jis x 0208, von denen das Arib Kanji -Set eine Erweiterung ist) in ISO-2022-JP.[8][9]
Alphanumerisch 1-byte 4/10 4a J Jis_c6220-ro (ISO646-JP, Jis x 0201 Römisches Set). Ähnlich wie ASCII, wobei zwei Zuordnungen unterschiedlich sind. Fluchtcode J Übereinstimmung mit der Verwendung in ISO-2022-JP.[9]
Proportionaler Alphanumerikum 1-byte 3/6 36 6
Hiragana 1-byte 3/0 30 0 Hiragana selbst folgt dem gleichen Layout wie Reihe 4 von JIS X 0208, jedoch ohne Lead -Byte. Fügt auch mehrere zusätzliche Zuordnungen für die Interpunktion hinzu.
Proportionaler Hiragana 1-byte 3/7 37 7
Katakana 1-byte 3/1 31 1 Katakana selbst folgt dem gleichen Layout wie Reihe 5 von JIS X 0208, jedoch ohne Lead -Byte. Fügt auch mehrere zusätzliche Zuordnungen für die Interpunktion hinzu.
Proportionaler Katakana 1-byte 3/8 38 8
Jis x 0201 Katakana 1-byte 4/9 49 I JIS_C6220-JP (JIS X 0201 KANA SET). Escape Code entspricht der Verwendung in ISO-2022-JP-3.
Mosaik a 1-byte 3/2 32 2 Pseudographie
Mosaik b 1-byte 3/3 33 3
Mosaik c 1-byte 3/4 34 4 Nicht-Abstands-Pseudographie
Mosaik d 1-byte 3/5 35 5

Codediagramme

Kanji (Doppelbyte) Set

Dies ist ein Doppel-Byte-Zeichensatz, der sich erstreckt Jis x 0208.

Lead -Byte

Die Codierungsbytes entsprechen der Zeile oder Zellnummer plus 0x20 oder 32 in Dezimalal (siehe unten). Daher hat der Code -Satz mit 0x21 eine Zeilenzahl von 1 und seine Zelle 1 hat ein Fortsetzungsbyte von 0x21 (oder 33) und so weiter. Der größte Teil des Codes entspricht JIS X 0208.

ARIB STD-B24 Kanji (Double-Byte) Set (Lead Bytes)
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x  Sp  1-_ 2-_ 3-_ 4 -_ 5 -_ 6 -_ 7-_ 8 -_ 9 -_ 10-_ 11-_ 12-_ 13-_ 14-_ fünfzehn-_
3x 16-_ 17-_ 18-_ 19-_ 20-_ 21-_ 22-_ 23-_ 24 -_ 25 -_ 26-_ 27-_ 28-_ 29-_ 30-_ 31-_
4x 32-_ 33 -_ 34 -_ 35-_ 36 -_ 37-_ 38 -_ 39-_ 40-_ 41-_ 42-_ 43-_ 44 -_ 45-_ 46 -_ 47-_
5x 48 -_ 49-_ 50-_ 51-_ 52-_ 53-_ 54 -_ 55-_ 56 -_ 57-_ 58 -_ 59-_ 60-_ 61-_ 62-_ 63-_
6x 64-_ 65-_ 66-_ 67-_ 68-_ 69-_ 70-_ 71-_ 72-_ 73-_ 74-_ 75-_ 76 -_ 77-_ 78 -_ 79-_
7x 80-_ 81-_ 82-_ 83-_ 84-_ 85-_ 86-_ 87-_ 88 -_ 89-_ 90-_ 91-_ 92-_ 93-_ 94-_ Del
 Unbenutzte Blei Byte
 Lead -Byte
 Unterschiede zu JIS x 0208

Zeichensätze 0x21-0x74 (Zeilennummern 1-84: Interpunktion, Alphabete, Zahlen, Kana, Kanji)

Zeichensatz 0x7a (Zeilennummer 90, Verkehrsymbole)

Die Zeichen 90-45 bis 90-63 und 90-66 bis 90-84 (siehe unten schattiert) sind im B24-Standard nur in Tabelle 7-10 (der Liste der Erweiterungszeichen) aufgeführt und sind auch die einzigen Zeichen in Zeilen 90 bis 91, die keine transportbezogenen Symbole sind; Dies ist im B24-Standard in einer Endnote zu Tabelle 7-10 festgestellt.[10] Der Rest der Erweiterungen ist sowohl in Tabelle 7-4 (dem Doppel-Byte-Code-Diagramm) als auch in Tabelle 7-10 aufgeführt.[10]

ARIB STD-B24 Kanji (Double-Byte) Set (vorangestellt mit 0x7a)[5][11]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x
26cc

26CD
❗︎
2757

26cf

26d0

26d1

26d2

26d5

26d3
⛔︎
26d4
3x
1f17f

1f18a

26d6

26d7

26d8

26d9

26da

26 dB

26dc

26dd

26de

26df

26e0

26e1
4x ⭕︎
2B55

3248

3249

324a

324b

324c

324d

324e

324f

2491

2492

2493
5x
1f14a

1f14c

1f13f

1f146

1f14b

1f210

1f211

1f212

1f213

1f142

1f214

1f215

1f216

1f14d

1f131

1f13d
6x ⬛︎
2b1b

2B24

1f217

1f218

1f219

1f21a

1f21b

26bf

1f21c

1f21d

1f21e

1f21f

1f220

1f221

1f222

1f223
7x
1f224

1f225

1f14e

3299

1f200
 Ergänzungen aus Tabelle 7-10 nicht in Tabelle 7-4.

Zeichensatz 0x7b (Zeilennummer 91, Kartensymbole)

Zeichen aus ARIB STD-B24, die in ARIB STD-B62 nicht beibehalten wurden, werden beschattet.

ARIB STD-B24 Kanji (Double-byte) Set (vorangestellt mit 0x7b)[5][11][12]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x
26e3

2B56

2B57

2B58

2B59

2613

328b

3012

26e8

3246

3245

26e9
[a]
0fd6
⛪︎
26a

26EB
3x
26ec

2668

26ed

26ee

26ef
⚓︎
2693

2708

26f0

26f1
⛲︎
26f2
⛳︎
26f3

26f4
⛵︎
26f5

1f157

24b9

24c8
4x
26f6

1f15f

1f18b

1f18d

1f18c

1f179

26f7

26f8

26f9
⛺︎
26fa

1f17b

260e

26fb

26fc
⛽︎
26fd

26FE
5x
1f17c

26ff
6x
7x
 Nicht in ARIB STD-B62

Zeichensatz 0x7c (Zeilennummer 92, Einheiten, geschlossene Formulare, Listenmarkierungen, Pfeile)

Zeichen aus ARIB STD-B24, die in ARIB STD-B62 nicht beibehalten wurden, werden beschattet.

ARIB STD-B24 Kanji (Double-Byte) Set (vorangestellt mit 0x7c)[5][11][12]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x
27a1

2B05

2B06

2B07

2b2f

2B2E

5e74

6708

65e5

5186

33A1

33A5

339d

33A0

33A4
3x
1f100

2488

2489

248a

248b

248c

248d

248e

248f

2490
[b] [b] [b] [b] [b] [b]
4x
1f101

1f102

1f103

1f104

1f105

1f106

1f107

1f108

1f109

1f10a

3233

3236

3232

3231

3239

3244
5x
25b6

25c0

3016

3017

27d0
²
00B2
³
00B3

1f12d
(VN)[c] (OB)[c] (CB)[c] (CE[c] mb)[c] (HP)[c] (BR)[c] (p)[c]
6x (s)[c] (Frau)[c] (t)[c] (BS)[c] (b)[c] (TB)[c] (TP)[c] (ds)[c] (AG)[c] (z.B)[c] (vo)[c] (FL)[c] (ke[c] y)[c] (sa[c] x)[c]
7x (Sy[c] n)[c] (oder[c] g)[c] (Sport[c] r)[c]
1f12c

1f12b

3247

1f190

1f226

213b
 Nicht in ARIB STD-B62

Zeichensatz 0x7d (Zeilennummer 93, Spiel- und Wettersymbole, Brüche, Einheiten, geschlossene Formen)

Zeichen aus ARIB STD-B24, die in ARIB STD-B62 nicht beibehalten wurden, werden beschattet.

ARIB STD-B24 Kanji (Double-Byte) Set (vorangestellt mit 0x7d)[5][11][12]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x
322a

322b

322c

322d

322e

322f

3230

3237

337e

337d

337c

337b

2116

2121

3036
3x ⚾︎
26be

1f240

1f241

1f242

1f243

1f244

1F245

1f246

1f247

1f248

1f12a

1f227

1f228

1f229

1f214

1f22a
4x
1f22b

1f22c

1f22d

1f22e

1f22f

1f230

1f231

2113

338f

3390

33ca

339e

33A2

3371
5x ½
00bd

2189

2153

2154
¼
00BC
¾
00be

2155

2156

2157

2158

2159

215a

2150

215b

2151

2152
6x
2600

2601

2602
⛄︎
26c4

2616

2617

26c9

26ca

2666

2665

2663

2660

26CB

2a00

203c

2049
7x ⛅︎
26c5
☔︎
2614

26c6

2603

26c7
⚡︎
26a1

26c8

269e

269f

266c

260e
 Nicht in ARIB STD-B62

Zeichensatz 0x7e (Zeilennummer 94, Listenmarkierungen)

Zeichen aus ARIB STD-B24, die in ARIB STD-B62 nicht beibehalten wurden, werden beschattet.

ARIB STD-B24 Kanji (Double-byte) Set (vorangestellt mit 0x7e)[5][11][12]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x
2160

2161

2162

2163

2164

2165

2166

2167

2168

2169

216a

216b

2470

2471

2472
3x
2473

2474

2475

2476

2477

2478

2479

247a

247b

247c

247d

247e

247f

3251

3252

3253
4x
3254

1f110

1f111

1f112

1f113

1f114

1f115

1f116

1f117

1f118

1f119

1f11a

1f11b

1f11c

1f11d

1f11e
5x
1f11f

1f120

1f121

1f122

1f123

1f124

1f125

1f126

1f127

1f128

1f129

3255

3256

3257

3258

3259
6x
325a

2460

2461

2462

2463

2464

2465

2466

2467

2468

2469

246a

246B

246c

246d

246e
7x
246f

2776

2777

2778

2779

277a

277b

277c

277d

277e

277f

24EB

24ec

325b
 Nicht in ARIB STD-B62

Single-Byte-Sets

Alphanumerischer Set

ARIB STD-B24 Alphanumeric Set[14]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x !
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002a
+
002b
,
002c
-
002d
.
002e
/
002f
3x 0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003a
;
003b
<
003c
=
003d
>
003e
?
003f
4x @
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
I
0049
J
004a
K
004b
L
004c
M
004d
N
004e
O
004f
5x P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005a
[
005b
¥
00A5
]
005d
^
005e
_
005f
6x `
0060
a
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
i
0069
j
006a
k
006b
l
006c
m
006d
n
006e
o
006f
7x p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007a
{
007b
|
007c
}
007d

203e
 Unterschiede aus US-Ascii

Hiragana Set

ARIB STD-B24 Hiragana Set[15]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x
3041

3042

3043

3044

3045

3046

3047

3048

3049

304a

304b

304c

304d

304e

304f
3x
3050

3051

3052

3053

3054

3055

3056

3057

3058

3059

305a

305b

305c

305d

305e

305f
4x
3060

3061

3062

3063

3064

3065

3066

3067

3068

3069

306a

306b

306c

306d

306e

306f
5x
3070

3071

3072

3073

3074

3075

3076

3077

3078

3079

307a

307b

307c

307d

307e

307f
6x
3080

3081

3082

3083

3084

3085

3086

3087

3088

3089

308a

308b

308c

308d

308e

308f
7x
3090

3091

3092

3093

309d

309e

30fc

3002

300c

300d

3001

30fb
 Charakterzuweisungen nicht folgen Zeile 4 von JIS x 0208

Katakana Set

ARIB STD-B24 Katakana Set[16]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x
30a1

30a2

30a3

30A4

30A5

30a6

30a7

30a8

30a9

30aa

30AB

30AC

30ad

30a

30af
3x
30b0

30b1

30b2

30b3

30b4

30b5

30b6

30b7

30b8

30b9

30ba

30bb

30BC

30bd

30be

30bf
4x
30c0

30c1

30c2

30c3

30c4

30c5

30c6

30c7

30c8

30c9

30ca

30cb

30cc

30cd

30ce

30cf
5x
30d0

30d1

30d2

30d3

30d4

30d5

30d6

30d7

30d8

30d9

30da

30 dB

30dc

30dd

30de

30df
6x
30e0

30e1

30e2

30e3

30e4

30e5

30e6

30e7

30e8

30e9

30ea

30EB

30EC

30ed

30ee

30ef
7x
30f0

30f1

30f2

30f3

30f4

30f5

30f6

30fd

30FE

30fc

3002

300c

300d

3001

30fb
 Charakterzuweisungen nicht folgen Zeile 5 von JIS x 0208

Jis x 0201 Katakana Set

ARIB STD-B24 JIS X 0201 Katakana Set[17]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
2x
Ff61

FF62

Ff63

Ff64

Ff65

Ff66

Ff67

Ff68

Ff69

Ff6a

Ff6b

Ff6c

Ff6d

Ff6e

Ff6f
3x
Ff70

Ff71

FF72

Ff73

Ff74

FF75

Ff76

Ff77

Ff78

FF79

Ff7a

Ff7b

Ff7c

Ff7d

Ff7e
ソ
Ff7f
4x
Ff80

Ff81

Ff82

Ff83

Ff84

Ff85

Ff86

Ff87

Ff88

Ff89

Ff8a

Ff8b

Ff8c

Ff8d

Ff8e

Ff8f
5x
Ff90

Ff91

Ff92

Ff93

Ff94

Ff95

Ff96

Ff97

Ff98

Ff99

Ff9a

Ff9b

Ff9c

Ff9d

Ff9e

Ff9f
6x
7x

Mosaik -Sets

Shift_jis Variante

Zusätzlich zur modifizierten ISO 2022 -Codierung gibt der B24 -Standard auch a an Schicht jis Codierung nach JIS X 0208: 1997, aber mit der Zugabe der erweiterten Zeichen im Kanji -Set.[1]

Erster Byte
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0
1
2 ! " # $ % & '' ( )) * + Anwesend - . /
3 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4 @ EIN B C D E F G H ich J K L M N Ö
5 P Q R S T U V W X Y Z [ ¥ ] ^ _
6 ` a b c d e f g h ich j k l m n Ö
7 p q r s t u v w x y z { | }
8
9
EIN
B ソ
C
D
E
F
Zweites Byte
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0
1
2
3
4
5
6
7
8
9
EIN
B
C
D
E
F
 
Nicht druckbarer ASCII -Zeichen
Unveränderter ASCII -Charakter
Modifiziertes ASCII -Zeichen
Single-Byte-Halbbreite Katakana
Erster Byte eines Doppel-Byte-Charakters, der von Jis x 0208 verwendet wird
Erster Byte eines ARIB -erweiterten Charakters
Nicht als erster Byte verwendet, nicht zugewiesener Raum in JIS x 0208
Nicht als erster Byte verwendet
Zweiter Byte eines Doppel-Byte-Charakters, dessen erste Hälfte der JIS-Sequenz ungerade war
Zweiter Byte eines Doppel-Byte-Charakters, dessen erste Hälfte der JIS-Sequenz gerade war
Ungenutzt als zweiter Byte eines Doppelbyte-Charakters


Siehe auch

Fußnoten

  1. ^ Glänzend als "Tempel" (d. H. buddhistischer Tempel) in B24 Tabelle 7-10 (die Liste der Erweiterungszeichen).
  2. ^ a b c d e f Kleine Form (70% Größe pro Codediagramm / Tabelle 7-10) eines Kanji-Zeichens. Hier simuliert gezeigt. Privatnutzungsbereich Die angezeigten Codepunkte sind diejenigen, die von der Nishiki-Teki-Schriftart verwendet werden.[13]
  3. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab AC Anzeige Musikalische Abkürzung (oder die Hälfte davon), die nicht in Unicode vorhanden ist, simuliert hier mit mehreren Zeichen. Privatnutzungsbereich Die angezeigten Codepunkte sind diejenigen, die von der Nishiki-Teki-Schriftart verwendet werden.

Verweise

  1. ^ a b Arib (2008), p. 105, Teil 2, Abschnitt 7.3
  2. ^ a b Arib (2008)
  3. ^ Suignard, Michel (2008-03-11). "ISO/IEC JTC1/SC2/WG2 N 3397: Japanische Fernsehsymbole" (PDF).
  4. ^ "Unicode 5.2 Emoji -Liste". Emojipedia.
  5. ^ a b c d e f Arib (2014), S. 33–50, Teil 2, Tabelle 5-2
  6. ^ Arib (2008), S. 48–52
  7. ^ a b Arib (2008), p. 39, Teil 2, Tabelle 7-3
  8. ^ Japanischer Nationalkomitee für ISO/TC97/SC2 (1984-07-01). Japanischer Grafikzeichen für den Informationsaustausch (PDF). Itcj/Ipsj. ISO-IR-87.
  9. ^ a b RFC 1468 (IETF)
  10. ^ a b Arib (2008), p. 72
  11. ^ a b c d e Arib (2008), S. 54–72, Teil 2, Tabelle 7-10
  12. ^ a b c d Arib (2008), S. 46–47, Teil 2, Tabelle 7-4
  13. ^ "Nishiki-Teki Version 3.82b (2021-07-23)-6.416 Zeichen in den privaten Gebrauchsbereichen" (PDF).
  14. ^ Arib (2008), p. 48, Teil 2, Tabelle 7-5
  15. ^ Arib (2008), p. 50, Teil 2, Tabelle 7-7
  16. ^ Arib (2008), p. 49, Teil 2, Tabelle 7-6
  17. ^ Arib (2008), p. 52, Teil 2, Tabelle 7-9

Weitere Lektüre

Externe Links