Code page
Im Computer, a Codepage ist ein Zeichenkodierung und als solches handelt es sich um eine spezifische Assoziation einer Reihe von druckbaren Figuren und Steuerzeichen mit einzigartigen Zahlen. Typischerweise repräsentiert jede Zahl den binären Wert in einem einzigen Byte. (In einigen Kontexten werden diese Begriffe genauer verwendet; siehe Zeichencodierung § Zeichensätze, Zeichenkarten und Codeseiten.))
Der Begriff "Code -Seite" stammt aus IBM's Ebcdic-basierte Mainframe -Systeme,[1] aber Microsoft, SAFT,[2] und Oracle Corporation[3] gehören zu den wenigen Anbietern, die diesen Begriff verwenden. Die Mehrheit der Anbieter identifiziert ihre eigenen Charakter -Sets mit einem Namen. In dem Fall, wenn es eine Vielzahl von Zeichensätzen gibt (wie bei IBM), ist die Identifizierung von Zeichensätzen durch eine Zahl eine bequeme Möglichkeit, sie zu unterscheiden. Ursprünglich bezog sich die Code -Seitenzahlen auf die Seite Zahlen im Handbuch für IBM Standard Character Set,[4][5][6] ein Zustand, der seit langem nicht mehr gehalten hat. Anbieter, die ein Code -Seitensystem verwenden, geben eine eigene Code -Seitennummer für eine Zeichencodierung aus, auch wenn es unter einem anderen Namen besser bekannt ist. zum Beispiel, UTF-8 wurde bei IBM, 65001 bei Microsoft und 4110 bei SAP Seitennummern 1208 zugewiesen.
Hewlett Packard verwendet ein ähnliches Konzept in seinem HP-UX Betriebssystem und seines Druckerbefehlssprache[7] (PCL) Protokoll für Drucker (entweder für HP -Drucker oder nicht). Die Terminologie ist jedoch anders: Was andere als a nennen Zeichensatz, HP ruft a Symbol gesetztund was IBM oder Microsoft a nennen a Codepage, HP ruft a Symbol Set Code. HP entwickelte eine Reihe von Symbolsets,[8][9] Jedes mit einem zugeordneten Symbol -Set -Code, um sowohl seine eigenen Zeichensätze als auch die Charaktersätze anderer Anbieter zu codieren.
Die Vielzahl der Charakter -Sets führt viele Anbieter zum Empfehlen Unicode.
Das Code -Seiten -Nummerierungssystem
IBM führte das Konzept der systematischen Zuweisung einer kleinen, aber global eindeutigen 16 -Bit -Nummer für jede Charaktercodierung ein, die ein Computersystem oder eine Sammlung von Computersystemen möglicherweise begegnen könnte. Der IBM -Ursprung des Nummerierungsschemas spiegelt sich in der Tatsache wider, dass die kleinsten (ersten) Nummern Variationen der EBCDIC -Codierung von IBM zugewiesen werden, und etwas größere Zahlen beziehen sich auf Variationen von IBMs erweiterte ASCII Codierung wie in seiner PC -Hardware verwendet.
Mit der Veröffentlichung von PC dos Version 3.3 (und die nahezu identische MS-DOS 3.3) IBM führte das Codeseiten -Nummerierungssystem in reguläre PC -Benutzer vor, da die Code -Seitenzahlen (und die Phrase "Code -Seite") in neuen Befehlen verwendet wurden, um die von allen Teilen des Betriebssystems verwendete Zeichencodierung in einem festgelegten Zeichnen zu ermöglichen Systematischer Weg.[10]

Nachdem IBM und Microsoft in den neunziger Jahren aufgehört haben, in den neunziger Jahren zusammenzuarbeiten, haben die beiden Unternehmen die Liste der zugewiesenen Code -Seitennummern unabhängig voneinander beibehalten, was zu einigen widersprüchlichen Zuordnungen führte. Mindestens ein Anbieter von Drittanbietern (Orakel) hat auch eine eigene Liste numerischer Aufgaben.[3] Die aktuellen Aufgaben von IBM sind in ihren aufgeführt Ccsid Repository, während die Zuordnungen von Microsoft innerhalb der dokumentiert sind Msdn.[11] Zusätzlich eine Liste der Namen und ungefähre IANA (ungefähre IANA (Internet zugewiesene Zahlen Autorität) Abkürzungen für die installierten Codeseiten auf einem bestimmten Windows -Computer finden Sie in der Registrierung auf dieser Maschine (diese Informationen werden von Microsoft -Programmen wie verwendet wie z. Internet Explorer).
Die meisten bekannten Codeseiten, ohne die für die CJK Sprachen und VietnamesischPassen Sie alle ihre Codepunkte in acht Bits ein und beinhalten nicht mehr als die Zuordnung jedes Codepunkts auf ein einzelnes Zeichen. Darüber hinaus sind Techniken wie Kombinieren von Zeichen, komplexen Skripten usw. nicht beteiligt.
Der Textmodus des Standards (VGA-kompatibel) PC-Grafik-Hardware wird mit einer 8-Bit-Code-Seite integriert. Es ist jedoch möglich, zwei gleichzeitig mit einigem Farbtiefenopfer zu verwenden, und bis zu acht können im Anzeigadapter zum einfachen Umschalten gespeichert werden.[12] Es gab eine Auswahl an Codeseiten-Schriftarten von Drittanbietern, die in solche Hardware geladen werden konnten. Für Betriebssystemanbieter ist es jedoch alltäglich, ihre eigenen Charaktercodierungs- und Rendering -Systeme bereitzustellen, die in einem Grafikmodus ausgeführt werden und diese Hardware -Einschränkung vollständig umgehen. Das System der Verweise auf Zeichencodierungen nach einer Code-Seitennummer bleibt jedoch als effiziente Alternative zu String-Identifikatoren wie die von IETF und IANA zur Verwendung in verschiedenen Protokollen wie E-Mail und Webseiten anwendbar.
Beziehung zu ASCII
Die Mehrheit der Code -Seiten in der aktuellen Verwendung ist übersets von ASCII, ein 7-Bit-Code, der 128 Steuercodes und druckbare Zeichen darstellt. In der entfernten Vergangenheit setzen 8-Bit-Implementierungen des ASCII-Code das obere Bit auf Null oder verwendeten es als a Paritätsbit In Netzwerkdatenübertragungen. Wenn das obere Bit zur Darstellung von Charakterdaten verfügbar war, konnten insgesamt 256 Zeichen und Kontrollcodes dargestellt werden. Die meisten Anbieter (einschließlich IBM) verwendeten diesen erweiterten Bereich, um Zeichen zu codieren, die von verschiedenen Sprachen und grafischen Elementen verwendet wurden, die die Nachahmung primitiver Grafiken auf nur Text-Ausgabegeräten ermöglichten. Für diese "erweiterten ASCII -Zeichensätze" bestand kein formaler Standard und Anbieter, die die Varianten als Codeseiten bezeichneten, wie IBM immer für Varianten von EBCDIC -Codierungen durchgeführt hatte.
Beziehung zu Unicode
Unicode ist ein Versuch, alle Zeichen aller derzeit und historisch verwendeten menschlichen Sprachen in die Zählung einzelner Zeichen einzubeziehen (effektiv eine große einzelne Code -Seite), wobei die Notwendigkeit der Unterscheidung zwischen verschiedenen Codeseiten bei der Behandlung digital gespeicherter Text entfernt werden muss. Unicode versucht, mit vielen Legacy -Code -Seiten die Kompatibilität rückwärts zu behalten, und kopiert einige Codeseiten 1: 1 im Entwurfsprozess. Ein explizites Designziel von Unicode bestand darin, die Umwandlung zwischen allen gemeinsamen Legacy-Code-Seiten zu ermöglichen, obwohl dieses Ziel nicht immer erreicht wurde. Einige Anbieter, nämlich IBM und Microsoft, haben anachronistisch Code -Seitennummern Unicode -Encodings zugewiesen. Mit dieser Konvention können Code -Seitennummern als Metadaten verwendet werden, um den korrekten Dekodierungsalgorithmus bei der Begegnung von binären gespeicherten Daten zu identifizieren.
IBM -Code -Seiten
EBCDIC-basierte Codeseiten
Diese Codeseiten werden von IBM in seinen EBCDIC -Zeichensätzen für verwendet Mainframe -Computer.[13]
- 1 - USA WP, Original
- 2 - USA
- 3 - USA Buchhaltung, Version a
- 4 - USA
- 5 - USA
- 6 - Lateinamerika
- 7 - Deutschland F.R. / Österreich
- 8 - Deutschland F.R.
- 9 - Frankreich, Belgien
- 10 - Kanada (Englisch)
- 11 - Kanada (Französisch)
- 12 - Italien
- 13 - Niederlande
- 14 –
- 15 - Schweiz (Französisch)
- 16 - Schweiz (Französisch / Deutsch)
- 17 - Schweiz (Deutsch)
- 18 - Schweden / Finnland
- 19 - Schweden / Finnland WP, Version 2
- 20 - Dänemark/Norwegen
- 21 - Brasilien
- 22 - Portugal
- 23 - Vereinigtes Königreich
- 24 - Vereinigtes Königreich
- 25 - Japan (Latein)
- 26 - Japan (Latein)
- 27 - Griechenland (Latein)
- 28 –
- 29 - Island
- 30 - Türkei
- 31 - Südafrika
- 32 - Tschechoslowakei (Tschechische / Slowakische)
- 33 - Tschechoslowakei
- 34 - Tschechoslowakei
- 35 - Rumänien
- 36 - Rumänien
- 37 - USA/Kanada - CECP (gleiche mit Euro: 1140)
- 37-2-Der Real 3279 APL-Codepage, wie von C/370 verwendet. Dies ist sehr nahe bei 1047, mit Ausnahme von Caret und nicht invertiert. Es wird von IBM nicht offiziell anerkannt, obwohl es obwohl TEILEN hat auf seine Existenz hingewiesen.[14]
- 38 - USA ASCII
- 39 - Vereinigtes Königreich / Israel
- 40 - Vereinigtes Königreich
- 251 - China
- 252 - Polen
- 254 - Ungarn
- 256 - International #1 (abgelöst von 500)
- 257 - International #2
- 258 - International #3
- 259 - Symbole, gesetzt 7
- 260 - Kanadisches Französisch - 116
- 264 - Druck und Textverarbeitung verlängert
- 273 - Deutschland F.R./AUSTRIA - CECP (gleiche mit Euro: 1141)
- 274 - alte Seite Belgien Code
- 275 - Brasilien - CECP
- 276 - Kanada (Französisch) - 94
- 277 - Dänemark, Norwegen - CECP (gleiche mit Euro: 1142)
- 278 - Finnland, Schweden - CECP (gleiche mit Euro: 1143)
- 279 - Französisch - 94[14]
- 280 - Italien - CECP (gleiche mit Euro: 1144)
- 281 - Japan (Latein) - CECP
- 282 - Portugal - CECP
- 283 - Spanien - 190[14]
- 284 - Spanien/Lateinamerika - CECP (gleiche mit Euro: 1145)
- 285 - Vereinigtes Königreich - CECP (gleiche mit Euro: 1146)
- 286 - Österreich / Deutschland F.R. Wechseln
- 287 - Dänemark / Norwegen abwechselnd
- 288 - Finnland / Schweden Alternative
- 289 - Spanien Alternative
- 290 - Japaner (Katakana) erweitert
- 293 - Apl
- 297 - Frankreich (gleiche mit Euro: 1147)[14]
- 298 - Japan (Katakana)
- 300 - Japan (Kanji) DBCS (für JIS x 0213)
- 310 - Grafische Flucht APL/TN
- 320 - Ungarn
- 321 - Jugoslawien
- 322 - Türkei
- 330 - International #4
- 351 - GDDM Standard
- 352 - Druck- und Veröffentlichungsoption
- 353 -BCDIC-A
- 355 - PTTC/BCD -Standardoption
- 357 - PTTC/BCD H -Option H.
- 358 - PTTC/BCD -Korrespondenzoption
- 359 - PTTC/BCD -Monocase -Option
- 360 - PTTC/BCD -Duocase -Option
- 361 - Ebcdic Publishing International
- 363 - Symbole, gesetzt 8
- 382 - Ebcdic Publishing Österreich, Deutschland F.R. Wechseln
- 383 - Ebcdic Publishing Belgien
- 384 - Ebcdic Publishing Brasilien
- 385 - Ebcdic Publishing Canada (Französisch)
- 386 - Ebcdic Publishing Dänemark, Norwegen
- 387 - Ebcdic Publishing Finnland, Schweden
- 388 - Ebcdic Publishing Frankreich
- 389 - Ebcdic Publishing Italien
- 390 - Ebcdic Publishing Japan (Latein)
- 391 - Ebcdic Publishing Portugal
- 392 - Ebcdic Publishing Spanien, Philippinen
- 393 - Ebcdic Publishing Lateinamerika (Spanisch sprechen)
- 394 - Ebcdic Publishing China (Hongkong), Großbritannien, Irland
- 395 - Ebcdic Publishing Australia, Neuseeland, USA, Kanada (Englisch)
- 410 - Cyrillic (Revisionen: 880, 1025, 1154)
- 420 - Arabisch
- 421 - Maghreb/Französisch
- 423 - Griechisch (abgelöst von 875)
- 424 - Hebräisch (Bulletin Code)
- 425 - Arabisch / Latein für OS / 390 Open Edition
- 435 - TeleText isomorph
- 500 - International #5 (ECECP; ersetzt 256) (gleiche mit Euro: 1148)
- 803 - Hebräisch Zeichen setzen a (alter Code)
- 829- Host-Mathematik-Symbole- Veröffentlichung
- 833 - Koreanisch erweitert (SBCs)
- 834 - Korean Hangul (KSC5601; DBCs mit UDCs)
- 835 - traditionelle chinesische DBCs
- 836 - vereinfachtes Chinesisch erweitert
- 837 - vereinfachte chinesische DBCs vereinfacht
- 838 - Thai mit niedrigen Noten und Akzentfiguren (gleiche mit Euro: 1160)
- 839 - Thai DBCs
- 870 - Latein 2 (gleiche mit Euro: 1153) (Revision: 1110)
- 871 - Island (gleiche mit Euro: 1149)[14]
- 875 - Griechisch (ersetzt 423)
- 880 - Cyrillic (Überarbeitung von 410) (Überarbeitungen: 1025, 1154)
- 881 - USA - 5080 Grafiksystem
- 882 - Vereinigtes Königreich - 5080 Grafiksystem
- 883 - Schweden - 5080 Grafiksystem
- 884 - Deutschland - 5080 Grafiksystem
- 885 - Frankreich - 5080 Grafiksystem
- 886 - Italien - 5080 Grafiksystem
- 887 - Japan - 5080 Grafiksystem
- 888 - Frankreich Asery - 5080 Grafiksystem
- 889 - Thailand
- 890 - Jugoslawien
- 892 - ebcdic, ocr a
- 893 - Ebcdic, OCR B
- 905 - Latein 3
- 918 - Urdu zweisprachig
- 924 - Latein 9
- 930 - Japan Mix (290 + 300) (gleiche mit Euro: 1390)
- 931 - Japan Mix (37 + 300)
- 933 - Korea Mix (833 + 834) (gleiche mit Euro: 1364)
- 935 - vereinfachter chinesischer Mix (836 + 837) (gleiche mit Euro: 1388)
- 937 - traditioneller chinesischer Mix (37 + 835) (gleiche mit Euro: 1371)
- 939 - Japan Mix (1027 + 300) (gleiche mit Euro: 1399)
- 1001 - mic
- 1002 - Ebcdic DCF Release 2 Kompatibilität
- 1003 - Ebcdic DCF, US -Text -Teilmenge
- 1005 - Ebcdic Isomorphe Textkommunikation
- 1007 - Ebcdic Arabic (xcom2)
- 1024 - Ebcdic T.61
- 1025 - Kyrillisch, mehrsprachig (gleiche mit Euro: 1154) (Revision von 880)
- 1026 - Ebcdic Turkey (Latein 5) (gleiche mit Euro: 1155) (ersetzt 905 in diesem Land)
- 1027 - Japanisch (lateinisch) erweitert (JIS x 0201 erweitert)
- 1028 - Ebcdic Publishing Hebräisch
- 1030 - Japaner (Katakana) erweitert
- 1031 - Japaner (Latein) erweitert
- 1032 -mic, E13-B kombiniert
- 1033 -mic, CMC-7 kombiniert
- 1037 - Korea - 5080/6090 Grafiksystem
- 1039 - GML -Kompatibilität
- 1047 - Latein 1/offene Systeme[14]
- 1068 - DCF -Kompatibilität
- 1069 - Latein 4
- 1070 - USA / Kanada Version 0 (Code Seite 37 Version 0)
- 1071 - Deutschland F.R. / Österreich
- 1073 - Brasilien
- 1074 - Dänemark, Norwegen
- 1075 - Finnland, Schweden
- 1076 - Italien
- 1077 - Japan (Latein)
- 1078 - Portugal
- 1079 - Spanien / Lateinamerika Version 0 (Code Seite 284 Version 0)
- 1080 - Vereinigtes Königreich
- 1081 - Frankreich Version 0 (Code Seite 297 Version 0)
- 1082 - Israel (Hebräisch)
- 1083 - Israel (Hebräisch)
- 1084 - International#5 Version 0 (Code Seite 500 Version 0)
- 1085 - Island
- 1087 - Symbol gesetzt
- 1091 - Modifizierte Symbole, gesetzt 7
- 1093 - IBM Logo[15]
- 1097 - Farsi zweisprachig
- 1110 - Latein 2 (Revision von 870)
- 1112 - Baltic Mehrsprachiger (gleiche mit Euro: 1156)
- 1113 - Latein 6
- 1122 - Estland (gleiche mit Euro: 1157)
- 1123 - Cyrillic, Ukraine (gleiche mit Euro: 1158)
- 1130 - Vietnamesisch (gleiche mit Euro: 1164)
- 1132 - Lao Ebcdic
- 1136 - Hitachi Katakana
- 1137 - Devanagari Ebcdic
- 1140 - USA, Kanada usw. ECECP (gleiche ohne Euro: 37) (traditionelle chinesische Version: 1159)
- 1141 - Österreich, Deutschland ECECP (gleiche ohne Euro: 273)
- 1142 - Dänemark, Norwegen ECECP (gleiche ohne Euro: 277)
- 1143 - Finnland, Schweden ECECP (gleiche ohne Euro: 278)
- 1144 - Italien ECECP (gleiche ohne Euro: 280)
- 1145 - Spanien, Lateinamerika (Spanisch) ECECP (gleiche ohne Euro: 284)
- 1146 - UK ECECP (gleiche ohne Euro: 285)
- 1147 - Frankreich ECECP mit Euro (gleiche ohne Euro: 297)
- 1148 - International ECECP mit Euro (gleiche ohne Euro: 500)
- 1149 - Isländisches ECP mit Euro (gleiche ohne Euro: 871)
- 1150 - Koreanisch mit Kastenfiguren erweitert
- 1151 - Vereinfachtes Chinesisch erweitert mit Kastenfiguren
- 1152 - Traditionelles Chinesisch erweitert mit Kastenfiguren
- 1153 - Latein 2 mehrsprachig mit Euro (gleiche ohne Euro: 870)
- 1154 - Kyrillisch, mehrsprachig mit Euro (gleiche ohne Euro: 1025; Eine ältere Version ist * 1166)
- 1155 - Türkei mit Euro (gleiche ohne Euro: 1026)
- 1156 - Baltic Multi mit Euro (gleiche ohne Euro: 1112)
- 1157 - Estland mit Euro (gleiche ohne Euro: 1122)
- 1158 - Cyrillic, Ukraine mit Euro (gleiche ohne Euro: 1123)
- 1159-T-Chinese Ebcdic (traditionelles chinesisches Euro-Update von * 1140)
- 1160 - Thai mit niedrigen Noten und Akzentfiguren mit Euro (gleiche ohne Euro: 838)
- 1164 - Vietnamesisch mit Euro (gleiche ohne Euro: 1130)
- 1165 - Latein 2/offene Systeme
- 1166 - kyrillischer Kasachisch
- 1278 - Ebcdic Adobe (PostScript) Standard -Codierung
- 1279 - Hitachi Japaner Katakana Host[6]
- 1303 - Ebcdic Bar Code
- 1364 - Korea Mix (833 + 834 + Euro) (gleiche ohne Euro: 933)
- 1371 - traditioneller chinesischer Mix (1159 + 835) (gleiche ohne Euro: 937)
- 1376 - Traditionelle chinesische DBCS -Host -Erweiterung für HKSCs
- 1377 - gemischtes Wirt HKSCS Wachsen (37 + 1376)
- 1388 - vereinfachte chinesische Mischung (gleiche ohne Euro: 935) (836 + 837 + Euro)
- 1390 - vereinfachtes chinesisches Mix Japan Mix (gleiche ohne Euro: 930) (290 + 300 + Euro)
- 1399 - Japan Mix (1027 + 300 + Euro) (gleiche ohne Euro: 939)
DOS -Code -Seiten
Diese Codeseiten werden von IBM in seiner verwendet PC dos Betriebssystem. Diese Codeseiten wurden ursprünglich direkt in die eingebettet Textmodus Hardware der mit dem verwendeten Grafikadapter IBM PC und seine Klone, einschließlich der ursprünglichen MDA- und CGA -Adapter, deren Charakter -Sets nur durch physisches Ersetzen eines ROM -Chips, der die Schriftart enthielt, geändert werden. Die Schnittstelle dieser Adapter (von allen späteren Adaptern wie VGA) war typischerweise auf einzelne Byte -Zeichensätze mit nur 256 Zeichen in jeder Schriftart/-codierung beschränkt (obwohl VGA eine partielle Unterstützung für geringfügig größere Zeichensätze hinzufügte).
- 301 -IBM-PC Japan (Kanji) DBCs
- 437 - Original IBM PC -Hardware -Code -Seite
- 720 - Arabisch (transparente ASMO)
- 737 – griechisch
- 775 -Latin-7
- 808 - Russisch mit Euro (gleich ohne Euro: 866)
- 848 - Ukrainisch mit Euro (gleiche ohne Euro: 1125)
- 849 - Belorussian mit Euro (gleiche ohne Euro: 1131)
- 850 -Latein-1
- 851 - Griechisch
- 852 -Latein-2
- 853 -Latin-3
- 855 – kyrillisch (Gleiches gilt für Euro: 872)
- 856 – hebräisch
- 857 -Latin-5
- 858 -Latein-1 mit Euro Symbol
- 859 -Latin-9
- 860 – Portugiesisch
- 861 – isländisch
- 862 – hebräisch
- 863 – Kanadisches Französisch
- 864 – Arabisch
- 865 – dänisch/norwegisch
- 866 - Weißrusssisch, Russisch, Ukrainisch (gleiche mit Euro: 808)
- 867 – hebräisch + Euro (basierend auf CP862) (Konflikte ID: NEC Tschechisch (Kamenický), was vor diesem Codepage erstellt wurde)
- 868 – Urdu
- 869 – griechisch
- 872 - Cyrillic mit Euro (gleiche ohne Euro: 855)
- 874 - Thai mit niedrigen Tonmarken und alten Chars (Konflikte ID mit Windows 874; Version mit Euro: 1161 Windows -Version: Ist IBM 1162)
- 876 - OCR a
- 877 - OCR B
- 878 – KOI8-R
- 891 - Koreanische PC -SBCs
- 898-IBM-PC WP mehrsprachig
- 899 -IBM-PC-Symbol
- 903 - vereinfachte chinesische PC -SBCs
- 904 - Traditionelle chinesische PC -SBCs
- 906 - International Set #5 3812/3820
- 907 - ASCII APL (3812)
- 909 -IBM-PC APL2 erweitert
- 910 -IBM-PC APL2
- 911 -IBM-PC Japan #1
- 926 - Koreanische PC -DBCs
- 927 - traditionelle chinesische PC -DBCs
- 928 - vereinfachte chinesische PC -DBCs
- 929 - Thai PC DBCs
- 932 -IBM-PC Japan Mix (DOS/V) (DBCS) (897 + 301) (Konflikte ID mit Windows 932; Windows -Version ist IBM 943)
- 934 -IBM-PC Korea-Mix (DOS/V) (DBCS) (DBCS) (891 + 926)
- 936 -IBM-PC vereinfachte chinesische Mix (GB2312) (DOS/V) (DBCS) (903 + 928) (Konflikte ID mit Windows 936; Windows -Version ist IBM 1386)
- 938-IBM-PC Traditioneller chinesischer Mix (DOS/V, OS/2) (904 + 927)
- 942 -IBM-PC Japan Mix (japanische SAA (OS/2)) (Japanische SAA (OS/2)) (1041 + 301)
- 943 -IBM-PC Japan Open (897 + 941) (Windows CP 932)
- 944 -IBM-PC Korea-Mix (Korean SAA (OS/2)) (koreanische SAA (OS/2)) (1040 + 926)
- 946-IBM-PC vereinfachtes Chinesisch (vereinfachtes chinesisches SAA (OS/2)) (vereinfachtes chinesisches SAA (OS/2)) (1042 + 928)
- 948-IBM-PC Traditionelles Chinesisch (traditionelle chinesische SAA (OS/2)) (1043 + 927)
- 949 -Koreanisch (erweiterte Wansung (KS_C_5601-1987)) (KS_C_5601-1987)) (1088 + 951) (Konflikte ID mit Windows 949 (Unified Hangul Code); Windows -Version ist IBM 1363)
- 951 - Koreanische DBCs (IBM KS -Code) (Konflikt -ID mit Windows 951, ein Hack von Windows 950 mit Unicode -Zuordnungen für einige PUA -Unicode -Zeichen, die in HKSCs basierend auf dem Dateinamen gefunden wurden)
- 1034 - Druckeranwendung - Versandetikett, Set #2
- 1040 - Koreanisch erweitert
- 1041 - Japaner erweitert (JIS x 0201 erweitert)
- 1042 - vereinfachtes Chinesisch erweitert
- 1043 - Traditioneller Chinesen erweitert
- 1044 - Druckeranwendung - Versandetikett, Set #1
- 1086 -IBM-PC Japan #1
- 1088 - Überarbeitete Koreanisch (SBCs)
- 1092 -IBM-PC-modifizierte Symbole
- 1098 – Farsi
- 1108 - Ditroff -Basiskompatibilität
- 1109 - Kompatibilität von Ditroff Specials
- 1115 -IBM-PC Volksrepublik China
- 1116 - Estnisch
- 1117 - Lettisch
- 1118 - Litauisch (IBM -Umsetzung von Lika's Code Seite 774)
- 1119 - Litauisch und Russisch (IBM -Umsetzung von Lika's Code Seite 772)
- 1125 - Kyrillisch, ukrainisch (gleiche mit Euro: 848) (IBM -Modifokation von Ruscii)
- 1127 -IBM-PC-Arabisch / Französisch
- 1131 -IBM-PC-Daten, kyrillisch, belarussisch (gleiche mit Euro: 849)
- 1139 - Japan Alphanumeric Katakana
- 1161 - Thai mit niedrigen Tonmarken und alten Chars mit Euro (gleiche ohne Euro: 874)
- 1167 – Koi8-ru
- 1168 – Koi8-u
- 1300-ANSI [PTS-DOS 6.70, nicht 6.51]
- 1370 - traditioneller chinesischer Mix (Big5 Codierung) (1114 + 947 + Euro) (gleich ohne Euro: 950)
- 1380 -IBM-PC vereinfachte chinesische GB-PC-Daten (DBCS PC IBM GB 2312-80)
- 1381 -IBM-PC vereinfacht Chinesisch (1115 + 1380)
- 1393 - Japanische JIS X 0213 DBCs
- 1394-IBM-PC Japan (JIS X 0213) ()897 + 1393)
Bei älteren Hardware, Protokollen und Dateiformaten ist häufig erforderlich, um diese Codeseiten zu unterstützen, aber neuere Codierungssysteme, insbesondere Unicode, werden für neue Designs gefördert.
DOS -Code -Seiten werden normalerweise in .cpi -Dateien gespeichert.[16][17][18][19][20]
IBM AIX -Code -Seiten
Diese Codeseiten werden von IBM in seiner verwendet AIX Betriebssystem. Sie emulieren mehrere Charakter-Sets, nämlich diejenigen, die entsprechend ISO verwendet werden sollen, wie z. B. Unix-ähnliche Betriebssysteme.
- 367 -7-Bit US-Ascii
- 371 -7-Bit US-Ascii Apl
- 806 - Iscii
- 813 – ISO 8859-7
- 819 – ISO 8859-1
- 895 -7-Bit Japan Latein
- 896 -7-Bit Japan Katakana erweitert
- 901 - Erweiterung von ISO 8859-13 mit Euro (gleiche ohne Euro: 921)
- 902 - ISO Estnian mit Euro (gleiche ohne Euro: 922)
- 912 - Erweiterung von ISO 8859-2
- 913 – ISO 8859-3
- 914 – ISO 8859-4
- 915 - Erweiterung von ISO 8859-5
- 916 – ISO 8859-8
- 919 – ISO 8859-10
- 920 – ISO 8859-9
- 921 - Erweiterung von ISO 8859-13 (Gleiches gilt für Euro: 901)
- 922 - ISO Estnian (gleiche mit Euro: 902)
- 923 – ISO 8859-15
- 952 - EUC Japanisch für Jis x 0208
- 953 - EUC Japanisch für JIS x 0212
- 954 - EUC Japanisch (895 + 952 + 896 + 953)
- 955 -TCP Japanisch, JIS X 0208-1978
- 956 - TCP Japaner (895 + 952 + 896 + 953)
- 957 - TCP Japaner (895 + 955 + 896 + 953)
- 958 - TCP Japaner (367 + 952 + 896 + 953)
- 959 - TCP Japaner (367 + 955 + 896 + 953)
- 960-Traditioneller chinesischer DBCS-EUC SICGCC Primärsatz (1. Ebene)
- 961-Traditioneller chinesischer DBCS-EUC SICGCC Full Set + IBM Select + UDC
- 963 - traditioneller chinesischer TCP, ZNS 11643 Ebene 2 nur
- 964 - EUC Traditional Chinese (367 + 960 + 961)
- 965 - TCP Traditionelles Chinesisch (367 + 960 + 963)
- 970 - EUC Koreanisch (367 + 971)
- 971 - EUC Korean DBCs (G1, KSC 5601 1989 (einschließlich 188 UDC))
- 1006 -ISO 8-Bit Urdu
- 1008 -ISO 8-Bit-Arabisch
- 1009 -7-Bit ISO IRV
- 1010 -7-Bit Frankreich
- 1011 -7-Bit Deutschland F.R.
- 1012 -7-Bit Italien
- 1013 -7-Bit Großbritannien
- 1014 -7-Bit-Spanien
- 1015 -7-Bit-Portugal
- 1016 -7-Bit Norwegen
- 1017 -7-Bit Dänemark
- 1018 -7-Bit Finnland/Schweden
- 1019 -7-Bit Niederlande
- 1029 - Arabisch erweitert
- 1036 - Ccitt T.61
- 1046 - Arabisch erweitert (Euro)
- 1089 – ISO 8859-6
- 1111 – ISO 8859-2
- 1124 - ISO Ukrainisch, ähnlich wie ISO 8859-5
- 1129 - ISO Vietnamesisch (gleiche mit Euro: 1163)
- 1133 - Iso Lao
- 1163 - ISO Vietnamesisch mit Euro (gleiche ohne Euro: 1129)
- 1350 - EUC Japanisch (Jiseeucjp) (367 + 952 + 896 + 953)
- 1382 -EUC Simplified Chinese (DBCS PC GB 2312-80)
- 1383 - EUC vereinfacht Chinesisch (367 + 1382)
Code Seite 819 ist identisch mit Latin-1, ISO/IEC 8859-1und mit leicht modifizierten Befehlen ermöglicht es MS-DOS-Maschinen, diese Codierung zu verwenden. Es wurde mit IBM as/400 Minicomputer verwendet.
IBM OS/2 -Code -Seiten
Diese Codeseiten werden von IBM in seiner verwendet OS/2 Betriebssystem.
Windows -Emulations -Code -Seiten
Diese Codeseiten werden von IBM bei der Emulation der verwendet Microsoft Windows Zeichensätze. Die meisten dieser Codeseiten haben die gleiche Nummer wie Microsoft -Code -Seiten, obwohl dies nicht der Fall ist exakt identisch. Einige Codeseiten sind jedoch neu von IBM, nicht von Microsoft.
- 897 -IBM-PC SBCS Japanisch (JIS X 0201-1976)
- 941 -IBM-PC Japanische DBCs für offene Umgebung
- 947 -IBM-PC DBCs für (Big5 Codierung)
- 950 - traditioneller chinesischer Mix (Big5 Codierung) (1114 + 947) (gleiche mit Euro: 1370)
- 1114 -IBM-PC-SBCs (vereinfachtes Chinesisch; GBK; Traditionelles Chinesisch; Big5 Codierung)
- 1126 -IBM-PC Korean SBCs
- 1162 - Windows Thai (Erweiterung von 874; aber immer noch in Windows genannt)
- 1169 - Windows Cyrillic Asian
- 1174 - Windows Kasakh[22]
- 1250 - Fenster Zentraleuropa
- 1251 - Fenster kyrillisch
- 1252 - Fenster Western
- 1253 - Fenster griechisch
- 1254 - Fenster Türkisch
- 1255 - Fenster hebräisch
- 1256 - Fenster Arabisch
- 1257 - Fenster baltisch
- 1258 - Fenster Vietnamesisch
- 1361 - Koreanisch (Johab)
- 1362 - Koreanische Hangul -DBCs
- 1363 - Windows Koreanisch (1126 + 1362) (Windows CP 949)
- 1372-IBM-PC MS T Chinesisch Big5 Codierung (Spezial für DB2)
- 1373 - Windows Traditional Chinese (Erweiterung von 950)
- 1374 -IBM-PC DB Big5 Codierung Erweiterung für HKSCs
- 1375 - gemischt Big5 Codierung Erweiterung für HKSCs (zu übereinstimmen 950)
- 1385 -IBM-PC vereinfachte chinesische DBCs (wachsende CS für GB18030, auch für GBK-PC-Daten verwendet).)
- 1386 -IBM-PC vereinfachte chinesische GBK (1114 + 1385) (Windows CP 936)
- 1391-vereinfachtes chinesisches 4-Byte (wachsende CS für GB18030, auch für GBK-PC-Daten verwendet).)
- 1392 -IBM-PC vereinfachte chinesische Mix (1252 + 1385 + 1391)
Macintosh Emulationscodeseiten
Diese Codeseiten werden von IBM bei der Emulation des Apfeles verwendet Macintosh Zeichensätze.
Adobe Emulationscodeseiten
Diese Codeseiten werden von IBM bei der Emulation der verwendet Adobe Zeichensätze.
HP Emulationscodeseiten
Diese Codeseiten werden von IBM bei der Emulation der verwendet HP Zeichensätze.
- 1050 - HP Römische Erweiterung
- 1051 -HP Roman-8
- 1052 - HP Gothic Legal
- 1053-HP Gothic-1 (fast das gleiche wie ISO 8859-1)
- 1054 - HP ASCII
- 1055-HP PC-Line
- 1056 - HP Line Draw
- 1057 -HP PC-8 (fast das gleiche wie Code Seite 437)
- 1058-HP PC-8DN (nicht das Gleiche wie Code Seite 865)
- 1351 - Japanische DBCS HP -Zeichenset
- 5039 - Japanische Mischung (1041 + 1351)
DEC -Emulationscode Seiten
Diese Codeseiten werden von IBM bei der Emulation der verwendet Dez Zeichensätze.
- 1020 -7-Bit-kanadischer (französischer) NRC-Set
- 1021 -7-Bit-Schweiz-NRC-Set
- 1023 -7-Bit-Spanisch-NRC-Set
- 1090 - Sonderzeichen und Zeilenzeichnung Set
- 1100 - Multinational
- 1101 -7-Bit British NRC-Set
- 1102 -7-Bit-Niederländisch-NRC-Set
- 1103 -7-Bit-Finnisch-NRC-Set
- 1104 -7-Bit-französischer NRC-Set
- 1105 -7-Bit norwegisch/dänisches NRC-Set
- 1106 -7-Bit-schwedisches NRC-Set
- 1107 -7-Bit norwegisch/dänischer NRC-Alternative
- 1287 - DEC Griechisch
- 1288 - türkisch dez
IBM Unicode -Code -Seiten
- 1200 – UTF-16BE Unicode (Big-Endian) mit IBM Privatnutzungsbereich (PUA)[23]
- 1201 – UTF-16BE Unicode (Big-Endian)[23]
- 1202 – UTF-16LE Unicode (Little-Endian) mit IBM PUA[23]
- 1203 – UTF-16LE Unicode (Little-Endian)[23]
- 1208 – UTF-8 Unicode mit IBM PUA[23]
- 1209 – UTF-8 Unicode[23]
- 1400-ISO 10646 UCS-BMP (basierend auf Unicode 6.0)[23]
- 1401-ISO 10646 UCS-SMP (basierend auf Unicode 6.0)[23]
- 1402-ISO 10646 UCS-SIP (basierend auf Unicode 6.0)[23]
- 1414-ISO 10646 UCS-SSP (basierend auf Unicode 4.0)[23]
- 1445 - IBM AFP PUA Nr. 1
- 1446 - ISO 10646 UCS-PUP15 (Basierend auf Unicode 4.0)[23]
- 1447 - ISO 10646 UCS-PUP16 (Basierend auf Unicode 4.0)[23]
- 1448-UCS-BMP (generisches UDC)
- 1449 - IBM Standard PUA
Microsoft -Code -Seiten
Windows -Code -Seiten
Diese Codeseiten werden von Microsoft in einem eigenen Windows -Betriebssystem verwendet. Microsoft definiert eine Reihe von Codeseiten bekannt als die ANSI -Code -Seiten (als erste, 1252 basierte auf einem apokryph ANSI -Entwurf dessen, was geworden ist ISO 8859-1). Code Seite 1252 ist auf ISO 8859-1 erstellt, verwendet jedoch den Bereich 0x80-0x9f für zusätzliche druckbare Zeichen und nicht für die C1-Steuercodes von C1 ISO 6429 erwähnt von ISO 8859-1.[24] Einige der anderen basieren teilweise auf anderen Teilen von ISO 8859 aber oft neu angeordnet, um sie näher an 1252 zu bringen.
- 874 - Fenster Thai
- 1250 - Fenster Zentraleuropa
- 1251 - Fenster kyrillisch
- 1252 - Fenster Western
- 1253 - Fenster griechisch
- 1254 - Fenster Türkisch
- 1255 - Fenster hebräisch
- 1256 - Fenster Arabisch
- 1257 - Fenster baltisch
- 1258 - Fenster Vietnamesisch
Microsoft empfiehlt neue Anwendungen, UTF-8 oder UCS-2/UTF-16 anstelle dieser Codeseiten zu verwenden.[25]
DBCS -Codeseiten
Diese Codeseiten repräsentieren DBCs Charaktercodierungen für verschiedene CJK -Sprachen. In Microsoft -Betriebssystemen werden diese sowohl als "OEM "- als auch als" Windows "-Codeseite für das entsprechende Gebietsschema verwendet.
- 932 - Unterstützt japanisch Shift-Jis
- 936 - Unterstützt Vereinfachtes Chinesisch GBK
- 949 - Unterstützt Koreanisch Einheitlicher Hangul -Code
- 950 - Unterstützt Traditionelles Chinesisch Die großen 5
MS-DOS-Code-Seiten
Diese Codeseiten werden von Microsoft in seinem MS-DOS-Betriebssystem verwendet. Microsoft bezeichnet diese als OEM -Code -Seiten, weil sie durch die definiert wurden Originalausrüstungshersteller WHO lizenzierte MS-DOS für die Verteilung mit ihrer Hardware, nicht nach Microsoft oder einer Standardorganisation. Die meisten dieser Codeseiten haben die gleiche Zahl wie die äquivalenten IBM -Codeseiten, obwohl dies nicht der Fall ist exakt identisch. Es gibt minimale Unterschiede[26] In einigen Codeseiten von IBM und Microsoft.
- 708 - Arabisch (ASMO 708)
- 709 - Arabisch (ASMO 449+/Bcon v4)
- 710 - Arabisch (transparentes Arabisch)
- 720 - Arabisch (transparente ASMO)
- 737 – griechisch
- 850 -Latein-1
- 851 - Griechisch
- 852 -Latein-2
- 855 – kyrillisch
- 857 -Latin-5
- 858 -Latein-1 mit Euro Symbol
- 859 -Latin-9
- 860 – Portugiesisch
- 861 – isländisch
- 862 – hebräisch
- 863 – Kanadisches Französisch
- 864 – Arabisch
- 865 – dänisch/norwegisch
- 866 - Weißrusssisch, Russisch, Ukrainisch
- 869 – griechisch
Macintosh Emulationscodeseiten
Diese Codeseiten werden von Microsoft bei der Emulation des Apple verwendet Macintosh Zeichensätze.
- 10000 - Apfel Macintosh Roman
- 10001 - Apple Japanisch
- 10002 - Apple Traditional Chinese (Big5)
- 10003 - Apple Koreanisch
- 10004 - Apfel Arabisch
- 10005 - Apple Hebräisch
- 10006 - Apfel griechisch
- 10007 - Apfel Macintosh Cyrillic
- 10008 - Apple vereinfacht Chinesisch (GB 2312)
- 10010 - Apfel rumänisch
- 10017 - Apfel ukrainisch
- 10021 - Apple Thai
- 10029 - Apfel Macintosh Mitteleuropa
- 10079 - Apfel isländisch
- 10081 - Apfel Türkisch
- 10082 - Apfel kroatisch
Verschiedene andere Microsoft -Code -Seiten
Die folgenden Code -Seitennummern sind spezifisch für Microsoft Windows. IBM kann für diese Codeseiten unterschiedliche Zahlen verwenden. Sie emulieren mehrere Charakter -Sets, nämlich diejenigen, die entsprechend ISO verwendet werden sollen.[Klarstellung erforderlich] wie Unix-ähnliche Betriebssysteme.
- 20000 - traditionelles chinesisches ZNS
- 20001 - traditionelle chinesische TCA
- 20002 - traditioneller chinesischer ETen
- 20003 - traditioneller chinesischer IBM5500
- 20004 - Traditioneller chinesischer Teletetext
- 20005 - traditioneller chinesischer Wang
- 20105-7-Bit IA5 Irv[27][28][29] (CP 1009)
- 20106-7-Bit IA5 Deutsch (DIN 66003)[27][28][30]
- 20107-7-Bit IA5 Schwedisch (Sen 850200 C)[27][28][31]
- 20108 - 7 -Bit IA5 Norwegisch (NS 4551-2)[27][28][32]
- 20127-7-Bit US-Ascii[27][28][33]
- 20261 – Ccitt T.61
- 20269 – ISO 6937
- 20273
- 20277
- 20278
- 20284
- 20285
- 20290 - Japanische Sprache in Ebcdic
- 20297
- 20420
- 20423
- 20424
- 20833
- 20838
- 20866 – KOI8-R
- 20871
- 20880 - Ebcdic Cyrillic (880)
- 20905
- 20924
- 20932 - EUC-JP
- 20936
- 20949
- 21025 - Ebcdic Cyrillic (1025)
- 21027
- 21866 – Koi8-u
- 28591 – ISO-8859-1
- 28592 – ISO-8859-2
- 28593 – ISO-8859-3
- 28594 – ISO-8859-4
- 28595 – ISO-8859-5
- 28596 – ISO-8859-6
- 28597 – ISO-8859-7
- 28598 – ISO-8859-8
- 28599 – ISO-8859-9
- 28600 – ISO-8859-10
- 28601 – ISO-8859-11
- 28602 - nicht verwendet (reserviert für ISO-8859-12)
- 28603 – ISO-8859-13
- 28604 – ISO-8859-14
- 28605 – ISO-8859-15
- 28606 – ISO-8859-16
- 38596 – ISO-8859-6
- 38598 – ISO-8859-8
Microsoft Unicode -Code -Seiten
- 1200 – UTF-16LE Unicode (Little-Endian)
- 1201 – UTF-16BE Unicode (Big-Endian)
- 12000 – UTF-32LE Unicode (Little-Endian)
- 12001 – UTF-32BE Unicode (Big-Endian)
- 65000 – UTF-7 Unicode
- 65001 – UTF-8 Unicode
- 65520 - leere Unicode -Ebene
HP -Symbolsätze
HP entwickelte eine Reihe von Symbolsätzen (jeweils mit seinem zugehörigen Symbol -Set -Code), um entweder seine eigenen Zeichensätze oder die Zeichensätze anderer Anbieter zu codieren. Sie sind normalerweise 7-Bit-Zeichensätze, die, wenn sie in den höheren Teil verschoben und mit dem ASCII-Zeichenset verbunden sind, 8-Bit-Zeichensätze ausmachen.
HP -eigene Symbolsätze
- Symbol Set 0E-HP Römische Erweiterung-7-Bit-Zeichen mit akzentuierten Buchstaben (codiert von IBM AS Code Seite 1050)
- Symbol gesetzt 0g-HP 7-Bit Deutsch
- Symbol Set 0L - HP -Zeilenumziehung (codiert von IBM als Code Seite 1056)
- Symbol Set 0m-HP Math-7
- Symbol gesetzt 0t-HP Thai-8
- Symbol Set 1s-HP 7-Bit Spanisch
- Symbol Set 1U-HP 7-Bit Gothic Legal (codiert von IBM als Code Seite 1052)
- Symbol Set 4Q-7-Bit-PC-Zeile (codiert von IBM als Code Seite 1055)
- Symbol set 4U - HP Roman-9 -Roman-8 + €
- Symbol Set 7J - HP Desktop
- Symbol Set 7S-HP 7-Bit Europäische Spanisch
- Symbol Set 8e-HP East-8
- Symbol Set 8G-HP Greek-8 (basierend auf IR 088; nicht auf EOL 927)
- Symbol Set 8H-HP Hebräisch-8
- Symbol Set 8i - MS LINEDRAW (ASCII + HP PC -Linie)
- Symbol Set 8K-HP Kana-8 (ASCII + Japanische Katakana)
- Symbol SET 8L - HP LINEDRAW (ASCII + HP -Linie Zeichnung)
- Symbol Set 8m-HP Math-8 (ASCII + HP Math-8)
- Symbol Set 8R-HP Cyrillic-8
- Symbol Set 8S-HP 7-Bit Lateinamerikanische Spanisch
- Symbol Set 8T-HP Turkish-8
- Symbol Set 8U - HP Roman-8 (ASCII + HP Römische Erweiterung; codiert von IBM als Code Seite 1051)
- Symbol Set 8V-HP Arabic-8
- Symbol Set 9K-HP Korean-8
- Symbol SET 9T-PC 8T (auch als Code bezeichnet. Seite 437-t; das ist nicht Code Seite 857)
- Symbol Set 9V - Latein / Arabisch für Fenster (das ist nicht Code Seite 1256)
- Symbol SET 11U-PC 8D/N (auch als Code bezeichnet. Seite 437-N; codiert von IBM als Code Seite 1058; das ist nicht Code Seite 865)
- Symbol Set 14G-PC-8 Griechisch-Alternative (auch als Code bezeichnet. Seite 437-g; fast dasselbe wie Code Seite 737)
- Symbol gesetzt 18k -
- Symbol gesetzt 18T -
- Symbol Set 19c -
- Symbol Set 19K -
Symbolsätze von anderen Anbietern
- Symbol Set 0d-ISO 60: 7-Bit Norwegisch
- Symbol gesetzt 0f-ISO 25: 7-Bit Französisch
- Symbol gesetzt 0H-HP 7-Bit Hebräisch-praktisch gleich wie israelischer Standard SI 960
- Symbol gesetzt 0i-ISO 15: 7-Bit Italienisch
- Symbol Set 0K-ISO 14: 7-Bit japanische Katakana
- Symbol SET 0N-ISO 8859-1 Latein 1 (ursprünglich "Gothic-1" genannt; codiert von IBM als Code Seite 1052)
- Symbol Set 0R-ISO 8859-5 Latein/Cyrillic (1986 Version-IR 111)
- Symbol Set 0s-ISO 11: 7-Bit Schwedisch
- Symbol gesetzt 0U-ISO 6: 7-Bit U.
- Symbol gesetzt 0V - Arabisch
- Symbol Set 1d-ISO 61: 7-Bit Norwegisch
- Symbol Set 1E-ISO 4: 7-Bit U. K.
- Symbol Set 1F-ISO 69: 7-Bit Französisch
- Symbol gesetzt 1G-ISO 21: 7-Bit Deutsch
- Symbol Set 1k-ISO 13: 7-Bit Japaner Latein
- Symbol gesetzt 1T - Windows Thai (praktisch das gleiche wie 874)
- Symbol Set 2K-ISO 57: 7-Bit vereinfachtes chinesisches Latein
- Symbol Set 2n-ISO 8859-2 Latein 2
- Symbol Set 2S-ISO 17: 7-Bit Spanisch
- Symbol Set 2U-ISO 2: 7-Bit International Referenzversion
- Symbol Set 3n-ISO 8859-3 Latein 3
- Symbol gesetzt 3R-PC-866 Russland (praktisch das gleiche wie Code Seite 866)
- Symbol Set 3S-ISO 10: 7-Bit Schwedisch
- Symbol Set 4n-ISO 8859-4 Latein 4
- Symbol Set 4S-ISO 16: 7-Bit-Portugiesisch
- Symbol Set 5m - PS Mathematik Symbol (praktisch gleich wie Adobe -Symbole)
- Symbol Set 5N-ISO 8859-9 Latein 5
- Symbol Set 5S-ISO 84: 7-Bit-Portugiesisch
- Symbol festgelegt 5T-Windows 3.1 Latin-5 (praktisch gleich wie Code Seite 1254)
- Symbol Set 6J - Microsoft Publishing
- Symbol Set 6m - Ventura Mathematik
- Symbol Set 6N-ISO 8859-10 Latein 6
- Symbol Set 6S-ISO 85: 7-Bit Spanisch
- Symbol Set 7H-ISO 8859-8 Latein/Hebräisch
- Symbol Set 9E - Windows 3.1 Latin 2 (praktisch gleich wie Code Seite 1250)
- Symbol gesetzt 9G - Windows 98 Griechisch (praktisch gleich wie Code Seite 1253)
- Symbol Set 9J - PC 1004
- Symbol Set 9L - Ventura ITC Zapf Dingbats
- Symbol Set 9N-ISO 8859-15 Latein 9
- Symbol Set 9R - Windows 98 Cyrillic (praktisch gleich wie Code Seite 1251)
- Symbol Set 9U - Windows 3.0
- Symbol Set 10G-PC-851 Latein/Griechisch (praktisch gleich wie Code Seite 851)
- Symbol Set 10J - PS -Text (praktisch gleich wie der gleiche wie Adobe Standard)
- Symbol SET 10L - PS ITC ZAPF DINGBATS (praktisch gleich wie Adobe Dingbats)
- Symbol Set 10N-ISO 8859-5 Latein/Cyrillic (1988 Version-IR 144)
- Symbol Set 10R-PC-855 Cyrillic (praktisch gleich wie Code Seite 855)
- Symbol Set 10T - TeletEx
- Symbol gesetzt 10U-PC-8 (praktisch gleich wie Code Seite 437; codiert von IBM als Code Seite 1057)
- Symbol gesetzt 10V-CP-864 (praktisch gleich wie Code Seite 864)
- Symbol gesetzt 11g-CP-869 (praktisch das gleiche wie Code Seite 869)
- Symbol SET 11J-PS ISO Latin-1 (praktisch gleich wie Adobe Latin-1)
- Symbol Set 11n-ISO 8859-6 Latein/Arabisch
- Symbol gesetzt 12G - PC Latin/Griechisch (praktisch das gleiche wie Code Seite 737)
- Symbol SET 12J - MC -Text (praktisch gleich wie der gleiche wie Macintosh Roman)
- Symbol Set 12n-ISO 8859-7 Latein/Griechisch
- Symbol SET 12R - PC GOST (praktisch gleich wie PC GOST Main)
- Symbol gesetzt 12U-PC-850 Latein 1 (praktisch gleich wie Code Seite 850)
- Symbol Set 13J - Ventura International
- Symbol festgelegt 13R - PC Bulgare (praktisch gleich wie der gleiche wie Mik)
- Symbol gesetzt 13U-PC-858 Latin 1 + € (praktisch gleich wie Code Seite 858)
- Symbol Set 14J - Ventura U. S. S.
- Symbol Set 14L - Windows Dingbats
- Symbol gesetzt 14p - Abicomp International (praktisch gleich wie der gleiche wie Abicomp)
- Symbol gesetzt 14R - PC Ukrainisch (praktisch das gleiche wie Ruscii)
- Symbol gesetzt 15H-PC-862 Israel (praktisch gleich wie Code Seite 862)
- Symbol gesetzt 16U-PC-857 Latin 5 (praktisch gleich wie Code Seite 857)
- Symbol gesetzt 17U-PC-852 Latein 2 (praktisch gleich wie Code Seite 852)
- Symbol gesetzt 18n - UTF-8
- Symbol gesetzt 18U-PC-853 Latin 3 (praktisch gleich wie Code Seite 853)
- Symbol gesetzt 19L - Windows 98 Baltisch (praktisch gleich wie Code Seite 1257)
- Symbol Set 19M - Windows -Symbol
- Symbol Set 19U - Windows 3.1 Latin 1 (praktisch gleich wie Code Seite 1252)
- Symbol gesetzt 20U-PC-860 Portugal (praktisch das gleiche wie Code Seite 860)
- Symbol gesetzt 21U-PC-861 Island (praktisch gleich wie Code Seite 861)
- Symbol gesetzt 23U - PC -863 Kanada - Französisch (praktisch gleich wie Code Seite 863)
- Symbol SET 24Q-PC-polischer Mazowia (praktisch gleich wie Mazovia Codierung)
- Symbol gesetzt 25U-PC-865 Dänemark/Norwegen (praktisch gleich wie Code Seite 865)
- Symbol Set 26U-PC-775 Latein 7 (praktisch gleich wie Code Seite 775)
- Symbol SET 27Q-PC-8 PC NOVA (praktisch das gleiche wie PC Nova)
- Symbol Set 27U-PC Lettisch-Russisch (auch bekannt als 866-Latvian)
- Symbol SET 28U - PC Litauanisch/Russisch (praktisch das gleiche wie Code Seite 774)
- Symbol Set 29U-PC-772 Litauanisch/Russisch (praktisch das gleiche wie Code Seite 772)
Codeseiten von anderen Anbietern
Diese Code -Seiten sind unabhängige Aufgaben von Anbietern von Drittanbietern. Seit der ursprünglichen IBM PC -Codeseite (Nummer 437) war nicht wirklich für den internationalen Gebrauch konzipiert, wobei mehrere teilweise kompatible Land oder regionale Varianten entstanden waren.
Diese Code -Seiten -Zahlenzuweisungen sind nicht offiziell Weder von IBM, weder von Microsoft noch keiner von ihnen wird als nutzbarer Charakter bezeichnet, das von Iana festgelegt wird. Die diesen Codeseiten zugewiesenen Nummern sind willkürlich und können sich an registrierte Nummern, die von IBM oder Microsoft verwendet werden, zusammenhängen. Einige von ihnen können in DOS 3.3 vor dem Codpage -Schalter hinzugefügt werden.
- 100 - dos hebräische Hardware -Schriftart (nicht von IBM; HDOs)[34]
- 111 - Dos Griechisch (nicht von IBM; AST Premium Exec DOS 5.0[35][36][37])
- 112 - dos türkisch (nicht von IBM; AST Premium Exec DOS 5.0[35][36][37])
- 113 - dos jugoslawisch (nicht von IBM; AST Premium Exec DOS 5.0[35][36][37])
- 151 - dos nafitha arabisch (nicht von IBM; Ados)
- 152 - dos nafitha arabisch (nicht von IBM; Ados)
- 161 - dos Arabisch (Nicht von IBM; Ados)[34]
- 162 - DOS -Arabisch (nicht von IBM; ADOS)
- 163 - DOS -Arabisch (nicht von IBM; ADOS)[34]
- 164 - DOS -Arabisch (nicht von IBM; ADOS)
- 165 - DOS -Arabisch (nicht von IBM; ADOS)[34]
- 166 - IBM Arabisch -PC (ADOS)[34]
- 210 - Dec dos Griechisch (NEC JetMate -Drucker)
- 220 - Dec dos Spanisch (nicht von IBM)
- 489 - Tschechoslowakian [OCR -Software 1993]
- 620 - dos Polnisch (Mazovia) (Nicht von IBM)
- 667 - dos Polnisch (Mazovia) (Nicht von IBM)
- 668 - dos polnisch (nicht von IBM)
- 706-MS-DOS-Server arabisch sakhr (nicht von IBM; Sakhr -Software aus MSX Computers)
- 707-ms-dos arabisch sakhr (nicht von IBM; Sakhr -Software aus MSX Computers)
- 711-MS-DOS Arabisch Nafitha verbessert (nicht von IBM)
- 714-MS-DOS-Arabisch-sakr (nicht von IBM)
- 715-MS-DOS-Arabische Aptc (nicht von IBM)
- 721-MS-DOS Arabisch Nafitha International (nicht von IBM)
- 768-Arabisch al-Arabi (nicht von IBM)
- 770 - Dos estnisch, lettisch, litauisch[38] (Von litauischen Lika -Software;[39] Litauischer RST 1095-89 Nationaler Standard)
- 771 - dos litauisch/kyrillisch - KBL[40] (Von litauischen Lika -Software[39])
- 772 - dos litauisch/kyrillisch[41] (Von litauischen Lika -Software;[39] Litauanische LST 1284: 1993 National Standard; von IBM adoptiert als Code Seite 1119)
- 773 -DOS Latin-7-KBL (von litauanischen Lika-Software)
- 774 - dos litauanisch[42] (Von litauischen Lika -Software;[39] Litauanische LST 1283: 1993 National Standard; von IBM adoptiert als Code Seite 1118)
- 775 -dos latin-7 baltic rand (von litauanian lika software;[39] Litauanische LST 1590-1 National Standard; von IBM und Microsoft als angenommen als Code Seite 775)
- 776 - dos litauisch (erweiterter CP770)[43] (Von litauischen Lika -Software[39])
- 777 - DOS Accent Litauanian (alt) (erweiterter CP773) - KBL[43] (Von litauischen Lika -Software[39])
- 778 - DOS Accent Litauanian (erweiterter CP775)[43] (Von litauischen Lika -Software[39])
- 790 - dos Polnisch (Mazovia)
- 854 - Spanisch[44][6]
- 881 - Latein 1 (nicht von IBM; AST Premium Exec DOS 5.0[35][36][37]) (Konflikte ID mit IBM EBCDIC 881)
- 882-Latein 2 (ISO 8859-2) (nicht von IBM; Wie Code Seite 912; AST Premium Exec DOS 5.0[35][36][37]) (Konflikte ID mit IBM EBCDIC 882)
- 883 - Latein 3 (nicht von IBM; AST Premium Exec DOS 5.0[35][36][37]) (Konflikte ID mit IBM EBCDIC 883)
- 884 - Latein 4 (nicht von IBM; AST Premium Exec DOS 5.0[35][36][37]) (Konflikte ID mit IBM EBCDIC 884)
- 885 - Latein 5 (nicht von IBM; AST Premium Exec DOS 5.0[35][36][37]) (Konflikte ID mit IBM EBCDIC 885)
- 895 – Tschechisch (Kamenický), (Nicht von IBM; Konflikte ID mit IBM CP895-7-Bit EUC Japaner Roman)
- 896 - dos Polnisch (Mazovia) (Nicht von IBM; Konflikte ID mit IBM CP896-7-Bit EUC Japaner Katakana)
- 900 -DOS Russisch (russische MS-DOS 5.0 LCD.CPI)
- 928 - Griechisch (auf Stern[45] Drucker); Gleich wie der griechische Nationalstandard ELOT 928 (Nicht von IBM; Konflikt -ID mit IBM CP928 - vereinfachtes chinesisches PC -DBCs)
- 966 - Saudi -Araber (nicht von IBM)
- 991 - dos Polnisch (Mazovia) (Nicht von IBM)
- 999 -dos serbo-kroatisch i (nicht von IBM); auch als PC Nova und Croscii bekannt; Der untere Teil ist jusi.b1.002, oberer Teil ist Code Seite 437; Unterstützung Slowenisch und Serbo-Kroatischer (Lateinisches Skript)
- 1001 - Arabisch (auf Stern[45] Drucker) (nicht von IBM; Konflikte ID mit IBM CP1001 - mic.)
- 1261-Windows Korean IBM-1261 LMBCS-17, ähnlich wie 1363
- 1270 - Windows Sámi
- 2001 - Litauisch -KBL (auf Star[45] Drucker); Gleich wie Code Seite 771
- 3001 - Estnian 1 (auf Stern[45] Drucker); Gleich wie Code Seite 1116
- 3002 - Estnian 2 (auf Stern[45] Drucker); Gleich wie Code Seite 922
- 3011 - lettisch 1 (auf Stern[45] Drucker); Gleich wie Code Seite 437-Latvian
- 3012 -lettisch-2 (auf Stern[45] Drucker); Gleich wie der Code Seite 866-Latvian (Latvian RST 1040-90 National Standard)
- 3021 - Bulgarisch (auf Stern[45] Drucker); Gleich wie Mik
- 3031 - Hebräisch (auf Stern[45] Drucker); Gleich wie Code Seite 862
- 3041 - maltesisch (auf Stern[45] Drucker); gleich wie ISO 646 maltesisch
- 3840-IBM-RUSSIAN (auf Star[45] Drucker); fast das gleiche wie CP 866
- 3841-Gost-russisch (auf Star[45] Drucker); GOST 13052 Plus Charaktere für zentralasiatische Sprachen
- 3843 - Politur (auf Stern[45] Drucker); Gleich wie Mazovia
- 3844 - CS2 (auf Stern[45] Drucker); Gleich wie Kamenický
- 3845 - Ungarisch (auf Stern[45] Drucker); Gleich wie CWI
- 3846 - Türkisch (auf Stern[45] Drucker); Gleich wie PC-8 Turkish + Old Turkish Lira Zeichen (Tʟ) am Codepunkt A8
- 3847 -Brasilien-Abnt (auf Stern[45] Drucker); Gleich wie der brasilianische National Standard NBR-9614: 1986
- 3848 -Brasilien-Abicomp (auf Stern[45] Drucker); Gleich wie Abicomp
- 3850 - Standard KU (auf Stern[45] Drucker); Variation der Kasetsart -Universitätscodierung für Thai
- 3860 - Rajvitee ku (auf Stern[45] Drucker); Variation der Kasetsart -Universitätscodierung für Thai
- 3861 - Microwiz KU (auf Stern[45] Drucker); Variation der Kasetsart -Universitätscodierung für Thai
- 3863 - STD988 TIS (auf Stern[45] Drucker); Variation der TIS 620 -Codierung für Thai
- 3864 - beliebter TIS (auf Star[45] Drucker); Variation der TIS 620 -Codierung für Thai
- 3865 - Newsic TIS (auf Star[45] Drucker); Variation der TIS 620 -Codierung für Thai
- 28799 – Fokus (auf Stern[45] Drucker); Gleich wie der fokale Charaktersatz
- 28800 – HP RPL (auf Stern[45] Drucker); gleich wie Rpl
- (Nummer fehlt) - CWI-2 (für DOS) Unterstützung ungarisch
- (Nummer fehlt) - Mik (für DOS) Unterstützung bulgarisch
- (Zahl fehlt)-dos serbo-kroatisch II; Unterstützung Slowenisch und Serbo-Kroatischer (Lateinisches Skript)
- (Zahl fehlt) - Russisch Alternative Code -Seite (für dos); Dies ist der Ursprung für IBM CP 866
Liste der Code -Seitenzuweisungen
Liste der bekannten Code -Seitenzuweisungen (unvollständig):
ICH WÜRDE | Namen | Beschreibung | Herkunft | Plattform | DOS | OS/2 | Fenster | Mac | Anders | Codierung | Kommentar |
---|---|---|---|---|---|---|---|---|---|---|---|
0 | N / A | Reserviert | IBM, Microsoft | N / A | 3.3+ | 1.0+ | ? | ? | ? | Interne Betriebssystem Verwendung[34] | |
437 | CP437, IBM437 | PC US | IBM[46] | IBM PC | 3.3+ | 1.0+ | Ja | ? | Ja | 8 Bit SBCS | |
57344- 61439 | N / A | Private Nutzungsableitungen | IBM | N / A | N / A | N / A | N / A | N / A | N / A | verschiedene | CODE-SEITE-Ableitungen für private Verwendung (E000H-Efffh) |
65280- 65533 | N / A | Private Gebrauchsdefinitionen | IBM | N / A | N / A | N / A | N / A | N / A | N / A | verschiedene | Private Verwendung Code-Seitendefinitionen (FF00H-FFFDH) |
65534 | N / A | Reserviert | IBM, Microsoft | N / A | ? | ? | ? | ? | ? | verschiedene | Interne Betriebssystem Verwendung (Fffeh) |
65535 | N / A | Reserviert | IBM, Microsoft | N / A | 3.3+ | 1.0+ | ? | ? | ? | verschiedene | Interne Betriebssystem Verwendung (FFFFH)[34] |
Kritik
Viele ältere Charaktercodierungen (im Gegensatz zu Unicode) leiden unter mehreren Problemen. Einige Anbieter dokumentieren die Bedeutung aller Codepunktwerte in ihren Codeseiten nicht ausreichend, wodurch die Zuverlässigkeit der Behandlung von Textdaten durch verschiedene Computersysteme konsistent verringert wird. Einige Anbieter fügen proprietäre Erweiterungen zu etablierten Codeseiten hinzu, um bestimmte Codepunktwerte hinzuzufügen oder zu ändern: Beispielsweise Byte 0x5c in Schicht jis kann entweder a darstellen Rückenstrich oder ein Yen Währungszeichen Abhängig von der Plattform. Um mehrere Sprachen in einem Programm zu unterstützen, bei dem Unicode nicht verwendet wird, muss die für jedes Zeichenfolgen/Dokument verwendete Codeseite gespeichert werden.
Anwendungen können auch Text in den Text in Windows-1252 wie ISO-8859-1. Der einzige Unterschied zwischen diesen Codeseiten besteht darin, dass die Codepunktwerte im Bereich 0x80–0x9f, der von ISO-8859-1 für Steuerzeichen verwendet wird, stattdessen als zusätzliche druckbare Zeichen in Windows-1252 verwendet werden-insbesondere für Anführungszeichen, das Eurozeichen und die Markensymbol unter anderen. Browser auf Nicht-Windows-Plattformen würden neigen, um leere Felder oder Fragen für diese Charaktere zu zeigen, wodurch der Text zu lesen ist. Die meisten Browser haben dies behoben, indem sie den Zeichensatz ignorierten und als Windows-1252 interpretierten, um akzeptabel auszusehen. In HTML5 wird die Behandlung von ISO-8859-1 als Windows-1252 sogar als kodifiziert W3c Standard.[47] Obwohl Browser in der Regel so programmiert waren, dass sie mit diesem Verhalten umgehen, galt dies nicht immer für andere Software. Bei der Empfang einer Dateiübertragung von einem Windows-System würden nicht-Windows-Plattformen diese Zeichen entweder ignorieren oder als Standardsteuerzeichen behandeln und versuchen, die angegebene Steueraktion entsprechend zu ergreifen.
Aufgrund der umfangreichen Dokumentation von Unicode, einem riesigen Repertoire an Charakteren und Stabilitätspolitik von Charakteren sind die oben aufgeführten Probleme selten ein Problem für Unicode. UTF-8 (Dies kann über eine Million CodePoints codiert) hat die Code-Page-Methode im Hinblick auf die Beliebtheit im Internet ersetzt.[48][49]
Private Code -Seiten
Als die Benutzer früh in der Geschichte von Personalcomputern nicht feststellten, dass ihre Charaktercodierungsanforderungen erfüllt waren, wurden private oder lokale Code -Seiten mit Verwendung erstellt Beenden und ansässig bleiben Versorgungsunternehmen oder durch Neuprogrammierung BIOS Eproms. In einigen Fällen wurden inoffizielle Codeseitennummern erfunden (z. B. CP895).
Als vielfältigere Charakter -Set -Unterstützung zur Verfügung stellte, fielen die meisten dieser Code -Seiten mit einigen Ausnahmen wie der Kamenický oder keybcs2 codieren für die Tschechisch und slowakisch Alphabete. Ein weiterer Zeichensatz ist Iran -System -Codierungsstandard das wurde von der Iran System Corporation für geschaffen Persische Sprache Unterstützung. Dieser Standard wurde im Iran in DOS-basierten Programmen verwendet und nach Einführung von Microsoft Code Seite 1256 wurde dieser Standard veraltet. Einige Windows- und DOS -Programme, die diese Codierung verwenden, werden jedoch noch verwendet, und es gibt einige Windows -Schriftarten mit dieser Codierung.
Um solche Probleme zu überwinden, die IBM -Charakterdatenrepräsentation Architektur Stufe 2 speziell Reservenbereiche von Code-Seiten-IDs für benutzerdefinierbare und private Gebrauchszuordnungen. Wenn solche Code -Seiten -IDs verwendet werden, darf der Benutzer nicht davon ausgehen, dass die gleiche Funktionalität und das gleiche Erscheinungsbild in einer anderen Systemkonfiguration oder auf einem anderen Gerät oder einem anderen System reproduziert werden kann, es sei denn, der Benutzer kümmert sich speziell darum. Der Code-Seitenbereich 57344-61439 (E000h-Efffh) ist offiziell für benutzerdefinierbare Codeseiten reserviert (oder tatsächlich CCSIDs im Kontext von IBM CDRA), während der Bereich 65280-65533 ((Ff00h-Fffdh) ist für alle benutzerdefinierbaren "privaten Gebrauchsaufgaben" reserviert. Zum Beispiel eine nicht registrierte benutzerdefinierte Variante von Code Seite 437 (1b5h) oder 28591 (6faf) könnte 57781 werden (E1B5H) oder 61359 (Efafh) Um potenzielle Konflikte mit anderen Aufgaben zu vermeiden und die manchmal vorhandene interne numerische Logik in den Zuordnungen der ursprünglichen Codeseiten beizubehalten. Eine nicht registrierte private Code -Seite, die nicht auf einer vorhandenen Code -Seite basiert, eine von der Geräte spezifische Code -Seite wie eine Drucker -Schriftart, die nur einen logischen Handle benötigt, um für das System adressierbar zu werden, eine häufig ändernde Download -Schriftart oder eine Code -Seitennummer mit einem Symbol Bedeutung in der lokalen Umgebung könnte eine Aufgabe im privaten Bereich wie 65280 haben (Ff00h).
Die Code -Seiten -IDs 0, 65534 (Fffeh) und 65535 (Ffffh) sind für den internen Gebrauch durch Betriebssysteme wie DOS reserviert und dürfen keinen bestimmten Codeseiten zugewiesen werden.
Siehe auch
- Windows -Code -Seite
- Zeichenkodierung
- Ccsid Die offiziellen Definitionen und Aufgaben von IBMs offizieller "Code -Seite"
- Codepage schnüffeln
- Unicode
Verweise
- ^ "Inhalt". www.ibm.com.
- ^ "Codepage". SAP.com. Archiviert vom Original am 2009-11-14. Abgerufen 2009-08-08.
- ^ a b "Glossar". Oracle.com. Archiviert vom Original am 2011-09-30. Abgerufen 2009-08-08.
- ^ "VT510 Video Terminal Programmer Information". Digital Equipment Corporation (Dez). 7.1. Zeichensätze - Übersicht. Archiviert vom Original am 2016-01-26. Abgerufen 2017-02-15.
Zusätzlich zu traditionellem Dez und ISO Zeichensätze, die der Struktur und Regeln von entsprechen ISO 2022, das VT510 Unterstützt eine Reihe von IBM -PC -Codeseiten (Seitenzahlen im Handbuch des IBM -Standardzeichenssatzes) im PCterm -Modus, um die zu emulieren Konsolenterminal von Branchenstandard-PCs.
- ^ "7.1. Zeichensätze - Übersicht". VT520/VT525 Video Terminal Programmer Information (PDF). Digital Equipment Corporation (Dez). Juli 1994. p. 7-1. EK-VT520-RM. A01. Archiviert (PDF) vom Original am 2017-02-15. Abgerufen 2017-02-15.
Zusätzlich zu traditionellem Dez und ISO Charakter setzt die VT520 Unterstützt eine Reihe von IBM -PC -Code -Seiten (auf die sich beziehen Seitenzahlen im Handbuch des IBM -Standardzeichenssatzes) im PCterm -Modus, um die zu emulieren Konsolenterminal von Branchenstandard-PCs.
- ^ a b c Paul, Matthias R. (2001-06-10) [1995]. "Übersicht über DOS-, OS/2- und Windows -Codepages" (Codepage.lst -Datei) (1,59 Vorläufige Ausgabe). Archiviert vom Original am 2016-04-20. Abgerufen 2016-08-20.
- ^ "Drucker -Befehlssprachsymbol setzt". www.pclviewer.com. Archiviert vom Original am 2020-07-31. Abgerufen 2021-05-25.
- ^ "HP -Symbol setzt". pclhelp.com. Archiviert von das Original Am 2015-02-19. Abgerufen 2017-02-20.
- ^ "PCL5 Camparison Guide" (PDF). Archiviert (PDF) vom Original am 2017-02-21. Abgerufen 2017-02-20.
- ^ Zbikowski, Mark; Allen, Paul; Ballmer, Steve; Borman, Reuben; Borman, Rob; Butler, John; Carroll, Chuck; Chamberlain, Mark; Chell, David; Colee, Mike; Courtney, Mike; Dryfoos, Mike; Duncan, Rachel; Eckhardt, Kurt; Evans, Eric; Bauer, Rick; Tore, Bill; Geary, Michael; Griffin, Bob; Hogarth, Doug; Johnson, James W.; Kermaani, Kaamel; König, Adrian; Koch, Reed; Landowski, James; Larson, Chris; Lennon, Thomas; Lipkie, Dan; McDonald, Marc; McKinney, Bruce; Martin, Pascal; Mathers, Estelle; Matthews, Bob; Melin, David; Mergentime, Charles; Nevin, Randy; Newell, Dan; Newell, Tani; Norris, David; O'Leary, Mike; O'Rear, Bob; Olsson, Mike; Osterman, Larry; Ostling, Ridge; Pai, Sunil; Paterson, Tim; Perez, Gary; Peters, Chris; Petzold, Charles; Pollock, John; Reynolds, Aaron; Rubin, Darryl; Ryan, Ralph; Schulmeisters, Karl; Shah, Rajen; Shaw, Barry; Kurz, Anthony; Slivka, Ben; Smirl, Jon; Stillmaker, Betty; Stoddard, John; Tillman, Dennis; Whitten, Greg; Yount, Natalie; Zeck, Steve (1988). "Technische Berater". Die MS-DOS-Enzyklopädie: Versionen 1.0 bis 3.2. Von Duncan, Ray; Bostwick, Steve; Burgoyne, Keith; Byers, Robert A.; Hogan, Thom; Kyle, Jim; Letwin, Gordon; Petzold, Charles; Rabinowitz, Chip; Tomlin, Jim; Wilton, Richard; Wolverton, Van; Wong, William; Woodcock, Joanne (komplett überarbeitet auf Hrsg.). Redmond, Washington, USA: Microsoft Press. ISBN 1-55615-049-0. Lccn 87-21452. OCLC 16581341. [1] Archiviert 2018-10-14 bei der Wayback -Maschine (XIX+1570 Seiten; 26 cm) (nb. Diese Ausgabe wurde 1988 nach umfassender Überarbeitung der entzogenen Erstausgabe von 1986 von einem anderen Autorenteam veröffentlicht.)
- ^ "Code -Seiten -Identifikatoren". microsoft.com. Microsoft. Archiviert vom Original am 2014-10-27. Abgerufen 2014-10-27.
- ^ "VGA/SVGA-Videoprogrammierung-VGA-Textmodusbetrieb". osdever.net. Archiviert vom Original am 09.09.20101. Abgerufen 2006-09-23.
- ^ "IBM I Globalisierung: Code Seiten". IBM. Archiviert von das Original Am 2012-07-16.
- ^ a b c d e f XLATE - Transliterate Inhalt von Datensätzen, IBM Corporation, 2010 [1986], archiviert vom Original am 2019-06-16, abgerufen 2016-10-18
- ^ "Code Seite CPGID 01093 (PDF)" (PDF). Archiviert von das Original (PDF) Am 2015-07-08.
- ^ Paul, Matthias R. (2001-06-10) [1995]. "Formatbeschreibung von DOS-, OS/2- und Windows NT .CPI- und Linux .cp -Dateien" (CPI.LST -Datei) (1.30 ed.). Archiviert vom Original am 2016-04-20. Abgerufen 2016-08-20.
- ^ Elliott, John C. (2006-10-14). "CPI -Dateiformat". Seasip.info. Archiviert vom Original am 2016-09-22. Abgerufen 2016-09-22.
- ^ Brouwer, Andries Evert (2001-02-10). "CPI -Schriftarten". 0,2. Archiviert vom Original am 2016-09-22. Abgerufen 2016-09-22.
- ^ Haralambous, Yannis (September 2007). Schriftarten & Codierungen. Übersetzt von Horne, P. Scott (1 Ed.). Sebastopol, Kalifornien, USA: O'Reilly Media, Inc. S. 601–602, 611. ISBN 978-0-596-10242-5.
- ^ MS-DOS-Programmiererreferenz. Microsoft Press. 1991. ISBN 1-55615-329-5.
- ^ "Codepage 1004 - Windows Extended". IBM. 2001. Archiviert vom Original am 2018-05-13. Abgerufen 2018-05-13.
- ^ "Charakterdatenrepräsentation Architektur". Archiviert vom Original am 2019-06-23. Abgerufen 2019-10-12.
- ^ a b c d e f g h i j k l "IBM codierte Zeichensatzkennung (CCSID)". IBM. Archiviert von das Original am 2009-11-26.
- ^ ISO/IEC 8859-1: 1998 (e). ISO. 1998-04-15. p. 1. Archiviert vom Original am 2020-10-30. Abgerufen 2020-10-30.
Die codierten Zeichen in diesem Satz können in Verbindung mit codierten Steuerfunktionen verwendet werden, die aus ISO/IEC 6429 ausgewählt wurden.
- ^ "Code -Seiten". microsoft.com. Microsoft. Archiviert vom Original am 2011-20-27. Abgerufen 2010-12-21.
- ^ "Pentaho/Pentaho-Berichterstattung". GitHub. Archiviert vom Original am 2019-06-16. Abgerufen 2017-02-20.
- ^ a b c d e "Code -Seiten -Identifikatoren". Microsoft Developer Network. Microsoft. 2014. Archiviert Aus dem Original am 2016-06-19. Abgerufen 2016-06-19.
- ^ a b c d e "Webcodings - Internet Explorer - Codings". Waswg Wiki. 2012-10-23. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Westeuropäische (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Deutsche (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Swedish (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Norwegische (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "US -Ascii -Codierung - Windows -Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ a b c d e f g Paul, Matthias R. (2002-09-05), Technische Informationen zu undokumentierten DOS -Landinformationen für Lupien-, Aramode- und CCTORC -Aufzeichnungen, Freedos Development List FD-Dev bei Topica, archiviert von das Original am 2016-05-27, abgerufen 2016-05-26
- ^ a b c d e f g h Brown, Ralf D. (2002-12-29). Die X86 Interrupt -Liste. 61.
- ^ a b c d e f g h Paul, Matthias R. (1997-07-30). NWDOS-TIPS-TIPS & Tricks Rund Um Novell Dos 7, MIT Blick Auf undokumentierte Details, Fehler und Problemumgehungen. Mpdostip. Release 157 (in Deutsch) (3 ed.). Archiviert von das Original am 2016-05-22. Abgerufen 2012-01-11. (Nb. Nwdostip.txt ist eine umfassende Arbeit an Novell DOS 7 und Opendos 7.01, einschließlich der Beschreibung vieler undokumentierter Merkmale und Interna. Es ist Teil der noch größeren mpdostip.zip -Sammlung des Autors bis 2001 und verteilt zu dieser Zeit auf vielen Standorten. Der bereitgestellte Link zeigt auf eine HTML-konvertierte ältere Version der Datei nWdostip.txt.)
- ^ a b c d e f g h Paul, Matthias R. (2001-04-09). NWDOS-TIPS-TIPS & Tricks Rund Um Novell Dos 7, MIT Blick Auf undokumentierte Details, Fehler und Problemumgehungen. Mpdostip. Release 183 (auf Deutsch) (3 ed.).
- ^ "770". Archiviert vom Original am 2017-02-26. Abgerufen 2017-02-25. Von litauanischen Lika -Software
- ^ a b c d e f g h "Likit". www.likit.lt. Archiviert vom Original am 2017-04-19. Abgerufen 2017-02-25.
- ^ "771". Archiviert vom Original am 2017-02-26. Abgerufen 2017-02-25. Von litauanischen Lika -Software
- ^ "772". Archiviert vom Original am 2017-02-26. Abgerufen 2017-02-25. Von litauanischen Lika -Software
- ^ "774". Archiviert vom Original am 2017-02-26. Abgerufen 2017-02-25. Von litauanischen Lika -Software
- ^ a b c "lietuvybė.lt - rašmenų koduotės" [lietuvybė.lt - Charaktercodierungen] (auf Litauisch). Archiviert vom Original am 2019-08-28. Abgerufen 2019-08-28.
- ^ Hogan, Thom (1992). Die PC-Referenz für Programmierer (auf Deutsch) (2 ed.). Systhema Verlag GmbH. ISBN 3-89390-272-4. (NB. Dieses Buch ist die deutsche Übersetzung von "The Programmer's PC Sourcebook" von Microsoft Press. Es erwähnt die Code -Seiten -ID 854 für Spanien.)
- ^ a b c d e f g h i j k l m n o p q r s t u v w x y z "Star LC 8021 Benutzerhandbuch" (PDF). Archiviert (PDF) vom Original am 2020-09-29. Abgerufen 2017-02-20.
- ^ IBM. "SBCS -Code -Seiteninformationsdokument - CPGID 00437". Archiviert vom Original am 2016-06-09. Abgerufen 2014-07-04.
- ^ "Codierung". Waswg. 2015-01-27. Sek. 4.2 Namen und Etiketten. Archiviert vom Original am 2015-02-04. Abgerufen 2015-02-04.
- ^ "Verwendungsstatistik von Charaktercodierungen für Websites (täglich aktualisiert)". w3techs.com. Abgerufen 2015-08-06.
- ^ "UTF-8-Nutzungsstatistik". trends.builtwith.com. Archiviert von das Original Am 2011-03-24. Abgerufen 2011-03-28.
Externe Links
- IBM CDRA Glossar
- IBM -Code -Seiten Bei der Wayback -Maschine (Archiviert 2016-02-05)
- IBM -Code -Seiten durch Codierungsschema Bei der Wayback -Maschine (Archiviert 2009-09-06)
- IBM/ICU -Charset -Informationen
- Microsoft -Code -Seiten -Kennungen (Die Liste von Microsoft enthält nur Codepages, die aktiv von normalen Apps unter Windows verwendet werden. Siehe auch Torsten Mohrins Liste Für die vollständige Liste der unterstützten Codeseiten)
- Kürzere Microsoft -Liste, die nur die ANSI- und OEM -Codeseiten enthalten, jedoch mit Links zu den Details zu jedem Bei der Wayback -Maschine (Archiviert 2012-10-23)
- Zeichensätze und Codeseiten am Drücken einer Taste
- Befehl Microsoft CHCP: Zeigen und Festlegen der Konsolen -Active -Code -Seite anzeigen und festlegen