Windows -Code -Seite
Windows -Code -Seiten sind Sätze von Zeichen oder Codeseiten (bekannt als Charaktercodierungen in anderen Betriebssystemen) verwendet in Microsoft Windows Aus den 1980er und 1990er Jahren. Windows -Code -Seiten wurden allmählich ersetzt, wenn Unicode wurde in Windows implementiert, obwohl sie immer noch sowohl innerhalb von Windows als auch in anderen Plattformen unterstützt werden, und gelten immer noch, wenn ALT -Code Verknüpfungen werden verwendet.
Es gibt zwei Gruppen von Systemcodeseiten in Windows-Systemen: OEM- und Windows-nativen ("ANSI") Codeseiten. Codeseiten in beiden Gruppen sind erweiterte ASCII Codeseiten. Zusätzliche Codeseiten werden durch Standard -Windows -Conversion -Routinen unterstützt, jedoch nicht als beiden Systemtypen verwendet.
ANSI -Code -Seite
Alias (e) | Ansi (Fehlbezeichnung) |
---|---|
Standard | Whatwg Codierungsstandard |
Erweitert | US-Ascii |
Vorausgegangen von | ISO 8859 |
gefolgt von | Unicode UTF-16 (in Win32 API) |
ANSI -Code -Seiten (Offiziell "Windows -Code -Seiten" bezeichnet[1] Nachdem Microsoft den früheren Begriff als Fehlbezeichnung akzeptiert hatte[2]) werden für native Nicht-Unicode verwendet (z. B., Byteorientiert) Anwendungen mit a grafische Benutzeroberfläche auf Windows -Systemen. Der Begriff "Ansi" ist eine Fehlbezeichnung, da diese Windows -Code -Seiten keiner entsprechen Ansi Standard; Code Seite 1252 basierte auf einem frühen ANSI -Entwurf, der zum internationalen Standard wurde ISO 8859-1,[2] Dies fügt weitere 32 Steuercodes und Platz für 96 druckbare Zeichen hinzu. Unter anderem vergeben Windows-Code-Seiten dem ergänzenden Kontrollcoderaum druckbare Zeichen, sodass sie bestenfalls unleserlich für Standards-konforme Betriebssysteme sind.)
Die meisten alten "ANSI" -Codeseiten haben Code -Seitenzahlen im Muster 125x. Jedoch, 874 (Thai) und die ostasiatischen Multi-Byte-Codeseiten "Ansi" (932, 936, 949, 950), von denen alle auch als OEM -Code -Seiten verwendet werden, sind so nummeriert, dass sie IBM -Codierungen entsprechen, von denen keiner mit den Windows -Codierungen identisch ist (obwohl die meisten ähnlich sind). Während Code Seite 1258 wird auch als OEM -Code -Seite verwendet. Es ist eher für Microsoft als als Erweiterung für eine vorhandene Codierung original. IBM hat ihre eigenen, unterschiedlichen Zahlen für Microsoft -Varianten zugewiesen, diese werden gegebenenfalls als Referenz in den folgenden Listen angegeben.
Alle 125 -fachen Windows -Code -Seiten sowie 874 und 936 werden von gekennzeichnet Internet zugewiesene Zahlen Autorität (Iana) als "Windows-Nummer", obwohl" Windows-936 "als Synonym für" behandelt wird "GBK". Windows Code Seite 932 wird stattdessen als" Windows-31J "bezeichnet.[3]
ANSI -Windows -Code -Seiten und insbesondere die Codeseite 1252, wurden so genannt, da sie angeblich auf Entwürfen beruhten, die für ANSI eingereicht oder bestimmt waren. Allerdings und ANSI und ISO haben keine dieser Codeseiten standardisiert. Stattdessen sind sie entweder:[2]
- Supersets der Standard -Sets wie denen von ISO 8859 und die verschiedenen nationalen Standards (wie Windows-1252 vs. ISO-8859-1),
- Hauptmodifikationen davon (sie machen sie in verschiedenen Graden inkompatibel Windows-1250 vs. ISO-8859-2)
- Keine parallele Codierung haben (wie Windows-1257 vs. ISO-8859-4; ISO-8859-13 wurde viel später eingeführt). Ebenfalls, Windows-1251 folgt weder den iso-standardisierten ISO-8859-5 noch die damals vorgefertigte KOI-8.
Microsoft hat ungefähr zwölf der zugewiesen Typografie und Unternehmensfiguren (einschließlich insbesondere die, die Eurozeichen, €) in CP1252 zu der Codepunkte 0x80–0x9f, dass in ISO 8859 zugewiesen wird C1 -Kontrollcodes. Diese Zuordnungen sind auch auf vielen anderen ANSI/Windows-Code-Seiten auf denselben Codepunkten vorhanden. Windows verwendete die C1 -Steuercodes nicht, daher hatte diese Entscheidung keinen direkten Einfluss auf Windows -Benutzer. Bei einer Datei, die jedoch auf eine standardkonforme Plattform wie UNIX oder MACOS übertragen wurde, waren die Informationen unsichtbar und potenziell störend.
OEM -Code -Seite
Das OEM -Code -Seiten (Originalausrüstung Hersteller) werden von verwendet von Win32 -Konsole Anwendungen und nach Virtuelle dos, und kann als Überbleibsel angesehen werden DOS und das Original IBM PC die Architektur. Eine separate Suite von Codeseiten wurde nicht nur aufgrund von Kompatibilität, sondern auch deshalb implementiert, sondern auch, weil die Schriftarten von VGA -Hardware (und Nachkommen) Schlagen Sie eine Kodierung von Zeilenabschläge kompatibel sein mit Code Seite 437. Die meisten OEM-Code-Seiten teilen viele Codepunkte, insbesondere für Nicht-Letter-Zeichen, wobei die zweite (Nicht-ASCII)-Hälfte von CP437.
Eine typische OEM -Code -Seite in der zweiten Hälfte ähnelt keiner ANSI/Windows -Code -Seite, auch nur grob. Trotzdem zwei Einzel-Byte-Codeseiten mit fester Breite (874 für Thai und 1258 für Vietnamesisch) und vier Multibyte CJK Codeseiten (932, 936, 949, 950) werden sowohl als OEM- als auch als ANSI -Code -Seiten verwendet. Code Seite 1258 verwendet verwendet Diakritik kombinieren, wie Vietnamesen mehr als 128 Buchstaben-diakritische Kombinationen benötigen. Dies steht im Gegensatz zu Viscii, was einige der ersetzt C0 (d. H. ASCII) Kontrollcodes.
Geschichte
Anfänglich machten Computersysteme und Systemprogrammiersprachen nicht zwischen Unterscheidung zwischen Figuren und Bytes: für die segmentale Skripte In den meisten Afrika, Amerika, Süd- und Südostasien, im Nahen Osten und Europa wird ein Charakter nur ein Byte benötigt, aber zwei oder mehr Bytes werden für die benötigt Ideografie Sets, die im Rest der Welt verwendet werden. Dies führte anschließend zu viel Verwirrung. Microsoft Software und Systeme vor dem Windows NT Zeile sind Beispiele dafür, da sie die OEM- und ANSI -Codeseiten verwenden, die die Unterscheidung nicht treffen.
Seit Ende der neunziger Jahre haben Software und Systeme übernommen Unicode als bevorzugtes Speicherformat; Dieser Trend wurde durch die weit verbreitete Einführung von verbessert Xml, der einen angemesseneren Mechanismus für die Kennzeichnung der verwendeten Codierung darstellt.[4] Neuere Microsoft -Produkte und Anwendungsprogrammschnittstellen Verwenden Sie Unicode intern, aber viele Anwendungen und APIs verwenden weiterhin die Standardcodierung des Computergebietsschemas beim Lesen und Schreiben von Textdaten in Dateien oder Standardausgaben. Daher können Dateien immer noch auftreten, die in einem Teil der Welt lesbar und verständlich sind, aber unverständlich sind Mojibake in einem anderen.
UTF-8, UTF-16
Microsoft beschloss, den 16-Bit (zwei Byte) zu übernehmen UTF-16 System für all seine Betriebssysteme Von Windows NT voran. Diese Methode codiert einzigartig alle Unicode -Zeichen in der Grundlegende mehrsprachige Ebene und ein 32-Bit-Code (vier Bit) für andere-aber der Rest der Branche (Unix-artig Systeme und das Web) wählten UTF-8 (Das verwendet ein Byte für den 7-Bit ASCII Zeichensatz, zwei oder drei Bytes für andere Zeichen im BMP und vier Bytes für den Rest). Seit Windows 10 Version 1803Windows-Maschinen können so konfiguriert werden, dass sie UTF-8 als "ANSI" und OEM-Codepage ermöglicht.[5]
Aufführen
Die folgenden Windows -Code -Seiten sind vorhanden:
Windows-125x-Serie
Diese neun Code -Seiten sind alle erweiterte ASCII 8 Bit SBCS Codierungen und wurden von entworfen von Microsoft Zur Verwendung als ANSI -Codepages unter Windows. Sie sind allgemein durch ihre Iana-Registrierung bekannt[6] Namen als Fenster-
, werden aber manchmal auch genannt CP
, "CP" für "Code -Seite". Sie werden alle als ANSI -Codeseiten verwendet; Windows-1258 wird auch als OEM-Codeseite verwendet.
Die Windows-125X-Serie umfasst neun der ANSI-Code-Seiten und deckt hauptsächlich Skripte von ab Europa und Westasien mit der Zugabe von Vietnam. Systemkodierungen für Thai und für Ostasiate Sprachen wurden zu ähnlichen IBM -Codeseiten nummeriert und werden sowohl als ANSI- als auch als OEM -Codeseiten verwendet. Diese sind in folgenden Abschnitten behandelt.
ICH WÜRDE | Beschreibung | Beziehung zu ISO 8859 oder anderen etablierten Kodierungen |
---|---|---|
1250[7][8] | Latein2/ Mitteleuropäisch | Ähnlich zu ISO-8859-2 Bewegt jedoch mehrere Zeichen, einschließlich mehrerer Buchstaben. |
1251[9][10] | kyrillisch | Mit beiden unvereinbar ISO-8859-5 und KOI-8. |
1252[11][12] | Latein 1 / / Westeuropäische | Superset von ISO-8859-1 (ohne C1 -Kontrollen). Briefrepertoire entsprechend ähnlich wie CP850. |
1253[13][14] | griechisch | Ähnlich zu ISO 8859-7 bewegt aber mehrere Charaktere, einschließlich eines Briefes. |
1254[15][16] | Türkisch | Superset von ISO 8859-9 (ohne C1 -Kontrollen). |
1255[17][18] | hebräisch | Fast ein Superset von ISO 8859-8, aber mit zwei inkompatiblen Interpunktionsänderungen. |
1256[19][20] | Arabisch | Nicht kompatibel mit ISO 8859-6; Vielmehr, OEM Code Seite 708 ist ein ISO 8859-6 (ASMO 708) Superset. |
1257[21][22] | baltisch | Nicht ISO 8859-4; am später ISO 8859-13 ist eng verwandt, aber mit einigen Unterschieden in der verfügbaren Interpunktion. |
1258[23][24] | Vietnamesisch (auch OEM) | Nicht verwandt mit Vscii oder Visciiverwendet weniger Basisfiguren mit Kombination von Diakritik. |
DOS -Code -Seiten
Diese basieren auch auf ASCII. Die meisten davon sind für die Verwendung als OEM -Code -Seiten enthalten. Code Seite 874 wird auch als ANSI -Codeseite verwendet.
- 437-IBM PC US, 8-Bit SBCS erweiterte ASCII.[25] Bekannt als OEM-US, die Codierung der primären integrierten Schriftart von VGA-Grafikkarten.
- 708- Arabisch, erweitert ISO 8859-6 (ASMO 708)
- 720- Arabisch, Stützkastenschiffe an ihren üblichen Orten beibehalten
- 737-"MS-Dos Griechisch". Behält alle Kastenzeichnungen. Beliebter als 869.
- 775-"MS-DOS Baltic Rand"
- 850-"MS-DOS Latin 1". Volles (neu arrangiertes) Repertoire von ISO 8859-1.
- 852-"MS-DOS Latin 2"
- 855-"MS-DOS Cyrillic". Hauptsächlich verwendet für South Slawic Languages. Beinhaltet (neu arrangiert) Repertoire von ISO-8859-5. Nicht zu verwechseln mit CP866.
- 857-"MS-Dos türkisch"
- 858- Westeuropäer mit Eurozeichen
- 860-"MS-DOS Portugiesisch"
- 861-"MS-DOS ISLELANC"
- 862-"MS-DOS Hebräisch"
- 863-"MS-DOS French Canada"
- 864- Arabisch
- 865-"MS-DOS Nordic"
- 866-"MS-DOS Cyrillic Russian", CP866. SOLE rein OEM -Code -Seite (anstelle von ANSI oder beides) als Legacy -Codierung in Whatwg -Codierungsstandard für HTML5.
- 869-"MS-DOS GEEK 2", IBM869. Volles (neu arrangiertes) Repertoire von ISO 8859-7.
- 874- - ThaiAuch als ANSI -Code -Seite verwendet, erstreckt sich ISO 8859-11 (und deshalb TIS-620) mit ein paar zusätzlichen Zeichen von Windows-1252. Entspricht IBM-Code Seite 1162 (IBM-874 ist ähnlich, hat jedoch unterschiedliche Erweiterungen).
Ostasiatische Multi-Byte-Code-Seiten
Diese unterscheiden sich oft von den IBM -Codeseiten derselben Zahl: Code Seiten 932, 949 und 950 stimmen nur teilweise mit den IBM -Codeseiten derselben Zahl überein, während die Nummer 936 von IBM für eine weitere vereinfachte chinesische Codierung verwendet wurde, die jetzt veraltet und abgeschrieben und Windows-951 als Teil von a kludge, hat nichts mit IBM-951 zu tun. IBM -Äquivalent -Code -Seiten sind in der zweiten Spalte angegeben. Die Code -Seiten 932, 936, 949 und 950/951 werden sowohl als ANSI- als auch als OEM -Code -Seiten auf den fraglichen Orten verwendet.
ICH WÜRDE | Sprache | Codierung | IBM -Äquivalent | Unterschied von IBM CCSID derselben Zahl | Verwenden |
---|---|---|---|---|---|
932 | japanisch | Schicht jis (Microsoft Variante) | 943[26] | IBM-932 ist auch Schicht -JIs, hat weniger Erweiterungen (aber die Erweiterungen, die sie haben, gemeinsam) und wechselt einige Variante chinesische Charaktere (Itaiji) für die Interoperabilität mit früheren Ausgaben von JIS C 6226. | ANSI/OEM (Japan) |
936 | Vereinfachtes Chinesisch) | GBK | 1386 | IBM-936 ist eine andere vereinfachte chinesische Codierung mit einer anderen Codierungsmethode, die seit 1993 veraltet ist. | ANSI/OEM (PRC, Singapur) |
949 | Koreanisch | Einheitlicher Hangul -Code | 1363 | IBM-949 ist auch ein EUC-kr Superset, aber mit unterschiedlichen (kollidierenden) Erweiterungen. | ANSI/OEM (Republik Korea) |
950 | Chinesische Tradition) | Die großen 5 (Microsoft Variante) | 1373[27] | IBM-950 ist ebenfalls BIG5, enthält jedoch eine andere Teilmenge der ETEN-Erweiterungen, fügt weitere Erweiterungen mit einem erweiterten Trail-Byte-Bereich hinzu und fehlt den Euro. | ANSI/OEM (Taiwan, Hongkong) |
951 | Chinesisch (traditionell) einschließlich Kantonesisch | Big5-Hkscs (2001 ed.) | 5471[28] | IBM-951 ist die Doppel-Byte-Ebene von IBM-949 (siehe oben) und nicht mit der internen Verwendung von Microsoft von der Nummer 951 zu tun. | ANSI/OEM (Hongkong, 98/NT4/2000/XP mit HKSCS -Patch) |
Einige weitere Multiple-Byte-Code-Seiten werden für die Dekodierung oder Codierung mithilfe von Betriebssystembibliotheken unterstützt, aber nicht als eine Art von Systemcodierung in jedem Gebietsschema verwendet.
ICH WÜRDE | IBM -Äquivalent | Sprache | Codierung | Verwenden |
---|---|---|---|---|
1361 | - | Koreanisch | Johab (KS C 5601-1992 Anhang 3) | Wandlung |
20000 | - | Chinesische Tradition) | Eine Codierung von ZNS 11643 | Wandlung |
20001 | - | Chinesische Tradition) | TCA | Wandlung |
20002 | - | Chinesische Tradition) | Big5 (ETen Variante) | Wandlung |
20003 | 938 | Chinesische Tradition) | IBM 5550 | Wandlung |
20004 | - | Chinesische Tradition) | Teletetext | Wandlung |
20005 | - | Chinesische Tradition) | Wang | Wandlung |
20932 | 954 (ungefähr) | japanisch | EUC-JP | Wandlung |
20936 | 5479 | Vereinfachtes Chinesisch) | GB 2312 | Wandlung |
20949, 51949 | 970 | Koreanisch | Wansung (8-Bit mit ASCII, d. H. EUC-kr)[29] | Wandlung |
EBCDIC -CODE -Seiten
- 37-IBM EBCDIC US-Canada, 8-Bit-SBCs[30]
- 500 - Latein 1
- 870 - IBM870
- 875 - CP875
- 1026 - ebcdic türkisch
- 1047 - IBM01047 - Latein 1
- 1140 - IBM01141
- 1141 - IBM01141
- 1142 - IBM01142
- 1143 - IBM01143
- 1144 - IBM01144
- 1145 - IBM01145
- 1146 - IBM01146
- 1147 - IBM01147
- 1148 - IBM01148
- 1149 - IBM01149
- 20273 - Ebcdic Deutschland
- 20277 - Ebcdic Dänemark/Norwegen
- 20278 - Ebcdic Finnland/Schweden
- 20280 - Ebcdic Italy
- 20284 - Ebcdic Lateinamerika/Spanien
- 20285 - Ebcdic Großbritannien
- 20290- Ebcdic Japaner
- 20297 - Ebcdic France
- 20420 - Ebcdic Arabisch
- 20423 - Ebcdic Griechisch
- 20424-X-EBCDIC-Koreanxtended
- 20833 - Koreanisch
- 20838 - Ebcdic Thai
- 20924 - IBM00924 - IBM EBCDIC Latin 1/Open System (1047 + Euro -Symbol)
- 20871 - Ebcdic Isländisches
- 20880- Ebcdic Cyrillic
- 20905 - ebcdic türkisch
- 21025 - Ebcdic Cyrillic
- 21027 - japanisches Ebcdic (unvollständig,[31] veraltet)[32]
- 1200- - Unicode (BMP von ISO 10646, UTF-16LE). Nur für verwaltete Anwendungen verfügbar.[32]
- 1201- - Unicode (UTF-16BE). Nur für verwaltete Anwendungen verfügbar.[32]
- 12000- - UTF-32. Nur für verwaltete Anwendungen verfügbar.[32]
- 12001- - UTF-32. Big-Endian. Nur für verwaltete Anwendungen verfügbar.[32]
- 65000- - Unicode (UTF-7)
- 65001- - Unicode (UTF-8)
Macintosh -Kompatibilitätscodeseiten
- 10000- Apple Macintosh Roman
- 10001- Apple Macintosh Japanisch
- 10002-Apple Macintosh Chinese (traditionell) (Big-5)
- 10003 - Apple Macintosh Koreanisch
- 10004- Apple Macintosh Arabisch
- 10005 - Apple Macintosh Hebräisch
- 10006- Apple Macintosh Griechisch
- 10007- Apple Macintosh Cyrillic
- 10008 - Apple Macintosh Chinese (vereinfacht) (GB 2312)
- 10010- Apple Macintosh Rumänisch
- 10017- Apple Macintosh Ukrainisch
- 10021 - Apple Macintosh Thai
- 10029- Apple Macintosh Roman II / Mitteleuropa
- 10079- Apple Macintosh isländisch
- 10081- Apple Macintosh türkisch
- 10082- Apple Macintosh Kroatisch
ISO 8859 Codeseiten
- 28591- - ISO-8859-1-Latein-1 (IBM-Äquivalent: 819)
- 28592- - ISO-8859-2-Latein-2
- 28593- - ISO-8859-3-Latin-3 oder Südeuropäer
- 28594- - ISO-8859-4-Latin-4 oder Nordeuropäer
- 28595- - ISO-8859-5- lateinisch/kyrillisch
- 28596- - ISO-8859-6- Latein/Arabisch
- 28597- - ISO-8859-7- Latein/Griechisch
- 28598- - ISO-8859-8- Latein/Hebräisch
- 28599- - ISO-8859-9-Latin-5 oder türkisch
- 28600- - ISO-8859-10-Latin-6
- 28601- - ISO-8859-11- Latein/Thai
- 28602- - ISO-8859-12- - reserviert für Latein/Devanagari, aber aufgegeben (nicht unterstützt)
- 28603- - ISO-8859-13-Latin-7 oder Baltic Rand
- 28604- - ISO-8859-14-Latein-8 oder keltisch
- 28605- - ISO-8859-15-Latin-9
- 28606- - ISO-8859-16-Latein-10 oder Südosteuropäer
- 38596- - ISO-8859-6-I- Latein/Arabisch (logische bidirektionale Reihenfolge)
- 38598- - ISO-8859-8-I- Latein/Hebräisch (logische bidirektionale Reihenfolge)
ITU-T-Code-Seiten
KOI8 -Codeseiten
Probleme, die sich aus der Verwendung von Codeseiten ergeben
Microsoft empfiehlt dringend, Unicode in modernen Anwendungen zu verwenden, aber viele Anwendungen oder Datendateien hängen weiterhin von den Legacy -Code -Seiten ab.
- Programme müssen wissen, welche Code-Seite verwendet werden soll, um den Inhalt von (vor Unikodischen) Dateien korrekt anzuzeigen. Wenn ein Programm die falsche Codeseite verwendet, kann es Text als angezeigt werden Mojibake.
- Die verwendete Code-Seite kann zwischen Maschinen unterscheiden, daher kann auf einem anderen (vor Unikodischen) Dateien auf einem anderen erstellt werden.
- Daten werden häufig mit der Codeseite nicht ordnungsgemäß markiert oder gar nicht getaggt, wodurch die richtige Code -Seite festgelegt wird, um die Daten schwierig zu lesen.
- Diese Microsoft -Code -Seiten unterscheiden sich in verschiedenen Grad von einigen der Standards und der Implementierung anderer Anbieter. Dies ist kein Microsoft -Problem an sichwie es allen Anbietern passiert, aber die mangelnde Konsistenz macht in einigen Fällen die Interoperabilität mit anderen Systemen unzuverlässig.
- Die Verwendung von Codeseiten begrenzt die Menge der verwendet werden, die verwendet werden können.
- Zeichen, die in einer nicht unterstützten Code -Seite ausgedrückt werden Ersatzzeichen, oder zu einer einfacheren Version (z. B. Akzente aus einem Buchstaben entfernt). In beiden Fällen kann der ursprüngliche Charakter verloren gehen.
Siehe auch
- Applocale-Ein Dienstprogramm zum Ausführen von Anwendungen ohne Unicode (Code-Seiten) in einem Gebietsschema der Wahl des Benutzers.
Verweise
- ^ "Code -Seiten". 2016-03-07. Archiviert von das Original am 2016-03-07. Abgerufen 2021-05-26.
- ^ a b c "Glossar der auf dieser Seite verwendeten Begriffe". 8. Dezember 2018. archiviert von das Original Am 2018-12-08.
Der Begriff "ANSI", wie es verwendet wird, um Windows -Code -Seiten zu bezeichnen, ist eine historische Referenz, ist aber heutzutage eine Fehlbezeichnung, die weiterhin in der Windows -Community bestehen bleibt. Die Quelle davon ergibt sich aus der Tatsache, dass der Windows-Code-Seite 1252 ursprünglich auf einem ANSI-Entwurf basiert-der internationale Organisation für Standardisierung (ISO) 8859-1 wurde. "ANSI-Anwendungen" sind in der Regel ein Hinweis auf nicht-nicht-Unicode- oder Code-basierte Anwendungen.
- ^ "Charaktersätze". www.iana.org. Archiviert vom Original am 2021-05-25. Abgerufen 2021-05-26.
- ^ "Extensible Markup Language (XML) 1.1 (zweite Ausgabe): Charaktercodierungen". W3c. 29. September 2006. Archiviert vom Original am 19. April 2021. Abgerufen 5. Oktober 2020.
- ^ Hylom (2017-11-14). "Windows 10 の Insider-Vorschau で ロケール を を utf-8 に オプション が 追加 さ れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる ロケール ロケール ロケール れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる れる [Die Option zum UTF-8 Die in Windows 10 Insider-Vorschau hinzugefügte Systemgebietsschema]. スラド (auf Japanisch). Archiviert vom Original am 2018-05-11. Abgerufen 2018-05-10.
- ^ "Charaktersätze". Iana. Archiviert vom Original am 2016-12-03. Abgerufen 2019-04-07.
- ^ Microsoft. "Windows 1250". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seite Informationen Dokument CPGID 01250". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ Microsoft. "Windows 1251". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seite Informationen Dokument CPGID 01251". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ Microsoft. "Windows 1252". Archiviert vom Original am 2013-05-04. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seite Informationen Dokument CPGID 01252". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ Microsoft. "Windows 1253". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seite Informationen Dokument CPGID 01253". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ Microsoft. "Windows 1254". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seite Informationen Dokument CPGID 01254". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ Microsoft. "Windows 1255". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seite Informationen Dokument CPGID 01255". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ Microsoft. "Windows 1256". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seite Informationen Dokument CPGID 01256". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ Microsoft. "Windows 1257". Archiviert vom Original am 2013-03-16. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seite Informationen Dokument CPGID 01257". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ Microsoft. "Windows 1258". Archiviert vom Original am 2013-10-25. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seite Informationen Dokument CPGID 01258". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-06.
- ^ IBM. "SBCS -Code -Seiteninformationsdokument - CPGID 00437". Archiviert vom Original am 2016-06-09. Abgerufen 2014-07-04.
- ^ "IBM-943 und IBM-932". IBM Knowledge Center. IBM. Archiviert vom Original am 2018-08-18. Abgerufen 2020-07-08.
- ^ "Converter Explorer: IBM-1373_P100-2002". ICU -Demonstration. Internationale Komponenten für Unicode. Archiviert vom Original am 2021-05-26. Abgerufen 2020-06-27.
- ^ "Codierte Zeichensatzkennungen - CCSID 5471". IBM Globalisierung. IBM. Archiviert von das Original Am 2014-11-29.
- ^ Julliard, Alexandre. "Dump_Krwansung_CodePage: Erstellen Sie die koreanische Wansung -Tabelle aus der KSX1001 -Datei". make_unicode: Codeseite .c -Dateien aus ftp.unicode.org Beschreibungen generieren. Weinprojekt. Archiviert vom Original am 2021-05-26. Abgerufen 2021-03-14.
- ^ IBM. "SBCS -Code -Seiteninformationsdokument - CPGID 00037". Archiviert vom Original am 2014-07-14. Abgerufen 2014-07-04.
- ^ Steele, Shawn (2005-09-12). "Code Seite 21027" Extended/Ext Alpha -Kleinbuchstaben "". Msdn. Archiviert vom Original am 2019-04-06. Abgerufen 2019-04-06.
- ^ a b c d e "Code -Seiten -Identifikatoren". docs.microsoft.com. Archiviert vom Original am 2019-04-07. Abgerufen 2019-04-07.
- ^ a b c d e "Code -Seiten -Identifikatoren". Microsoft Developer Network. Microsoft. 2014. Archiviert Aus dem Original am 2016-06-19. Abgerufen 2016-06-19.
- ^ a b c d e "Webcodings - Internet Explorer - Codings". Waswg Wiki. 2012-10-23. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Westeuropäische (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Deutsche (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Swedish (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "Norwegische (IA5) Codierung - Windows Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Foller, Antonin (2014) [2011]. "US -Ascii -Codierung - Windows -Charsets". Wutils.com - Online -Web -Dienstprogramm und Hilfe. Motobit -Software. Archiviert vom Original am 2016-06-20. Abgerufen 2016-06-20.
- ^ Nechayev, Valentin (2013) [2001]. "Überprüfung des 8-Bit-Cyrillic Codings-Universums". Archiviert vom Original am 2016-12-05. Abgerufen 2016-12-05.
Externe Links
- API -Referenz für Nationalsprache (National Language Support).Tabelle mit ANSI- und OEM-Codepages pro Sprache (von Web-Archive, seit Microsoft die Originalseite entfernt hat)
- Iana Charset Name Registrierungen
- Unicode -Mapping -Tabelle für Windows -Code -Seiten
- Unicode -Zuordnungen von Windows -Code -Seiten mit "Best Fit"