Windows-1258
Mime / Iana | Windows-1258 |
---|---|
Alias (e) | CP1258 (Codepage 1258) |
Sprachen) | Vietnamesisch, Englisch, Französisch, Deutsch, Spanisch, dänisch, norwegisch, Schwedisch, finnisch, irisch, albanisch, Luxemburgisch, Tswana. Mit der Kombination von Diakritikern: estnisch, Italienisch, Portugiesisch, Yoruba, Guarani, Igbo, Devanagari Transliteration. |
Erstellt von | Microsoft |
Standard | Waswg Codierungsstandard |
Einstufung | erweiterte ASCII, Windows-125x |
Bezogen auf | Windows-1252 |
Windows-1258 ist ein Codepage benutzt in Microsoft Windows zu repräsentieren Vietnamesisch Texte. Es benutzt von Kombination diakritischer Markierungen.
Windows-1258 ist kompatibel mit weder dem vietnamesischen Standard (TCVN 5712 / Vscii) oder die verschiedenen anderen in der Praxis verwendeten Kodierungen (Viscii, Vni, VPS). Vielmehr ist es sehr ähnlich zu Windows-1252Da die Unterschiede darin bestehen, dass S-Caron und Z-Caron (die später zu Windows-1252 hinzugefügt wurden) fehlen, wurden fünf der Buchstaben mit Diakritik durch Kombination von Diakritik für ersetzt Vietnamesische Tonmarkenman wurde durch das ersetzt đông Zeichenund acht weitere (vier pro Fall) wurden in vier ansonsten nicht unterstützt Vietnamesische Briefe.
Die Verwendung von Diakritiken bedeutet, dass Windows-1258 die große Anzahl von Kombinationen von Buchstaben und Tonmarken in Vietnamesen abdecken kann, ohne die Abdeckung von Kontrollcodes oder -Symbolen zu beeinträchtigen. Dies bedeutet jedoch auch, dass die Software darauf achten muss, Conversions zwischen vorkomponierten Zeichen zu verarbeiten und Sequenzen korrekt zu kombinieren, wenn sie in/von anderen Codierungen konvertieren und die Ermittlung der benutzerfreundlichen Länge einer Zeichenfolge erschweren.
IBM Verwendet Code Seite 1258 (Ccsid 1258 und Eurozeichen Erweitert CCSID 5354) für Windows-1258.[1][2][3]
UTF-8 ist die bevorzugte Kodierung für Vietnamesisch in modernen Anwendungen. Windows-1258 kann nicht immer Rundfahrt Unicode codierte Vietnamesen aufgrund von Änderungen durch Veränderungen durch Unicode -Normalisierung.[4] Die Kombination von Diakritiken wird nach dem Buchstaben sowohl in Windows-1258 als auch in Unicode codiert[4] (wie Vni, nicht wie Ansel).
Zeichensatz
Die folgende Tabelle zeigt Windows-1258. Jeder Charakter wird mit seinem dargestellt Unicode Äquivalent.
Windows-1258[5][6][7][8][9][10] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
0x | Nul | Soh | Stx | ETX | Eot | Enq | Ack | Bel | BS | Ht | Lf | Vt | Ff | Cr | ALSO | Si |
1x | Dle | DC1 | DC2 | DC3 | DC4 | Nak | Syn | ETB | KANN | Em | Sub | ESC | Fs | Gs | Rs | UNS |
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | Del |
8x | € | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | ‹ | Œ | |||||
9x | ‘ | ’ | “ | ” | • | – | — | ˜ | ™ | › | œ | Ÿ | ||||
Axt | NBSP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | SCHÜCHTERN | ® | ¯ |
BX | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
CX | À | Á | Â | Ă | Ä | Å | Æ | Ç | È | É | Ê | Ë | ◌̀ | Í | Î | Ï |
Dx | Đ | Ñ | ◌̉ | Ó | Ô | Ơ | Ö | × | Ø | Ù | Ú | Û | Ü | Ư | ◌̃ | ß |
Ex | à | á | â | ă | ä | å | æ | ç | è | é | ê | ë | ◌́ | í | î | ï |
Fx | đ | ñ | ◌̣ | ó | ô | ơ | ö | ÷ | ø | ù | ú | û | ü | ư | ₫ | ÿ |
Unterschiede aus Windows-1252 |
Code Seite 1129
IBMs Code Seite 1129 (Ccsid 1129 und Eurozeichen erweiterte CCSID 1163)[11][12][13] ähnelt der Code Seite 1258, aber mit den folgenden Unterschieden:
Code Seite 1129 (Unterschiede von Code Seite 1258)[14][15][16][17][18][19] | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Axt | NBSP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | œ | © | ª | « | ¬ | SCHÜCHTERN | ® | ¯ |
BX | ° | ± | ² | ³ | Ÿ | µ | ¶ | · | Œ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
Unterschiede zu Windows-1258 |
Siehe auch
Verweise
- ^ "Code Seite 1258 Informationsdokument". Archiviert von das Original Am 2016-03-03.
- ^ "CCSID 1258 Informationsdokument". Archiviert von das Original Am 2014-11-29.
- ^ "CCSID 5354 Informationsdokument". Archiviert von das Original Am 2014-11-29.
- ^ a b Kaplan, Michael S. (2005-04-19). "Ein paar der Gotchas von Multibytetowidechar". Alles aussortieren.
- ^ Steele, Shawn (1998-04-15). "CP1258 zu Unicode -Tabelle". Microsoft.
- ^ Unicode -Zuordnungen von Windows 1258 mit "Best Fit"
- ^ Code Seite CPGID 01258 (PDF) (PDF), IBM
- ^ Code Seite CPGID 01258 (TXT), IBM
- ^ Internationale Komponenten für Unicode (ICU), IBM-1258_P100-1997.UCM, 2002-12-03
- ^ Internationale Komponenten für Unicode (ICU), IBM-5354_P100-1998.UCM, 2002-12-03
- ^ "Code Seite 1129 Informationsdokument". Archiviert von das Original Am 2010-09-21.
- ^ "CCSID 1129 Informationsdokument". Archiviert von das Original am 2016-03-27.
- ^ "CCSID 1163 Informationsdokument". Archiviert von das Original Am 2014-11-29.
- ^ Lunde, Ken (13. Januar 2009). "Anhang L: Vietnamesische Charakter -Sets" (PDF). CJKV -Informationsverarbeitung (2. Aufl.). ISBN 978-0-596-51447-1.
- ^ Code Seite CPGID 01129 (PDF) (PDF), IBM
- ^ Code Seite CPGID 01129 (TXT), IBM
- ^ Internationale Komponenten für Unicode (ICU), IBM-1129_P100-1997.UCM, 2002-12-03
- ^ Code Seite CPGID 01163 (PDF) (PDF), IBM
- ^ Code Seite CPGID 01163 (TXT), IBM