Windows-1258

Windows-1258
Mime / Iana Windows-1258
Alias ​​(e) CP1258 (Codepage 1258)
Sprachen) Vietnamesisch, Englisch, Französisch, Deutsch, Spanisch, dänisch, norwegisch, Schwedisch, finnisch, irisch, albanisch, Luxemburgisch, Tswana.
Mit der Kombination von Diakritikern:
estnisch, Italienisch, Portugiesisch, Yoruba, Guarani, Igbo, Devanagari Transliteration.
Erstellt von Microsoft
Standard Waswg Codierungsstandard
Einstufung erweiterte ASCII, Windows-125x
Bezogen auf Windows-1252

Windows-1258 ist ein Codepage benutzt in Microsoft Windows zu repräsentieren Vietnamesisch Texte. Es benutzt von Kombination diakritischer Markierungen.

Windows-1258 ist kompatibel mit weder dem vietnamesischen Standard (TCVN 5712 / Vscii) oder die verschiedenen anderen in der Praxis verwendeten Kodierungen (Viscii, Vni, VPS). Vielmehr ist es sehr ähnlich zu Windows-1252Da die Unterschiede darin bestehen, dass S-Caron und Z-Caron (die später zu Windows-1252 hinzugefügt wurden) fehlen, wurden fünf der Buchstaben mit Diakritik durch Kombination von Diakritik für ersetzt Vietnamesische Tonmarkenman wurde durch das ersetzt đông Zeichenund acht weitere (vier pro Fall) wurden in vier ansonsten nicht unterstützt Vietnamesische Briefe.

Die Verwendung von Diakritiken bedeutet, dass Windows-1258 die große Anzahl von Kombinationen von Buchstaben und Tonmarken in Vietnamesen abdecken kann, ohne die Abdeckung von Kontrollcodes oder -Symbolen zu beeinträchtigen. Dies bedeutet jedoch auch, dass die Software darauf achten muss, Conversions zwischen vorkomponierten Zeichen zu verarbeiten und Sequenzen korrekt zu kombinieren, wenn sie in/von anderen Codierungen konvertieren und die Ermittlung der benutzerfreundlichen Länge einer Zeichenfolge erschweren.

IBM Verwendet Code Seite 1258 (Ccsid 1258 und Eurozeichen Erweitert CCSID 5354) für Windows-1258.[1][2][3]

UTF-8 ist die bevorzugte Kodierung für Vietnamesisch in modernen Anwendungen. Windows-1258 kann nicht immer Rundfahrt Unicode codierte Vietnamesen aufgrund von Änderungen durch Veränderungen durch Unicode -Normalisierung.[4] Die Kombination von Diakritiken wird nach dem Buchstaben sowohl in Windows-1258 als auch in Unicode codiert[4] (wie Vni, nicht wie Ansel).

Zeichensatz

Die folgende Tabelle zeigt Windows-1258. Jeder Charakter wird mit seinem dargestellt Unicode Äquivalent.

Windows-1258[5][6][7][8][9][10]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
0x Nul Soh Stx ETX Eot Enq Ack Bel BS Ht Lf Vt Ff Cr ALSO Si
1x Dle DC1 DC2 DC3 DC4 Nak Syn ETB KANN Em Sub ESC Fs Gs Rs UNS
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ Del
8x ƒ ˆ Œ
9x ˜ œ Ÿ
Axt NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SCHÜCHTERN ® ¯
BX ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
CX À Á Â Ă Ä Å Æ Ç È É Ê Ë ◌̀ Í Î Ï
Dx Đ Ñ ◌̉ Ó Ô Ơ Ö × Ø Ù Ú Û Ü Ư ◌̃ ß
Ex à á â ă ä å æ ç è é ê ë ◌́ í î ï
Fx đ ñ ◌̣ ó ô ơ ö ÷ ø ù ú û ü ư ÿ
 Unterschiede aus Windows-1252

Code Seite 1129

IBMs Code Seite 1129 (Ccsid 1129 und Eurozeichen erweiterte CCSID 1163)[11][12][13] ähnelt der Code Seite 1258, aber mit den folgenden Unterschieden:

Code Seite 1129 (Unterschiede von Code Seite 1258)[14][15][16][17][18][19]
0 1 2 3 4 5 6 7 8 9 EIN B C D E F
8x
9x
Axt NBSP ¡ ¢ £ ¤ ¥ ¦ § œ © ª « ¬ SCHÜCHTERN ® ¯
BX ° ± ² ³ Ÿ µ · Œ ¹ º » ¼ ½ ¾ ¿
 Unterschiede zu Windows-1258

Siehe auch

Verweise

  1. ^ "Code Seite 1258 Informationsdokument". Archiviert von das Original Am 2016-03-03.
  2. ^ "CCSID 1258 Informationsdokument". Archiviert von das Original Am 2014-11-29.
  3. ^ "CCSID 5354 Informationsdokument". Archiviert von das Original Am 2014-11-29.
  4. ^ a b Kaplan, Michael S. (2005-04-19). "Ein paar der Gotchas von Multibytetowidechar". Alles aussortieren.
  5. ^ Steele, Shawn (1998-04-15). "CP1258 zu Unicode -Tabelle". Microsoft.
  6. ^ Unicode -Zuordnungen von Windows 1258 mit "Best Fit"
  7. ^ Code Seite CPGID 01258 (PDF) (PDF), IBM
  8. ^ Code Seite CPGID 01258 (TXT), IBM
  9. ^ Internationale Komponenten für Unicode (ICU), IBM-1258_P100-1997.UCM, 2002-12-03
  10. ^ Internationale Komponenten für Unicode (ICU), IBM-5354_P100-1998.UCM, 2002-12-03
  11. ^ "Code Seite 1129 Informationsdokument". Archiviert von das Original Am 2010-09-21.
  12. ^ "CCSID 1129 Informationsdokument". Archiviert von das Original am 2016-03-27.
  13. ^ "CCSID 1163 Informationsdokument". Archiviert von das Original Am 2014-11-29.
  14. ^ Lunde, Ken (13. Januar 2009). "Anhang L: Vietnamesische Charakter -Sets" (PDF). CJKV -Informationsverarbeitung (2. Aufl.). ISBN 978-0-596-51447-1.
  15. ^ Code Seite CPGID 01129 (PDF) (PDF), IBM
  16. ^ Code Seite CPGID 01129 (TXT), IBM
  17. ^ Internationale Komponenten für Unicode (ICU), IBM-1129_P100-1997.UCM, 2002-12-03
  18. ^ Code Seite CPGID 01163 (PDF) (PDF), IBM
  19. ^ Code Seite CPGID 01163 (TXT), IBM

Externe Links