ISO 11940
ISO 11940 ist ein ISO Standard für die Transliteration von Thai -Charaktere1998 veröffentlicht und im September 2003 aktualisiert und 2008 bestätigt. Eine Erweiterung dieses Standards benannt ISO 11940-2 Definiert eine vereinfachte Transkription basierend darauf.
Konsonanten
Thai | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ISO | k | k̄h | ḳ̄H | kh | k̛h | ḳH | ng | c | CH | CH | s | CH | ỵ |
Thai | ฎ | ฏ | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | |
ISO | ḍ | ṭ | ̄̄h | ṯH | t̛h | ṇ | d | t | t̄h | th | ṭh | n | |
Thai | บ | ป | ผ | ฝ | พ | ฟ | ภ | ม | |||||
ISO | b | p | p̄h | f | pH | f | p̣h | m | |||||
Thai | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ |
ISO | y | r | v | l | ł | w | s | s | s | h | ḷ | x | h |
Das Transliteration des reinen Konsonanten wird von ihrer üblichen Aussprache als anfänglicher Konsonant abgeleitet. Ein nicht markiertes h wird verwendet, um zu bilden Digraphen bezeichnet Aspirierte Konsonanten. Hohe und niedrige Konsonantenpaare werden systematisch differenziert, indem a angewendet werden Längezeichen zum hochklassigen Konsonanten. Weitere Differenzierung von Konsonanten mit identisch phonetisch Die Funktion wird erhalten, indem das häufigste unmarkiertes Verlassen des zweithäufigsten durch einen Punkt darunter markiert wird, das drittmonische markiert durch ein Horn markiert und das vierthäufigste durch Unterstreichung markiert. Die Verwendung eines Punktes unten hat einen ähnlichen Effekt wie das Indologisch Praxis der Unterscheidung Retroflex -Konsonanten Nach einem Punkt unten, aber es gibt subtile Unterschiede - es sind die Transliterationen von ธ Tho Tanga und ศ Also Sala das sind unten gepunktet, nicht die der entsprechenden Retroflex -Konsonanten. Die Transliterationen von Konsonanten sollten in den Auftragsbasisbuchstaben, Macron, wenn überhaupt, eingegeben werden, und dann unterhalb des Horns oder "Macron unten".
Nur drei Konsonanten haben das Horn in ihrer Transliteration, ฅ Kho Khon, ฒ Tho Phuthao und ษ Also ruesiund nur ein Konsonant hat eine Unterstreichung, ฑ tho nang monato.
Vokale
Thai | ะ | - ั | า | ำ | - ิ | - ี | - ึ | - ื | - ุ | - ู | เ | แ | โ | ใ | ไ | ฤ | ฤๅ | ฦ | ฦๅ | ย | ว | อ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ISO | a | ạ | ā | å | i | ī | ụ | ụ̄ | u | ū | e | æ | o | ı | ị | v | vɨ | ł | ɨɨ | y | w | x |
Der Buchstabe å ist das einzige vorkomponierte Zeichen, das in der Ausgabe der Transliteration angegeben ist.
Lakkhangyao (ๅ) wurde nur in Kombination mit den Vokalbuchstaben ฤ und ฦ gezeigt. Der Standard listet einfach ฤ und ฦ mit den Konsonanten auf und Lakkhangyao mit den Vokalen. Ein isoliert Lakkhangyao würde auch durch einen kleinen Buchstaben "I" mit Schlaganfall (mit Schlaganfall (ɨ), aber so sollte nicht in Thai, Pāli oder Sanskrit auftreten.
Die Transliterationen von ว wo waen und อ o Ang wurden hier wegen ihrer Verwendung als vollständige Vokalsymbole aufgenommen, aber ihre Transliteration hängt nicht davon ab, wie sie verwendet werden, und der Standard listet sie einfach mit den Konsonanten auf.
Verbindungsvokalsymbole werden gemäß ihren Bestandteilen transliteriert.
Andere kombinierte Marken
Thai | - ่ | - ้ | - ๊ | - ๋ | - ็ | - ์ | - ๎ | - ํ | - ฺ |
---|---|---|---|---|---|---|---|---|---|
ISO | –̀ | –̂ | –́ | –̌ | –̆ | –̒ | ~ | –̊ | –̥ |
Beachten Sie, dass Yamakkan ( - ๎ ๎ ๎) wird durch eine Abstands -Tilde dargestellt, nicht durch eine Superschriften -Tilde.
Zeichensetzung und Ziffern
Thai | ๆ | ฯ | ๏ | ฯ | ๚ | ๛ | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ISO | « | ǂ | § | ǀ | ǁ | » | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
ISO 11940: 1998 unterscheidet das Abkürzungssymbol Paiyannoi (ฯ) aus dem Satzterminator Angkhandiao (ฯ), obwohl weder der nationale Charakterstandard Standard TIS 620-2533 Noch Unicode Version 5.0 unterscheidet sie. Paiyannoi wird übersetzt wie ǂ und Angkhandiao wird übersetzt wie ǀ. Beachten Sie, dass Paiyannoi, Angkhandiao und Angkhankhu (๚) Werden durch die verwendeten Buchstaben übersetzt Klicken Sie auf Konsonanten, nicht durch Doppeldolch, vertikale Balken oder Dandas.
Zeichensequenzierung
Im Allgemeinen werden Zeichen von links nach rechts übersetzt und, wo Zeichen die gleiche horizontale Position haben, von oben nach unten. Die vertikale Sequenzierung wird tatsächlich einfach als Tonmarken angegeben und Thanthakhat ( - ์) vor anderen Markierungen über oder unter dem Konsonanten. Der Standard bestreitet am Ende von Abschnitt 4.2, dass die Kombination von Sara u (◌ ุ, ◌ ู) und Nikkhahit (◌ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ ํ) gibt es anschließend an) Nikkhahit, zeigt aber nicht die Transliteration der Kombination. Die Auswirkung dieser Regeln ist das, außer auf NikkhahitAlle nicht vokalen Markierungen, die an einem Konsonanten in Thai verbunden sind, sind dem Konsonanten in der römischen Transliteration gebunden.
Der Standard räumt das ein Versuch Die Transponierung der vorbereiteten Vokale und Konsonanten kann denjenigen beruhigt sein, die an die gewohnt sind Roman Alphabet, empfiehlt jedoch, dass vorgegebene Vokale nicht transponiert werden.
Zum Beispiel, ภาษาไทย (RTGs:Phasa Thai) sollte übersetzt werden auf p̣hās̛̄āịthy und เชียงใหม่ (RTGs:Chiang Mai) zu echīyngıh̄m̀.
Variationen
Ursachen
Der Standard gibt die Reihenfolge an, in der die Akzente getippt werden sollten, aber nicht alle Eingabesysteme werden Akzente in der Reihenfolge aufgezeichnet, in der sie getippt werden. Unicode gibt zwei normalisierte Formen für Buchstaben mit mehreren Akzenten an, und transliterateter Text wird in einer dieser Formen sehr wahrscheinlich gespeichert. Dies kompliziert die automatische Rücktransliteration. Da Unicode-konforme Prozesse solche Variationen korrekt behandeln müssen, wurden die Transliterationen auf dieser Seite zur einfachen Anzeige ausgewählt-heutige Rendering-Systeme können äquivalente Formen unterschiedlich anzeigen.
Viele Schriftarten zeigen neue Kombinationen von Konsonanten und Akzenten schlecht. Zum Beispiel das Institut der Estnische Sprache veröffentlicht eine Erklärung der Anwendung des Standards auf Thai Im Internet und mit einer Ausnahme scheint dies eine Einhaltung des Standards zu sein. Die Ausnahme besteht darin, dass Akzente über Konsonanten mit Ausnahme des Macron tatsächlich rechts ausgeglichen sind, was den Eindruck erweckt, dass sie als entsprechende nicht kombinierende Zeichen eingegeben wurden. Der Standard gibt die Transliterationen in Codepunkten an, aber jemand, der aus dieser freien Erklärung arbeitet, kann leicht ableiten, dass die Abstandsformen der Tonakzente verwendet werden sollten.
ICU (CLDR 1.4.1)
Das ICU Implementierung, aufgezeichnet in Version 1.4.1 der Gemeinsames Gebietsschema -Datenrepository gefördert durch Unicode,[1] Verwendet eine Prime anstelle eines Horns in der Transliteration von Konsonanten. Dies wirkt sich auf die Transliteration von ฅ aus Kho Khon, ฒ Tho Phuthao und ษ Also bo ruesi. ฏ nach Patak wird auch anders transliteriert wie t statt ṭ.
Diese Implementierung transliteriert ำ alsả Anstatt von å Um Unklarheiten mit der hypothetischen thailändischen Skriptsequenz zu vermeiden ะํ (Sara a, Nikkhahit). Die ICU -Implementierung transliteratiert ฺ Phinthu wie ˌstatt Probleme mit Unicode Normalisierung. Dies hat den Nebeneffekt, die Lesbarkeit zu verbessern, wenn sie auf einen nicht angegebenen Konsonanten angewendet werden.
Die ICU -Implementierung transliteratiert ฯ Paiyannoi wie ‡ (Doppeldolch) und Angkhankhu wie || (Zwei ASCII -vertikale Balken). Da die ICU -Implementierung Unicode verwendet, kann sie nicht zuverlässig unterscheiden Angkhandiao aus Paiyannoi ohne semantische Analyse und macht keinen solchen Versuch.
Die Zeichensequenzierung der ICU -Implementierung ist unterschiedlich. Es wandelt die vorgegriffenen Vokale mit dem folgenden Konsonanten und verarbeitet die Markierungen eines Konsonanten in der Reihenfolge, in der sie im Speicher gespeichert sind. (Die meisten thailändischen Eingabemethoden stellen sicher, dass die Markierungen im unteren Bereich bis zur oberen Reihenfolge gespeichert werden.) Sie transponiert nicht vorgegebene Vokale mit vollständigen Konsonantenclustern. Konsonante Cluster können nicht mit vollständiger Genauigkeit identifiziert werden, und die Transponierung der Vokale mit Clustern müssten ein zusätzliches Symbol erfordern, um eine zuverlässige Konvertierung in das thailändische Skript zurückzugeben.
Zum Beispiel unter dieser Implementierung ภาษาไทย Übersetzer zu p̣hās̄ʹāthịy und เชียงใหม่ zu cheīyngh̄ım̀.
Schließlich generiert diese Implementierung Übersetzungen in Unicode -Normalisierung Form C (NFC).
Siehe auch
- Liste der ISO -Transliterationen
- Romanisierung von Lao
- Romanisierung von Thai
- Royal Thai Allgemeines Transkriptionssystem
Verweise
- ^ http://unicode.org/public/cldr/1.4.1/core.zip Dateien transformiert/thailogical-latin.xml und transformiert/thai-thailogical.xml (verwendet von Die Transliteratoren der Intensivstation "Thai-Latin" und "Latein-Thai")