Tamilischer Skriptcode für den Informationsaustausch
Tamilischer Skriptcode für den Informationsaustausch (Tscii) ist ein Codierungsschema zur Darstellung der Tamilischer Skript. Die unteren 128 CodePoints sind einfach ASCIIDie oberen 128 CodePoints sind TSCII-spezifisch. Nach langer Jahren, als sie nur durch private Vereinbarung im Internet eingesetzt wurde, wurde es erfolgreich mit dem registriert Iana in 2007.[1]
Tscii codiert die Zeichen in visueller (geschriebener) Reihenfolge und entspricht der Verwendung der tamilischen Schreibmaschine.
Unicode hat die logische Order -Codierungsstrategie für Tamil verwendet Isciiim Gegensatz zum Fall von Thai, wo die visuelle Ordnung kodiert, die sich umgeht TIS-620 wurde adoptiert.
Die Regierung von Tamil Nadu Billigt seine eigenen Registerkarten-/TAM-Standards für 8-Bit-Codierung und andere ältere Codierungsschemata auf dem WWW noch.
Die kostenlose ETEXT -Sammlung bei Projekt Madurai verwendet die Tscii Codierung, hat aber bereits begonnen zu bieten Unicode Versionen.
Geschichte
Die Notwendigkeit einer gemeinsamen Codierung für Tamil wurde Mitte der neunziger Jahre von Mitgliedern verschiedener Mailinglistenbasis-Foren empfunden, da in diesen Foren mehrere benutzerdefinierte codierte Schriftarten vorherrschten. Während einige der kommerziellen Kodierungen beliebt waren als die anderen, wurden sie aufgrund widersprüchlicher kommerzieller Interessen nicht von der breiteren Gemeinschaft akzeptiert. Während Unicode von den meisten als zukünftiger Standard akzeptiert wurde, waren die meisten Desktop-Systeme zu diesem Zeitpunkt immer noch nicht in der Lage, Unicode für die tamilische Sprache zu bearbeiten, und eine Zwischenbit-Codierung war erforderlich.
Eine separate Mailingliste für die Diskussion solcher Encodings ([email protected]) wurde 1997 erstellt, um diese Diskussion zu initiieren, beginnend mit einer E -Mail, die von geschrieben wurde Dr.K.Kalyanasundaram an den beliebten tamilischen Autor Sujatha der das Komitee für die Standardisierung der tamilischen Tastatur leitete.[2] Dieses Forum zog schnell begeisterte Teilnehmer aus der ganzen Welt an, darunter mehrere prominente tamilische Gelehrte. Archive dieser Diskussion werden von erhalten Infitt.[3]
Nach der Veröffentlichung von TSCII wurde die meisten Mitglieder der Mailingliste von [email protected] Teil von Infitt, eine breitere Initiative, um die Standardisierung und die fortgesetzte Entwicklung in verschiedenen Bereichen des tamilischen Computers zu erzielen.
Codepage -Layout
Tscii | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | EIN | B | C | D | E | F | |
8x | ௦[a] | ௧ | ஸ்ரீ | ஜ | ஷ | ஸ | ஹ | க்ஷ | ஜ் | ஷ் | ஸ் | ஹ் | க்ஷ் | ௨ | ௩ | ௪ |
9x | ௫ | ‘ | ’ | “ | ” | ௬ | ௭ | ௮ | ௯ | ஙு | ஞு | ஙூ | ஞூ | ௰ | ௱ | ௲ |
Axt | NBSP | ா | ி | ீ | ு | ூ | ெ | ே | ை | © | ௗ | அ | ஆ | ஈ | உ | |
BX | ஊ | எ | ஏ | ஐ | ஒ | ஓ | ஔ | ஃ | க | ங | ச | ஞ | ட | ண | த | ந |
CX | ப | ம | ய | ர | ல | வ | ழ | ள | ற | ன | டி | டீ | கு | சு | டு | ணு |
Dx | து | நு | பு | மு | யு | ரு | லு | வு | ழு | ளு | று | னு | கூ | சூ | டூ | ணூ |
Ex | தூ | நூ | பூ | மூ | யூ | ரூ | லூ | வூ | ழூ | ளூ | றூ | னூ | க் | ங் | ச் | ஞ் |
Fx | ட் | ண் | த் | ந் | ப் | ம் | ய் | ர் | ல் | வ் | ழ் | ள் | ற் | ன் | இ |
- ^ U+0BE6 Tamil Digit Zero, das mit Unicode Version 4.1 im März 2005 hinzugefügt wurde
Conversion -Tools
Sie können UTF-8-codierte Dokumente mit den GNU-Iconv-Tools wie folgt in TSCII konvertieren.
$ iconv -f utf -8 -t tscii hello.utf8> hello.tscii
Während der Umwandlung von TSCII in UTF-8 durch Austausch durchgeführt wird -f und -t Flaggen.
Visuelle Anwendung
Ein Open -Source -Projekt ist bei erhältlich Anytafont2UTF8 wird von Isaiyini Tamil Community aufrechterhalten
Siehe auch
- Tace16 (Tamilisch alle Charaktercodierung)