Charakter kombinieren

Im Digitale Typografie, Charaktere kombinieren sind Figuren das sollen andere Zeichen ändern. Die häufigsten kombinierten Charaktere im lateinischen Skript sind die Kombinieren diakritische Markierungen (einschließlich Akzente kombinieren).
Unicode Enthält auch viele Vorkomponierte Zeichen, damit es in vielen Fällen möglich ist, sowohl Diakritik als auch vorkomponierte Zeichen bei der Auswahl des Benutzers oder der Anwendung zu verwenden. Dies führt zu einer Voraussetzung für die Durchführung Unicode -Normalisierung Vor dem Vergleich von zwei Unicode -Zeichenfolgen und zum sorgfältigen Entwerfen von Codierungswandlern, um alle gültigen Möglichkeiten zur Darstellung eines Charakters in Unicode auf eine ältere Codierung zu kartieren, um Datenverlust zu vermeiden.[1]
In Unicode, dem Hauptblock der Kombination von Diakritik für europäische Sprachen und der Internationales Phonetisches Alphabet IS U+0300–U+036F. Die Kombination von diakritischen Markierungen ist auch in vielen anderen Blöcken von Unicode -Zeichen vorhanden. In Unicode werden Diakritika immer nach dem Hauptcharakter hinzugefügt (im Gegensatz zu einigen älteren kombinierten Charaktersätzen wie z. Ansel), und es ist möglich, demselben Charakter mehrere Diakritika hinzuzufügen, einschließlich gestapelter Diakritik oben und unten, obwohl einige Systeme diese möglicherweise nicht gut machen.
Unicode -Bereiche
Die folgenden Blöcke sind speziell für die Kombination von Zeichen gewidmet:
- Kombinieren Sie diakritische Markierungen (0300–036F), da Version 1.0 mit Modifikationen in nachfolgenden Versionen bis 4.1 nach
- Kombinieren Sie diakritische Markierungen verlängert (1AB0–1AFF), Version 7.0
- Kombination diakritischer Markierungen (1DC0–1dff), Versionen 4.1 bis 5,2
- Kombination diakritischer Markierungen für Symbole (20D0–20ff) seit Version 1.0 mit Modifikationen in nachfolgenden Versionen bis 5.1
- Kombinieren von Halbmarken (Fe20 - FE2F), Versionen 1.0 mit Modifikationen in nachfolgenden Versionen bis 8,0
Die Kombination von Zeichen ist nicht auf diese Blöcke beschränkt. Zum Beispiel die Kombination Dakuten (U+3099) und Kombination Handakuten (U+309a) sind in der Hiragana -Block, das Devanagari Block enthält kombinierte Vokalzeichen und andere Markierungen für die Verwendung mit diesem Skript und so weiter. Kombinieren Zeichen werden zugewiesen, die Unicode -Hauptkategorie "M" ("mark").
Kombination diakritischer Markierungen[1] Offizielles Unicode -Konsortium -Code -Diagramm (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+030x | ◌̀ | ◌́ | ◌̂ | ◌̃ | ◌̄ | ◌̅ | ◌̆ | ◌ | ◌̈ | ◌̉ | ◌̊ | ◌̋ | ◌̌ | ◌̍ | ◌̎ | ◌̏ |
U+031x | ◌̐ | ◌̑ | ◌̒ | ◌̓ | ◌̔ | ◌̕ | ◌̖ | ◌̗ | ◌̘ | ◌̙ | ◌̚ | ◌̛ | ◌̜ | ◌̝ | ◌̞ | ◌̟ |
U+032x | ◌̠ | ◌̡ | ◌̢ | ◌̣ | ◌̤ | ◌̥ | ◌̦ | ◌̧ | ◌̨ | ◌̩ | ◌̪ | ◌̫ | ◌̬ | ◌̭ | ◌̮ | ◌̯ |
U+033x | ◌̰ | ◌̱ | ◌̲ | ◌̳ | ◌̴ | ◌̵ | ◌̶ | ◌̷ | ◌̸ | ◌̹ | ◌̺ | ◌̻ | ◌̼ | ◌̽ | ◌̾ | ◌̿ |
U+034x | ◌̀ | ◌́ | ◌͂ | ◌̓ | ◌̈́ | ◌ͅ | ◌͆ | ◌͇ | ◌͈ | ◌͉ | ◌͊ | ◌͋ | ◌͌ | ◌͍ | ◌͎ | CGJ |
U+035x | ◌͐ | ◌͑ | ◌͒ | ◌͓ | ◌͔ | ◌͕ | ◌͖ | ◌͗ | ◌͘ | ◌͙ | ◌͚ | ◌͛ | ◌͜◌ | ◌͝◌ | ◌͞◌ | ◌͟◌ |
U+036x | ◌͠◌ | ◌͡◌ | ◌͢◌ | ◌ͣ | ◌ͤ | ◌ͥ | ◌ͦ | ◌ͧ | ◌ͨ | ◌ͩ | ◌ͪ | ◌ͫ | ◌ͬ | ◌ͭ | ◌ͮ | ◌ͯ |
Anmerkungen
|
Codepoints U+032a und U+0346–034a sind IPA Symbole:
- U+032a◌̪: zahnärztlich
- U+0346◌͆: dentolabial
- U+0347◌͇: Alveolar
- U+0348◌͈: stark Artikulation
- U+0349◌͉: Schwache Artikulation
- U+034a◌͊: Denasal
Codepoints U+034B - 034E sind IPA -Diakritik für ungeordnete Rede:
- U+034B◌͋: Nasal -Flucht
- U+034c◌͌: velopharyngeale Reibung
- U+034d◌͍: Labiale Ausbreitung
- U+034e◌͎: pfeifte Artikulation
U+034f ist das "Kombinieren von Graphem Joiner"(CGJ) und hat keine sichtbare Glyphe.
Codepoints U+035C - 0362 sind Doppelte Diakritik, diakritische Schilder über zwei Buchstaben platziert.
Codepoints U+0363–036F sind mittelalterliche Superschriftenbriefdiakritik, Briefe, die direkt über anderen Briefen geschrieben sind, die in mittelalterlichen germanischen Manuskripten erscheinen, in einigen Fällen bis zum 19. Jahrhundert jedoch in einigen Fällen verwendet. Zum Beispiel ist U+0364 ein e über dem vorhergehenden Buchstaben geschrieben, für (verwendet werden für (Frühzeitig) Neues Hochdeutsch Umlaut Notation, wie z. uͤ für moderne Deutsch ü.
Kombination diakritischer Markierungen verlängert[1][2] Offizielles Unicode -Konsortium -Code -Diagramm (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1ABX | ◌᪰ | ◌᪱ | ◌᪲ | ◌᪳ | ◌᪴ | ◌᪵ | ◌᪶ | ◌᪷ | ◌᪸ | ◌᪹ | ◌᪺ | ◌᪻ | ◌᪼ | ◌᪽ | ◌᪾ | ◌ᪿ |
U+1ACX | ◌ᫀ | ◌᫁ | ◌᫂ | ◌᫃ | ◌᫄ | ◌᫅ | ◌᫆ | ◌᫇ | ◌᫈ | ◌᫉ | ◌᫊ | ◌᫋ | ◌ᫌ | ◌ᫍ | ◌ᫎ | |
U+1ADX | ||||||||||||||||
U+1aex | ||||||||||||||||
U+1AFX | ||||||||||||||||
Anmerkungen |
Kombination diakritischer Markierungen[1] Offizielles Unicode -Konsortium -Code -Diagramm (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1DCX | ◌᷀ | ◌᷁ | ◌᷂ | ◌᷃ | ◌᷄ | ◌᷅ | ◌᷆ | ◌᷇ | ◌᷈ | ◌᷉ | ◌᷊ | ◌᷋ | ◌᷌ | ◌᷍ | ◌᷎ | ◌᷏ |
U+1DDX | ◌᷐ | ◌᷑ | ◌᷒ | ◌ᷓ | ◌ᷔ | ◌ᷕ | ◌ᷖ | ◌ᷗ | ◌ᷘ | ◌ᷙ | ◌ᷚ | ◌ᷛ | ◌ᷜ | ◌ᷝ | ◌ᷞ | ◌ᷟ |
U+1DEX | ◌ᷠ | ◌ᷡ | ◌ᷢ | ◌ᷣ | ◌ᷤ | ◌ᷥ | ◌ᷦ | ◌ᷧ | ◌ᷨ | ◌ᷩ | ◌ᷪ | ◌ᷫ | ◌ᷬ | ◌ᷭ | ◌ᷮ | ◌ᷯ |
U+1DFX | ◌ᷰ | ◌ᷱ | ◌ᷲ | ◌ᷳ | ◌ᷴ | ◌᷵ | ◌᷶ | ◌᷷ | ◌᷸ | ◌᷹ | ◌᷺ | ◌᷻ | ◌᷼ | ◌᷽ | ◌᷾ | ◌᷿ |
Anmerkungen
|
Kombinieren Sie diakritische Markierungen für Symbole[1][2] Offizielles Unicode -Konsortium -Code -Diagramm (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+20DX | ◌⃐ | ◌⃑ | ◌⃒ | ◌⃓ | ◌⃔ | ◌⃕ | ◌⃖ | ◌⃗ | ◌⃘ | ◌⃙ | ◌⃚ | ◌⃛ | ◌⃜ | ◌⃝ | ◌⃞ | ◌⃟ |
U+20ex | ◌⃠ | ◌⃡ | ◌⃢ | ◌⃣ | ◌⃤ | ◌⃥ | ◌⃦ | ◌⃧ | ◌⃨ | ◌⃩ | ◌⃪ | ◌⃫ | ◌⃬ | ◌⃭ | ◌⃮ | ◌⃯ |
U+20fx | ◌⃰ | |||||||||||||||
Anmerkungen |
Halbmarken kombinieren[1] Offizielles Unicode -Konsortium -Code -Diagramm (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+Fe2x | ◌︠ | ◌︡ | ◌︢ | ◌︣ | ◌︤ | ◌︥ | ◌︦ | ◌︧ | ◌︨ | ◌︩ | ◌︪ | ◌︫ | ◌︬ | ◌︭ | ◌︮ | ◌︯ |
Anmerkungen
|
Offener Typ
Offener Typ hat die CCMP "Feature -Tag", um Glyphen zu definieren, die Kompositionen oder Zerlegungen sind, die Charaktere kombinieren, die Kennzeichen Tag, um die Positionierung von Kombination von Zeichen auf Basisglyphen zu definieren, und mkmk für die Positionierungen, Zeichen aufeinander zu kombinieren.
ZALGO -Text

Das Kombinieren von Zeichen wurde zum Erstellen verwendet ZALGO -Text, das ist Text, der aufgrund einer Überbeanspruchung der Diakritike "beschädigt" oder "gruselig" erscheint. Dies führt dazu, dass sich der Text vertikal erstreckt und andere Text überlappt.[2]
Siehe auch
- Gepunkteter Kreis
- Totschlüssel
- Abstandsmodifikatorbuchstaben Was sich nicht kombinieren sollte (obwohl sie bei einigen Implementierungen fälschlicherweise tun, bei denen ein Entwickler "mit" Modifikator "verwechselt hat)
Anmerkungen
- ^ Zum Beispiel beim Konvertieren zwischen Windows-1258 und VisciiErsteres verwendet die Kombination von Diakritikern, während die letztere eine große Auswahl der vorkomponierten Zeichen aufweist. Ein Konverter, der eine einfache Zuordnung zwischen Codewerten und Unicode -Codepunkten verwendet, beschädigt den Text beim Konvertieren zwischen ihnen.
- ^ Korpela, Jukka K. "Wie funktioniert Zalgo Text?". Paketüberfluss. Abgerufen 11. April 2019.
Externe Links
- Kombinieren von Diakritik -Diagramm (in Adobe PDF Format)
- Kombinieren Sie Diakritentrafterdiagramme (in Adobe PDF Format)
- Markierungen kombinieren Testseite mit kombinierten und vorkomponierten Buchstaben
- Alan Woods Unicode -Ressourcen
- Decodeunicode.org kombiniert diakritische Markierungen Referenz