Charakter kombinieren

Cyrillic y kombiniert mit Breve gibt ў.

Im Digitale Typografie, Charaktere kombinieren sind Figuren das sollen andere Zeichen ändern. Die häufigsten kombinierten Charaktere im lateinischen Skript sind die Kombinieren diakritische Markierungen (einschließlich Akzente kombinieren).

Unicode Enthält auch viele Vorkomponierte Zeichen, damit es in vielen Fällen möglich ist, sowohl Diakritik als auch vorkomponierte Zeichen bei der Auswahl des Benutzers oder der Anwendung zu verwenden. Dies führt zu einer Voraussetzung für die Durchführung Unicode -Normalisierung Vor dem Vergleich von zwei Unicode -Zeichenfolgen und zum sorgfältigen Entwerfen von Codierungswandlern, um alle gültigen Möglichkeiten zur Darstellung eines Charakters in Unicode auf eine ältere Codierung zu kartieren, um Datenverlust zu vermeiden.[1]

In Unicode, dem Hauptblock der Kombination von Diakritik für europäische Sprachen und der Internationales Phonetisches Alphabet IS U+0300–U+036F. Die Kombination von diakritischen Markierungen ist auch in vielen anderen Blöcken von Unicode -Zeichen vorhanden. In Unicode werden Diakritika immer nach dem Hauptcharakter hinzugefügt (im Gegensatz zu einigen älteren kombinierten Charaktersätzen wie z. Ansel), und es ist möglich, demselben Charakter mehrere Diakritika hinzuzufügen, einschließlich gestapelter Diakritik oben und unten, obwohl einige Systeme diese möglicherweise nicht gut machen.

Unicode -Bereiche

Die folgenden Blöcke sind speziell für die Kombination von Zeichen gewidmet:

  • Kombinieren Sie diakritische Markierungen (0300–036F), da Version 1.0 mit Modifikationen in nachfolgenden Versionen bis 4.1 nach
  • Kombinieren Sie diakritische Markierungen verlängert (1AB0–1AFF), Version 7.0
  • Kombination diakritischer Markierungen (1DC0–1dff), Versionen 4.1 bis 5,2
  • Kombination diakritischer Markierungen für Symbole (20D0–20ff) seit Version 1.0 mit Modifikationen in nachfolgenden Versionen bis 5.1
  • Kombinieren von Halbmarken (Fe20 - FE2F), Versionen 1.0 mit Modifikationen in nachfolgenden Versionen bis 8,0

Die Kombination von Zeichen ist nicht auf diese Blöcke beschränkt. Zum Beispiel die Kombination Dakuten (U+3099) und Kombination Handakuten (U+309a) sind in der Hiragana -Block, das Devanagari Block enthält kombinierte Vokalzeichen und andere Markierungen für die Verwendung mit diesem Skript und so weiter. Kombinieren Zeichen werden zugewiesen, die Unicode -Hauptkategorie "M" ("mark").

Kombination diakritischer Markierungen[1]
Offizielles Unicode -Konsortium -Code -Diagramm (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+030x ◌̀ ◌́ ◌̂ ◌̃ ◌̄ ◌̅ ◌̆ ◌̈ ◌̉ ◌̊ ◌̋ ◌̌ ◌̍ ◌̎ ◌̏
U+031x ◌̐ ◌̑ ◌̒ ◌̓ ◌̔ ◌̕ ◌̖ ◌̗ ◌̘ ◌̙ ◌̚ ◌̛ ◌̜ ◌̝ ◌̞ ◌̟
U+032x ◌̠ ◌̡ ◌̢ ◌̣ ◌̤ ◌̥ ◌̦ ◌̧ ◌̨ ◌̩ ◌̪ ◌̫ ◌̬ ◌̭ ◌̮ ◌̯
U+033x ◌̰ ◌̱ ◌̲ ◌̳ ◌̴ ◌̵ ◌̶ ◌̷ ◌̸ ◌̹ ◌̺ ◌̻ ◌̼ ◌̽ ◌̾ ◌̿
U+034x ◌̀ ◌́ ◌͂ ◌̓ ◌̈́ ◌ͅ ◌͆ ◌͇ ◌͈ ◌͉ ◌͊ ◌͋ ◌͌ ◌͍ ◌͎ CGJ
U+035x ◌͐ ◌͑ ◌͒ ◌͓ ◌͔ ◌͕ ◌͖ ◌͗ ◌͘ ◌͙ ◌͚ ◌͛ ◌͜◌ ◌͝◌ ◌͞◌ ◌͟◌
U+036x ◌͠◌ ◌͡◌ ◌͢◌ ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ
Anmerkungen
1. ^ Ab der Unicode Version 14.0

Codepoints U+032a und U+0346–034a sind IPA Symbole:

Codepoints U+034B - 034E sind IPA -Diakritik für ungeordnete Rede:

  • U+034B◌͋: Nasal -Flucht
  • U+034c◌͌: velopharyngeale Reibung
  • U+034d◌͍: Labiale Ausbreitung
  • U+034e◌͎: pfeifte Artikulation

U+034f ist das "Kombinieren von Graphem Joiner"(CGJ) und hat keine sichtbare Glyphe.

Codepoints U+035C - 0362 sind Doppelte Diakritik, diakritische Schilder über zwei Buchstaben platziert.

Codepoints U+0363–036F sind mittelalterliche Superschriftenbriefdiakritik, Briefe, die direkt über anderen Briefen geschrieben sind, die in mittelalterlichen germanischen Manuskripten erscheinen, in einigen Fällen bis zum 19. Jahrhundert jedoch in einigen Fällen verwendet. Zum Beispiel ist U+0364 ein e über dem vorhergehenden Buchstaben geschrieben, für (verwendet werden für (Frühzeitig) Neues Hochdeutsch Umlaut Notation, wie z. für moderne Deutsch ü.

Kombination diakritischer Markierungen verlängert[1][2]
Offizielles Unicode -Konsortium -Code -Diagramm (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1ABX ◌᪰ ◌᪱ ◌᪲ ◌᪳ ◌᪴ ◌᪵ ◌᪶ ◌᪷ ◌᪸ ◌᪹ ◌᪺ ◌᪻ ◌᪼ ◌᪽ ◌᪾ ◌ᪿ
U+1ACX ◌ᫀ ◌᫁ ◌᫂ ◌᫃ ◌᫄ ◌᫅ ◌᫆ ◌᫇ ◌᫈ ◌᫉ ◌᫊ ◌᫋ ◌ᫌ ◌ᫍ ◌ᫎ
U+1ADX
U+1aex
U+1AFX
Anmerkungen
1. ^ Ab der Unicode Version 14.0
2. ^ Graubereiche geben nicht zugewiesene Codepunkte an
Kombination diakritischer Markierungen[1]
Offizielles Unicode -Konsortium -Code -Diagramm (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1DCX ◌᷀ ◌᷁ ◌᷂ ◌᷃ ◌᷄ ◌᷅ ◌᷆ ◌᷇ ◌᷈ ◌᷉ ◌᷊ ◌᷋ ◌᷌ ◌᷍ ◌᷎ ◌᷏
U+1DDX ◌᷐ ◌᷑ ◌᷒ ◌ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ
U+1DEX ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ᷭ ◌ᷮ ◌ᷯ
U+1DFX ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ ◌᷵ ◌᷶ ◌᷷ ◌᷸ ◌᷹ ◌᷺ ◌᷻ ◌᷼ ◌᷽ ◌᷾ ◌᷿
Anmerkungen
1. ^ Ab der Unicode Version 14.0
Kombinieren Sie diakritische Markierungen für Symbole[1][2]
Offizielles Unicode -Konsortium -Code -Diagramm (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+20DX ◌⃐ ◌⃑ ◌⃒ ◌⃓ ◌⃔ ◌⃕ ◌⃖ ◌⃗ ◌⃘ ◌⃙ ◌⃚ ◌⃛ ◌⃜ ◌⃝ ◌⃞ ◌⃟
U+20ex ◌⃠ ◌⃡ ◌⃢ ◌⃣ ◌⃤ ◌⃥ ◌⃦ ◌⃧ ◌⃨ ◌⃩ ◌⃪ ◌⃫ ◌⃬ ◌⃭ ◌⃮ ◌⃯
U+20fx ◌⃰
Anmerkungen
1. ^ Ab der Unicode Version 14.0
2. ^ Graubereiche geben nicht zugewiesene Codepunkte an
Halbmarken kombinieren[1]
Offizielles Unicode -Konsortium -Code -Diagramm (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+Fe2x ◌︠ ◌︡ ◌︢ ◌︣ ◌︤ ◌︥ ◌︦ ◌︧ ◌︨ ◌︩ ◌︪ ◌︫ ◌︬ ◌︭ ◌︮ ◌︯
Anmerkungen
1. ^ Ab der Unicode Version 14.0

Offener Typ

Offener Typ hat die CCMP "Feature -Tag", um Glyphen zu definieren, die Kompositionen oder Zerlegungen sind, die Charaktere kombinieren, die Kennzeichen Tag, um die Positionierung von Kombination von Zeichen auf Basisglyphen zu definieren, und mkmk für die Positionierungen, Zeichen aufeinander zu kombinieren.

ZALGO -Text

Ein Satz von Zalgo -Text

Das Kombinieren von Zeichen wurde zum Erstellen verwendet ZALGO -Text, das ist Text, der aufgrund einer Überbeanspruchung der Diakritike "beschädigt" oder "gruselig" erscheint. Dies führt dazu, dass sich der Text vertikal erstreckt und andere Text überlappt.[2]

Siehe auch

Anmerkungen

  1. ^ Zum Beispiel beim Konvertieren zwischen Windows-1258 und VisciiErsteres verwendet die Kombination von Diakritikern, während die letztere eine große Auswahl der vorkomponierten Zeichen aufweist. Ein Konverter, der eine einfache Zuordnung zwischen Codewerten und Unicode -Codepunkten verwendet, beschädigt den Text beim Konvertieren zwischen ihnen.
  2. ^ Korpela, Jukka K. "Wie funktioniert Zalgo Text?". Paketüberfluss. Abgerufen 11. April 2019.

Externe Links