Alphabetischer Reihenfolge

Alphabetischer Reihenfolge ist ein System, bei dem Charakterzeichenfolgen werden in der Reihenfolge auf der Grundlage der Position der Zeichen in der herkömmlichen Reihenfolge von eins platziert Alphabet. Es ist eine der Methoden von Kollation. In Mathematik, a Lexikografische Ordnung ist die Verallgemeinerung der alphabetischen Ordnung auf andere Datentypen, wie z. Sequenzen von Zahlen oder anderen geordneten mathematische Objekte.

Bei Anwendung auf Strings oder Sequenzen Das kann neben alphabetischen Zeichen neben alphabetischen Zeichen die alphabetischen Reihenfolge im Allgemeinen genannt Lexikografische Ordnung.

Um zu bestimmen, welches der zwei Zeichenzeichen an erster Stelle steht, wenn sie sich in alphabetischer Reihenfolge anordnen Briefe werden verglichen. Wenn sie sich unterscheiden, kommt der Zeichenfolge, dessen erster Buchstabe früher im Alphabet vorkommt, vor die andere Zeichenfolge. Wenn die ersten Buchstaben gleich sind, werden die zweiten Buchstaben verglichen und so weiter. Wenn eine Position erreicht ist, bei der eine Zeichenfolge keine Buchstaben mehr zu vergleichen hat, während die andere die erste (kürzere) Zeichenfolge in alphabetischer Reihenfolge an erster Stelle steht.

Großbuchstaben (oberer Fall) werden allgemein als identisch angesehen mit ihren entsprechenden unteren Fallbuchstaben für die Zwecke der alphabetischen Reihenfolge, obwohl Konventionen angenommen werden können, um Situationen zu behandeln, in denen sich zwei Zeichenfolgen unterscheiden nur in Kapitalisierung. Es gibt auch verschiedene Konventionen für die Handhabung von Strings, die enthalten Räume, modifizierte Buchstaben (z. B. diejenigen mit Diakritik) und Nicht-Letter-Charaktere wie Marks von Interpunktion.

Das Ergebnis des Platzierens einer Reihe von Wörtern oder Saiten in alphabetischer Reihenfolge ist, dass alle mit demselben Buchstaben beginnenden Saiten zusammen gruppiert sind. Innerhalb dieser Gruppierung werden alle Wörter, die mit derselben Zwei-Buchstaben-Sequenz beginnen, zusammen gruppiert; usw. Das System maximiert somit die Anzahl der gemeinsamen Anfangsbuchstaben zwischen benachbarten Wörtern.

Geschichte

Die alphabetische Ordnung wurde erstmals im 1. Jahrtausend verwendet BCE von nordwestlichen semitischen Schriftgelehrten mit dem Abjad System.[1] Eine Reihe anderer Methoden zur Klassifizierung und Bestellung von Material, einschließlich geografischer, chronologisch, Hierarchisch und nach Kategorie, wurden seit Jahrhunderten der alphabetischen Ordnung bevorzugt.[2]

Das Bibel ist datiert mit dem 6. bis 7. Jahrhundert v. Chr. In dem Buch von Jeremia, der Prophet nutzt das Atbash Substitution Chiffrebasierend auf alphabetischer Reihenfolge. In ähnlicher Weise verwendeten biblische Autoren Akrostik Basierend auf der (geordneten) Hebräisch Alphabet.[3]

Die erste effektive Verwendung der alphabetischen Ordnung als Katalogisierungsvorrichtung unter Wissenschaftlern war möglicherweise in der alten Alexandria.[4] in dem Große Bibliothek von Alexandria, der ungefähr 300 v. Chr. Gründete. Der Dichter und der Gelehrte Callimachus, der dort gearbeitet hat, soll den ersten der Welt geschaffen haben Bibliothekskatalog, bekannt als Pinakes, mit Schriftrollen in alphabetischer Reihenfolge des ersten Buchstabens der Namen der Autoren.[2]

Im 1. Jahrhundert v. Chr., Römischen Schriftsteller Varro Kompilierte alphabetische Listen von Autoren und Titeln.[5] Im 2. Jahrhundert n. Chr., Sextus Pompeius Festus schrieb eine Enzyklopädie Inbegriff der Werke von Verrius flaccus, De Verborum signifikant, mit Einträgen in alphabetischer Reihenfolge.[6] Im 3. Jahrhundert n. Chr., Harpokation schrieb ein Homerisch Lexikon, die durch alle Buchstaben alphabetisiert wurden.[7] Im 10. Jahrhundert der Autor des Autors der Suda verwendete alphabetische Ordnung mit phonetischen Variationen.

Die alphabetische Ordnung als Hilfe zur Konsultation begann, den Mainstream von zu betreten Westeuropäische Intellektuelles Leben in der zweiten Hälfte des 12. Jahrhunderts, als alphabetische Werkzeuge entwickelt wurden, um zu helfen Prediger analysieren biblisch Wortschatz. Dies führte zur Zusammenstellung von Alphabetikern Konkordanzen der Bibel durch die Dominikanische Brüder in Paris im 13. Jahrhundert unter Hugh von Saint Cher. Ältere Referenzwerke wie z. Heiliger Jerome's Interpretationen hebräischer Namen wurden zur einfachen Beratung alphabetisiert. Die Verwendung der alphabetischen Ordnung wurde zunächst von Gelehrten widerstanden, die erwarteten, dass ihre Schüler ihren Studienbereich gemäß ihren eigenen rationalen Strukturen beherrschen. Sein Erfolg wurde von Tools wie in Anspruch genommen wie Robert KilwardbyIndex zu den Werken von Sankt Augustin, was den Lesern half, auf den vollständigen Originaltext zuzugreifen, anstatt von den Zusammenstellungen von abhängig zu sein Auszüge die im 12. Jahrhundert prominent geworden war Scholastik. Die Einführung der alphabetischen Ordnung war Teil des Übergangs vom Primat von Erinnerung zu dem der schriftlichen Werke.[8] Die Idee, Informationen in der Reihenfolge des Alphabets zu bestellen, traf auch den Widerstand der Compiler von Encyclopaedias im 12. und 13. Jahrhundert, die alle fromme Kirchenmänner waren. Sie zogen es vor, ihr Material zu organisieren theologisch - in der Ordnung der Schöpfung Gottes, beginnend mit Deus (bedeutet Gott).[2]

1604 Robert Cawdrey musste erklären Tabelle Alphabeticall, Der Erste einsprachig Englisch Wörterbuch, "Jetzt, wenn das Wort, das du bist, willst du mit (a) dann zu Beginn dieses Tisches anfangen, aber wenn mit (v) gegen Ende anscheint".[9] Obwohl erst 1803 Samuel Taylor Coleridge Verurteilte Enzyklopädien mit "eine Anordnung, die durch den Unfall der Anfangsbuchstaben bestimmt" wurde,[10] Viele Listen basieren heute auf diesem Prinzip.

Die Anordnung in der alphabetischen Reihenfolge kann als Kraft zur Demokratisierung des Zugangs zu Informationen angesehen werden, da es keine umfassenden Vorkenntnisse erfordert, um herauszufinden, was benötigt wurde.[2]

Bestellung im lateinischen Skript

Grundreihenfolge und Beispiele

Die Standardreihenfolge der Moderne ISO Basic Latin Alphabet ist:

A-b-d-d-e-f-h-i-j-k-l-m-n-o-p-r-s-t-u-v-w-x-z

Ein Beispiel für eine einfache alphabetische Bestellung folgt:

  • Wie; Aster; Astrolabe; Astronomie; Astrophysik; Bei; Ataman; Attacke; Baa

Ein anderes Beispiel:

  • Barnacle; Sei; Gewesen; Nutzen; Gebogen

Die obigen Wörter sind alphabetisch geordnet. Wie kommt davor Aster Weil sie mit den gleichen zwei Buchstaben beginnen und Wie hat danach keine Briefe mehr, während Aster tut. Die nächsten drei Wörter kommen danach Aster Weil ihr vierter Buchstabe (der erste, der sich unterscheidet) ist r, was danach kommt e (der vierte Brief von Aster) im Alphabet. Diese Worte selbst werden basierend auf ihren sechsten Buchstaben bestellt (l, n und p beziehungsweise). Dann kommt Bei, was sich von den vorhergehenden Wörtern im zweiten Buchstaben unterscheidet (t Kommt danach s). Ataman Kommt danach Bei aus dem gleichen Grund, den Aster kam nach Wie. Attacke folgt Ataman basierend auf dem Vergleich ihrer dritten Buchstaben und basierend Baa kommt nach all den anderen, weil es einen anderen ersten Buchstaben hat.

Behandlung von Multiwort -Saiten

Wenn einige der Saiten aus mehr als einem Wort bestehen, d. H. Sie enthalten, enthalten sie Räume oder andere Separatoren wie z. BindestricheDann können zwei grundlegende Ansätze verfolgt werden. Im ersten Ansatz werden alle Zeichenfolgen zunächst nach ihrem ersten Wort wie in der Sequenz geordnet:

  • Eiche; Oak Hill; Eichenallee; Oakley Park; Oakley River
    wo alle Saiten mit dem separaten Wort beginnen Eiche gehen all jenen an, die anfangen Oakley, Weil Eiche voraus Oakley in alphabetischer Reihenfolge.

Im zweiten Ansatz werden Saiten alphabetisiert, als hätten sie keine Räume, was die Sequenz ergibt:

  • Eiche; Oak Hill; Oakley Park; Oakley River; Eichenallee
    wo Eichenallee Jetzt kommt nach der Oakley Saiten, wie es wäre, wenn es "Oakridge" geschrieben worden wäre.

Der zweite Ansatz ist derjenige, der normalerweise in Wörterbüchern verfolgt wird, und er wird daher oft genannt Wörterbuchordnung durch Verlag. Der erste Ansatz wurde oft in verwendet BuchindizesObwohl jeder Verlag traditionell seine eigenen Standards festlegte, für welchen Ansatz darin verwendet wird; Es gab keinen ISO -Standard für Buchindizes (ISO 999) vor 1975.

Spezialfälle

Modifizierte Buchstaben

Auf französische, modifizierte Briefe (wie diejenigen mit Diakritik) werden genauso wie der Grundbuchstaben für alphabetische Bestellzwecke behandelt. Zum Beispiel, Rolle kommt dazwischen Felsen und Rose, als ob es geschrieben wäre Rolle. Sprachen, die solche Briefe verwenden, haben jedoch systematisch ihre eigenen Bestellregeln. Sehen Sprachspezifische Konventionen unter.

Bestellung nach Familienname

In den meisten Kulturen wo Familiennamen sind nachher geschrieben VornamenEs ist weiterhin erwünscht, zuerst Listen von Namen (wie in Telefonverzeichnissen) nach Familiennamen zu sortieren. In diesem Fall müssen Namen neu angeordnet werden, um korrekt sortiert zu werden. Zum Beispiel sollten Juan Hernandes und Brian O'Leary als "Hernandes, Juan" und "O'Leary, Brian" sortiert werden, auch wenn sie nicht so geschrieben sind. Das Erfassen dieser Regel in einem Computerkollationsalgorithmus ist komplex, und einfache Versuche werden fehlschlagen. Sofern der Algorithmus beispielsweise eine umfangreiche Liste von Familiennamen zur Verfügung stellt, gibt es keine Möglichkeit zu entscheiden, ob "Gillian Lucille van der Waal" "van der Waal, Gillian Lucille", "Waal, Gillian Lucille van der" ist. oder sogar "Lucille van der Waal, Gillian".

Die Bestellung durch den Nachnamen tritt häufig in akademischen Kontexten auf. Innerhalb eines einzelnen Multi-Autor-Papiers wird die Anordnung der Autoren alphabetisch nach Familiennamen und nicht nach anderen Methoden wie umgekehrter Dienstalter oder subjektivem Beitrag zur Arbeit als "Anerkennung ähnlicher Beiträge" oder "vermeiden [ing] Disharmonie in zusammenarbeitenden Gruppen ".[11] Die Praxis in bestimmten Bestellfeldern Zitate Es wurde festgestellt, dass in Bibliographien durch die Nachnamen ihrer Autoren eine Verzerrung zugunsten von Autoren mit Nachnamen erzeugt, die früher im Alphabet erscheinen, während dieser Effekt nicht in Feldern erscheint, in denen Bibliografien chronologisch geordnet werden.[12]

Das und andere gemeinsame Wörter

Wenn eine Phrase mit einem sehr häufigen Wort (wie "das", "a" oder "ein", als Artikel in Grammatik bezeichnet) beginnt, wird dieses Wort manchmal ignoriert oder bis zum Ende des Satzes bewegt, aber dies ist nicht immer das Fall. Zum Beispiel das Buch "Das Leuchten"könnte als" leuchtend "oder" leuchtend, der "und damit vor dem Buchtitel" behandelt werden.Sommer von Sam". Es kann jedoch auch als einfach" das Seuchen "und nach" Summer of Sam "behandelt werden. Ähnlich", "ähnlich"Eine Zeitfalt in der Zeit"könnte als" Falten in der Zeit "," Wrinkle in Time, a "oder" A Falten in der Zeit "behandelt werden. Alle drei Alphabetisierungsmethoden sind durch Algorithmus ziemlich einfach zu erstellen, aber viele Programme verlassen sich auf einfache Lexikografische Ordnung stattdessen.

Mac Präfixe

Die Präfixe M und MC In irischen und schottischen Nachnamen sind Abkürzungen für Mac und werden manchmal alphabetisiert, als ob die Rechtschreibung wäre Mac vollständig. Daher McKinley könnte vorher aufgeführt sein Regenmantel (Wie es wäre, wenn es als "Mackinley" dargestellt worden wäre). Seit dem Aufkommen computergesteuerter Listen wird diese Art von Alphabetisierung weniger häufig angetroffen, obwohl sie noch in britischen Telefonverzeichnissen verwendet wird.

St Präfix

Das Präfix St oder St. ist eine Abkürzung von "Saint" und traditionell alphabetisiert, als ob die Rechtschreibung ist Heilige vollständig. Also in einem Gazetteer Sankt Johannes könnte vorher aufgeführt sein Salem (Als ob es wäre, wenn es als "Saint Johns" formuliert worden wäre). Seit dem Aufkommen computergesteuerter Listen wird diese Art von Alphabetisierung weniger häufig angetroffen, obwohl sie manchmal noch verwendet wird.

Ligaturen

Ligaturen (Zwei oder mehr Buchstaben, die zu einem Symbol verschmolzen sind), die nicht als unterschiedliche Buchstaben gelten, wie z. Æ und Œ Auf Englisch werden typischerweise so zusammengefasst, als wären die Buchstaben getrennt - "Æther" und "Aether" würden im Verhältnis zu allen anderen Wörtern den gleichen Relativ geordnet. Dies gilt auch dann, wenn die Ligatur nicht rein stilistisch ist, wie in Lehnwörter und Markennamen.

Möglicherweise müssen besondere Regeln angenommen werden, um Zeichenfolgen zu sortieren, die nur danach variieren, ob zwei Briefe durch eine Ligatur verbunden sind.

Behandlung von Ziffern

Wenn einige der Saiten enthalten Ziffern (oder andere Nicht-Letter-Zeichen), verschiedene Ansätze sind möglich. Manchmal werden solche Charaktere so behandelt, als ob sie vor oder nach allen Buchstaben des Alphabets kamen. Eine andere Methode besteht darin, dass Zahlen alphabetisch sortiert werden, wie sie geschrieben werden würden: Zum Beispiel 1776 würde sortiert, als ob "siebzehn sechsundsiebzig" geschrieben hätte, und 24 Heures du Mans als ob "Vingt-Quatre ..." (Französisch für "vierundzwanzig"). Wenn Ziffern oder andere Symbole als spezielle grafische Formen von Buchstaben verwendet werden, wie 1337 zum Leet oder der Film Sieben (was stilisiert wurde als Se7en), sie können sortiert werden, als wären sie diese Briefe. Natürliche Sortierreihenfolge Bestellungsstaaten alphabetisch, außer dass mehrstellige Zahlen als einzelnes Zeichen behandelt und durch den Wert der von den Ziffern kodierten Zahl geordnet werden.

Im Falle des Monarchen und Päpste, obwohl ihre Zahlen in sind römische Zahlen und ähneln Briefen, sie sind normalerweise in numerischer Reihenfolge arrangiert: Also zum Beispiel, obwohl V nach mir, dem dänischen König, kommt Christian IX Kommt nach seinem Vorgänger Christian VIII.

Sprachspezifische Konventionen

Sprachen, die eine verwenden erweitertes lateinisches Alphabet haben im Allgemeinen ihre eigenen Konventionen für die Behandlung der zusätzlichen Buchstaben. Auch in einigen Sprachen sicher Digraphen werden als einzelne Buchstaben für Kollationszwecke behandelt. Zum Beispiel das 29-Buchstaben-Alphabet spanischer Leckereien ñ Als Grundbrief folgt nund früher die Digraphen behandelt CH und ll als grundlegende Buchstaben folgen c und l, beziehungsweise. CH und ll werden immer noch als Buchstaben angesehen, aber jetzt als Zwei-Buchstaben-Kombinationen alphabetisiert. (Die neue Alphabetisierungsregel wurde von der ausgestellt Königliche spanische Akademie 1994.) Andererseits der Digraph rr folgt Rqu Wie erwartet und tat dies auch vor der Alphabetisierungsregel von 1994.

In einigen Fällen, wie z. KiowaDas Alphabet wurde komplett neu angeordnet.

Die in verschiedenen Sprachen angewendeten Alphabetisierungsregeln sind nachstehend aufgeführt.

  • Im AserbaidschaniEs gibt acht zusätzliche Buchstaben in das Standard -Lateinalphabet. Fünf von ihnen sind Vokale: i, ı, ö, ü, ə und drei sind Konsonanten: ç, ş, ğ. Das Alphabet ist das gleiche wie das Türkisches Alphabet, mit den gleichen Geräuschen mit den gleichen Buchstaben, mit Ausnahme von drei zusätzlichen Buchstaben: Q, x und ə für Geräusche, die auf türkisch nicht existieren. Obwohl alle "türkischen Buchstaben" in ihrer "normalen" alphabetischen Reihenfolge wie im türkischen Reihenfolge zusammengefasst sind, werden die drei zusätzlichen Buchstaben willkürlich nach Briefen zusammengestellt, deren Geräusche sich ihnen nähern. Also wird Q kurz nach k, x zusammengestellt (ausgesprochen wie ein Deutscher CH) wird kurz nach H und ə (ungefähr wie ein englischer Kurzfilm ausgesprochen a) wird kurz nach e zusammengestellt.
  • Im BretonischEs gibt kein "C", "q", "x", aber es gibt die Digraphen "ch" und "c'h", die zwischen "B" und "D" zusammengestellt werden. Zum Beispiel: «Buzhugenn, Chug, C'hoar, Daeraouenn» (Regenwurm, Saft, Schwester, Tränenstrop).
  • Im Tschechisch und slowakisch, akzentuelle Vokale haben ein sekundäres Sammelgewicht-im Vergleich zu anderen Buchstaben werden sie als ihre nicht akzentuierten Formen behandelt (in Tschechisch, a-á, e-é-ě, i -í, o-ó, u-ú, y- Ý, und in Slowaka, a-á-er, e-é, i -í, o-ó-ô, u-ú, y-ý), aber dann werden sie nach den nicht akzentuierten Buchstaben sortiert (zum Beispiel die richtigen Lexikografische Ordnung ist Baa, Baá, Báa, Báá, Bab, Báb, Bac, Bác, Bač, Báč [in Tschechisch] und Baa, Baá, Baä, Báa, Báá, Báä, Bäa, Bäá, Bä, Báb, Bäb, Bäb, Bäb , Bac, Bác, Bäc, Bač, Báč, Bäc [in Slowaka]). Akzentierte Konsonanten haben ein primäres Sammelgewicht und werden unmittelbar nach ihren nicht akzentuierten Gegenstücken mit Ausnahme von ď, ň und ť (in Tschechisch) und ď, ĺ, ľ, ň, ŕ und ť (in Slowak) mit einem Sekundärgewicht gesammelt. CH wird als separater Brief angesehen und geht dazwischen H und I. In der Slowaka, DZ und werden auch als getrennte Buchstaben angesehen und zwischen positioniert Ď und E.
  • In dem Dänische und norwegische Alphabete, die gleichen zusätzlichen Vokale wie auf Schwedisch (siehe unten) sind ebenfalls vorhanden, aber in einer anderen Reihenfolge und mit unterschiedlich Glyphen (..., x, y, z, Æ, Ø, Å). Auch "AA" sucht als Äquivalent zu "Å" zusammen. Das dänische Alphabet hat "W" traditionell als eine Variante von "V" gesehen, aber heute wird "W" als separater Brief angesehen.
  • Im Niederländisch Die Kombination IJ (dargestellt IJ) war früher als Y (oder manchmal als separater Buchstabe: y <ij <z) zusammengestellt, wird aber derzeit größtenteils als 2 Buchstaben (II <ij <ik) zusammengestellt. Ausnahmen sind Telefonverzeichnisse; IJ wird hier immer als y zusammengestellt, weil in vielen niederländischen Familiennamen y verwendet wird, wo die moderne Schreibweise IJ erfordern würde. Beachten Sie, dass ein Wort, das mit IJ beginnt, das mit einer Hauptstadt I geschrieben ist Ijmuiden, der Fluss Ijssel und das Land Ijsland (Island).
  • Im Esperanto, Konsonanten mit Zirkumflex Akzente (ĉ, ĝ, ĥ, ĵ, ŝ), ebenso gut wie ŭ (u mit Breve), werden als getrennte Buchstaben gezählt und getrennt zusammengestellt (c, ĉ, d, e, f, g, ĝ, h, ĥ, i, j, ĵ ... s, ŝ, t, u, ŭ, v, z ).
  • Im estnisch õ, ä, ö und ü werden als getrennte Buchstaben angesehen und danach zusammenkommen w. Briefe š, z und ž erscheinen nur in Lehnwörtern und ausländischen Eigennamen und folgen Sie dem Brief s in dem Estnisches Alphabet, was sonst nicht vom lateinischen Grundalphabet unterscheidet.
  • Das Faroöisches Alphabet hat auch einige der dänischen, norwegischen und schwedischen zusätzlichen Briefe, nämlich Æ und Ø. Außerdem die Faroöisches Alphabet verwendet die isländische Eth, die dem folgt D. Fünf der sechs Vokale A, I, O, U und Y kann Akzente bekommen und danach über betrachtete Buchstaben sind. Die Konsonanten C, Q, X, W und Z werden nicht gefunden. Daher sind die ersten fünf Buchstaben A, Á, B, D und Ðund die letzten fünf sind V, Y, Ý, Æ, Ø
  • Im Filipino (Tagalog) und andere philippinische Sprachen, der Buchstabe ng wird als separater Buchstabe behandelt. Es ist ausgesprochen wie in Sing, Ping-Pong usw. Selbst wird es ausgesprochen Nang, aber im Allgemeinen Filipino OrthographieEs ist so geschrieben, als wären es zwei separate Buchstaben (N und G). Auch Brief Derivate (wie z. Ñ) Folgen Sie sofort dem Basisbuchstaben. Filipino wird auch mit Diakritik geschrieben, aber ihre Verwendung ist sehr selten (außer der Tilde). (Philippine Orthographie umfasst auch Rechtschreibung.)
  • Das Finnisches Alphabet und die Sammlung von Regeln entspricht den Schwedisch.
  • Zum Französisch, das letzte Akzent in einem bestimmten Wort bestimmt die Reihenfolge.[13] Zum Beispiel würden in Französisch die folgenden vier Wörter so sortiert: Cote <côte <coté <côté.
  • Im Deutsch Briefe mit Umlaut (Ä, Ö, Ü) werden im Allgemeinen genauso behandelt, genau wie ihre nicht impolierten Versionen; ß ist immer sortiert wie SS. Dies macht die alphabetische Ordnung Artit, Arg, Ärgerlich, Argument, Arm, Assistent, Aßlar, Assoziation. Für Telefonverzeichnisse und ähnliche Namenslisten sind die Umlauts wie die Buchstabenkombinationen "ae", "oe", "ue" zusammenzubringen, weil eine Reihe deutscher Nachnamen sowohl mit Umlaut als auch in der nicht ausgeliebten Form mit "E" E "E" E. "(Müller/Müller). Dies macht die alphabetische Ordnung Udet, Öbelacker, Uell, Ülle, Ueve, Üxkül, Uffenbach.
  • Das ungarisch Vokale haben Akzente, Umlauts und Doppelakzente, während Konsonanten mit einzelnen, doppelten (Digraphen) oder dreifachen (Trigraph-) Zeichen geschrieben sind. Bei der Sammlung entsprechen Akzentvokale ihren nicht akzentuierten Kollegen, und doppelte und dreifache Zeichen folgen ihren einzelnen Originalen. Die ungarische alphabetische Ordnung ist: A = á, B, c, CS, D, DZ, DZS, E = é, F, g, Gy, H, I = í, J, K, L,, Ly, M, n, NY, O = Ó, Ö = ő, P, q, r, s,, Sz, T, Ty, U = ú, Ü = ű, V, w, x, y, z, Zs. (Vor 1984, DZ und DZS wurden nicht als einzelne Buchstaben für die Kollation angesehen, sondern zwei Buchstaben jeweils, stattdessen d+z und d+zs.) Dies bedeutet, dass z. Nádcukor sollte vorausgehen Nádcsomó (wenngleich s Normalerweise geht es voraus u), seit c voraus CS in der Zusammenstellung. Der Unterschied in der Vokallänge sollte nur berücksichtigt werden, wenn die beiden Wörter ansonsten identisch sind (z. Egér, Éger). Räume und Bindestriche innerhalb von Phrasen werden bei der Zusammenstellung ignoriert. CH tritt auch als Digraph in bestimmten Wörtern auf, wird jedoch nicht als Graphem in Bezug auf die Zusammenfassung angesehen.
    Ein besonderes Merkmal der ungarischen Zusammenstellung ist, dass kontrahierte Formen von Doppel- und Trigraphen (wie z. ggy aus gy+gy oder ddzs aus DZS+DZS) sollte zusammengestellt werden, als ob sie vollständig geschrieben wären (unabhängig von der Tatsache der Kontraktion und der Elemente der Di- oder Trigraphen). Zum Beispiel, Kaszinó sollte vorausgehen Kassza (Obwohl der vierte Charakter z würde normalerweise danach kommen s im Alphabet), weil der vierte "Charakter" (Graphem) der Welt Kassza wird als Sekunde angesehen sz (Zersetzung SSZ hinein SZ+SZ), was folgt i (in Kaszinó).
  • Im isländisch, Þ wird hinzugefügt, und D wird gefolgt Ð. Jeder Vokal (a, e, i, o, u, y) folgt von seinem Korrespondenten mit akut: Á, é, í, Ó, ú, ý. Es gibt kein z, also endet das Alphabet: ... x, y, ý, Þ, Æ, Ö.
    • Beide Buchstaben wurden auch von verwendet Anglo-Sachse Schriftgelehrte, die auch den Runenbrief benutzten Wynn darstellen /w /.
    • Þ (Thorn genannt; Kleinbuchstaben Þ) ist auch ein Runenbuchstaben.
    • Ð (Eth; Kleinbuchstabe ð) ist der Buchstabe D mit einem zusätzlichen Schlaganfall.
  • Kiowa wird über phonetische Prinzipien bestellt, wie die Brahmische Skripteeher als auf der historischen lateinischen Ordnung. Vokale kommen zuerst, dann stoppen Konsonanten von vorne bis zum Mund und von negativ bis positiv Sprachzeitdann die Affrikate, Frikative, Flüssigkeiten und Nasen:
A, au, e, i, o, u, b, f, p, v, d, j, t, th, g, c, k, q, ch, x, s, z, l, y, w, H, m, n
  • Im litauischspeziell litauische Briefe verfolgen ihren lateinischen Originalen. Eine weitere Änderung ist das Y Kommt kurz zuvor J: ... g, h, i, į, y, j, k ...
  • Im Polieren, spezifisch polnische Buchstaben, die aus dem lateinischen Alphabet abgeleitet sind , ..., s, Ś, t, ..., z, ź, ż. Die Digraphen für Kollationszwecke werden so behandelt, als wären sie zwei getrennte Buchstaben.
  • Im Portugiesisch, Die Sammelordnung ist genau wie in Englisch: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Digraphen und Buchstaben mit Diakritik sind nicht im Alphabet enthalten.
  • Im rumänisch, Sonderzeichen, die aus dem lateinischen Alphabet abgeleitet sind, werden nach ihren Originalen zusammengestellt: a, ă, â, ..., i, î, ..., s, ș, t, ț, ..., Z.
  • Im Serbo-Kroatischer und andere verwandte südsklavische Sprachen, die fünf akzentuierten Charaktere und drei verbundenen Charaktere werden nach den Originalen sortiert: ..., c, č, č, ć, d, dž, đ, e, ..., l, lj, m, n , Nj, o, ..., s, Š, t, ..., z, ž.
  • Spanisch behandelt (bis 1994) "ch" und "ll" als einzelne Buchstaben, die eine Bestellung von geben cinco, credo, chispa und lomo, luz, llama. Dies ist nicht mehr wahr, da 1994 die Rae Die konventionellere Verwendung übernommen und jetzt wird LL zwischen LK und LM und CH zwischen CG und CI zusammengestellt. Die sechs Charaktere mit Diakritik á, é, í, Ó, ú, ü werden als die ursprünglichen Buchstaben a, e, i, o, u, zum Beispiel: radio, ráfaga, rana, rápido, rastrillo. Die einzige spanischspezifische Sammelfrage ist Ñ (eñe) als ein anderer Brief, der nach N. zusammengestellt wurde.
  • In dem Schwedisches AlphabetEs gibt drei zusätzliche Vokale am Ende platziert (..., x, y, z, Å, Ä, Ö), ähnlich wie das dänische und norwegische Alphabet, jedoch mit unterschiedlichen Glyphen und einer anderen Sammlung. Der Brief "W" wurde als Variante von "V" behandelt, aber in der 13. Ausgabe von Svenska akademiens ordlista (2006) "W" wurde als separater Brief angesehen.
  • In dem Türkisches Alphabet Es gibt 6 zusätzliche Buchstaben: ç, ğ, ı, Ö, ş und ü (aber kein Q, W und X). Sie werden nach C, ğ nach g, ı zusammengestellt Vor Ich, ö nach o, ş nach s und ü nach u. Ursprünglich, als das Alphabet 1928 eingeführt wurde, wurde ı nach mir gesammelt, aber die Reihenfolge wurde später geändert, so dass Buchstaben mit Formen mit Punkten, Cedilles oder anderen Schmuckmarken immer den Buchstaben mit entsprechenden bloßen Formen folgen. Beachten Sie, dass in der türkischen Orthographie der Buchstaben I das Majuskule von Totless ı ist, während İ das Majuscul der gepunkteten i ist.
  • In vielen Turkische Sprachen (wie zum Beispiel Azeri oder der Jaꞑalif Orthographie für Tatar), Früher gab es den Brief Gha (Ƣƣ), was dazwischen kam G und H. Es ist jetzt nicht genutzt.
  • Im VietnamesischEs gibt 7 zusätzliche Buchstaben: ă, â, đ, ê, ô, ơ, ư während f, j, w, z fehlen, obwohl sie noch in irgendeiner Verwendung sind (wie Internetadresse, ausländische Darlehenssprache). "F" wird durch die Kombination "pH" ersetzt. Das gleiche wie für "W" ist "qu".
  • Im Volapük ä, ö und ü werden als getrennte Buchstaben gezählt und getrennt zusammengestellt (a, ä, b ... o, ö, p ... u, ü, v) während q und w sind abwesend.[14]
  • Im Walisisch Die Digraphen CH, DD, FF, NG, LL, PH, RH und TH werden als einzelne Buchstaben behandelt, und jedes wird nach dem ersten Charakter des Paares (mit Ausnahme von NG, die nach G aufgeführt ist) aufgeführt, und erzeugt die Reihenfolge A. , B, C, Ch, D, DD, E, F, Ff, G, Ng, H usw. Es kann jedoch manchmal passieren, dass Wortverbindung zum Nebeneinander von zwei Buchstaben führt, die dies tun nicht einen Digraph bilden. Ein Beispiel ist das Wort llongyFarch (komponiert aus Llon + Gyfarch). Dies führt zu einer solchen Ordnung wie beispielsweise Lawr, Lwcus, Llong, Llom, Llongyfarch (Ng ist ein Digraph in Llong, jedoch nicht in Llongyfarch). Die Buchstabenkombination r+h (im Unterschied von der Digraph -RH) kann in ähnlicher Weise durch Nebeneinander in Verbindungen entstehen, obwohl dies tendenziell keine Paare produziert, in denen eine Fehlidentifikation die Ordnung beeinflussen kann. Für die anderen potenziell verwirrenden Buchstabenkombinationen, die auftreten können-nämlich d+d und l+l-wird bei der Schreibweise ein Bindestrich verwendet (z. B. ad-dal, chwil-lys).

Automatisierung

Kollationsalgorithmen (in Kombination mit Sortieren von Algorithmen) werden in der Computerprogrammierung verwendet, um Saiten in alphabetischer Reihenfolge zu platzieren. Ein Standardbeispiel ist das UNICODE COLLATION ALGORITHM, mit dem verwendet werden kann, um Strings mit allen enthalten Unicode Symbole in (eine Erweiterung der) alphabetischen Reihenfolge.[13] Es kann dazu geführt werden, dass es den meisten der oben beschriebenen sprachspezifischen Konventionen durch Anpassung seiner Standardkollationstabelle entspricht. Mehrere solcher Schneiderungen werden in gesammelt Gemeinsames Gebietsschema -Datenrepository.

Ähnliche Bestellungen

Das Prinzip hinter alphabetischer Ordnung kann weiterhin in Sprachen angewendet werden Alphabet - Zum Beispiel können sie mit a geschrieben werden Silbenschrift oder Abugida - vorausgesetzt, die verwendeten Symbole haben eine festgelegte Bestellung.

Zum logografisch Schreibsysteme wie Chinesen Hanzi oder Japanisch Kanjidie Methode von radikal-and-thropp-Sortierung wird häufig als Möglichkeit verwendet, eine Bestellung auf den Symbolen zu definieren. Japaner verwendet manchmal Aussprachereihenfolge, am häufigsten mit dem Gojūon bestellen, aber manchmal mit dem älteren Iroha Bestellung.

In Mathematik, Lexikografische Ordnung ist ein Mittel, um Sequenzen auf eine Weise zu bestellen, die zu der zur Erzeugung alphabetischer Ordnung verwendet wird.[15]

Einige Computeranwendungen verwenden eine Version alphabetischer Reihenfolge, die mit einem sehr einfachen erreicht werden kann Algorithmus, basierend auf dem ASCII oder Unicode Codes für Zeichen. Dies kann nicht standardmäßige Effekte haben, z. B. alle Kapitalbuchstaben vor niedrigeren Fall. Sehen Asciibetische Ordnung.

A Reimwörterbuch basiert auf der Sortierung von Wörtern in alphabetischer Reihenfolge von der letzten bis zum ersten Buchstaben des Wortes.

Siehe auch

Verweise

  1. ^ Reinhard G. Lehmann: "27-30-22-26. Wie viele Buchstaben benötigen ein Alphabet? Der Fall von semitisch", in: Die Idee des Schreiben, herausgegeben von Alex de Voogt und Joachim Friedrich Quack, Leiden: Brill 2012, S. 11–52.
  2. ^ a b c d Street, Julie (10. Juni 2020). "Von a bis z - Die überraschende Geschichte der alphabetischen Ordnung" (Text und Audio). ABC News (ABC Radio National). Australian Broadcasting Corporation. Abgerufen 6. Juli 2020.
  3. ^ z.B. Psalmen 25, 34, 37, 111, 112, 119 und 145 der hebräischen Bibel
  4. ^ Daly, Lloyd. Beiträge zur Geschichte der Alphabetisierung in der Antike und im Mittelalter. Brüssel, 1967. p. 25.
  5. ^ O'Hara, James (1989). "Messapus, Cycnus und der alphabetische Orden von Vergils Katalog italienischer Helden". Phönix. 43 (1): 35–38. doi:10.2307/1088539. JStor 1088539.
  6. ^ Livre XI - Texte Latin - Traduktion + Kommentare.
  7. ^ Gibson, Craig (2002). Interpretieren eines Klassiker: Demosthenes und seine alten Kommentatoren.
  8. ^ Rouse, Mary A.; Rouse, Richard M. (1991), ","Statim Invenire: Schulen, Prediger und neue Einstellungen zur Seite ",", Authentische Zeugen: Ansätze für mittelalterliche Texte und Manuskripte, University of Notre Dame Press, S. 201–219, ISBN 0-268-00622-9
  9. ^ Cawdrey, Robert (1604). Eine Tabelle alphabetisch. London. p. [A4] v.
  10. ^ Coleridge's Briefe, Nr. 507.
  11. ^ Tscharntke, Teja; Hochberg, Michael E; Rand, Tatyana A; Resh, Vincent H; Krauss, Jochen (Januar 2007). "Autorensequenz und Kredit für Beiträge in mehrfach genaueren Publikationen". PLOS Biol. 5 (1): e18. doi:10.1371/journal.bio.0050018. PMC 1769438. PMID 17227141.
  12. ^ Stevens, Jeffrey R.; Duque, Juan F. (2018). "Auftragsangelegenheiten: Alphabetisierende In-Text-Zitate verzerrten Zitierraten" (PDF). Psychonomisches Bulletin & Review. 26 (3): 1020–1026. doi:10.3758/s13423-018-1532-8. PMID 30288671. S2CID 52922399.
  13. ^ a b "Unicode Technischer Standard Nr. 10: Unicode Collation Algorithmus". Unicode, Inc. (unicode.org). 20. März 2008. Abgerufen 27. August 2008.
  14. ^ Midgley, Ralph. "Volapük zum englischen Wörterbuch" (PDF). Archiviert von das Original (PDF) am 1. September 2012. Abgerufen 24. September 2019.
  15. ^ Franz Baader; Tobias Nipkow (1999). Begriff umschreiben und all das. Cambridge University Press. S. 18–19. ISBN 978-0-521-77920-3.

Weitere Lektüre

  • Chauvin, Yvonne. Pratique du Klassen Alphabétique. 4. Aufl. Paris: Bordas, 1977. ISBN2-04-010155-1
  • Flandern, Judith. Ein Ort für alles: die merkwürdige Geschichte der alphabetischen Ordnung. New York: Basic Books / Hatchette Books, 2020. ISBN978-1-5416-7507-0