ISO basic Latin alphabet

Das ISO Basic Latin Alphabet ist ein internationaler Standard (beginnend mit ISO/IEC 646) Für ein Latein-Skriptalphabet das besteht aus zwei Sätzen (Großbuchstaben und Kleinbuchstaben) von 26 Buchstaben, kodifiziert in[1] Verschiedene nationale und internationale Standards und weit verbreitet in internationale Kommunikation. Sie sind die gleichen Buchstaben, die den Strom umfassen englisches Alphabet. Seit dem Mittelalter sind sie auch die gleichen Buchstaben der Moderne Lateinisches Alphabet. Die Reihenfolge ist auch wichtig, um Wörter in die Sortierung in die Sortierung zu alphabetischer Reihenfolge.

Die beiden Sätze enthalten jeweils folgende 26 Buchstaben:[1]

ISO Basic Latin Alphabet
Großbuchstaben A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
Kleinbuchstaben a b c d e f g h i j k l m n o p q r s t u v w x y z

Geschichte

In den 1960er Jahren wurde es dem offensichtlich Computer und Telekommunikation Branchen in der Erste Welt Dass eine nicht proprietäre Methode zur Codierung von Charakteren erforderlich war. Das Internationale Standardisierungsorganisation (ISO) eingekapselt die Lateinisches Skript in ihrem (ISO/IEC 646) 7-Bit-Zeichenkodierstandard. Um eine weit verbreitete Akzeptanz zu erreichen, basierte diese Verkapselung auf der Verwendung der Bevölkerung. Der Standard basierte auf dem bereits veröffentlichten Amerikanischer Standardcode für den Informationsaustausch, besser bekannt als ASCII, die in der enthalten sind Zeichensatz die 26 × 2 Buchstaben der englisches Alphabet. Spätere Standards der ISO zum Beispiel ausgestellt ISO/IEC 8859 (8-Bit-Charaktercodierung) und ISO/IEC 10646 (Unicode lateinisch), haben die 26 × 2 Buchstaben des englischen Alphabets als grundlegende lateinische Skript mit Erweiterungen für andere Buchstaben in anderen Sprachen definiert.[1]

Terminologie

Das Unicode -Block Das enthält das Alphabet heißt "C0 -Steuerelemente und Basic Latein". Es gibt zwei Unterwegs:[2]

  • "Großbuchstaben lateinisches Alphabet": Die Buchstaben beginnen bei U+0041 und enthalten den lateinischen Kapitalbuchstaben in ihren Beschreibungen
  • "Kleinbuchstaben lateinisches Alphabet": Die Buchstaben beginnen bei U+0061 und enthalten den kleinen Buchstaben Latin Latin in ihren Beschreibungen

Es gibt auch zwei weitere Sets in der Halbbreiten- und Vollbreitenformen Block:[3]

  • Großbuchstaben: Die Buchstaben beginnen bei u+ff21 und enthalten den lateinischen Kapitalbuchstaben der Zeichenfolge in ihren Beschreibungen
  • Kleinbuchstaben: Die Buchstaben beginnen bei U+FF41 und enthalten die Saite Fullwidth Latin Small Letter in ihren Beschreibungen

Zeitleiste für Codierungsstandards

  • 1865 International Morse Code wurde auf dem International Telegraphy Congress in Paris standardisiert und später von der International Telecommunication Union (ITU) Standard gemacht.
  • 1950er Jahre Radiotelephony -Rechtschreibalphabet von icao[4]

Zeitleiste für weit verbreitete Computercodes, die das Alphabet unterstützen

  • 1963: ASCII (7-Bit-Zeichenkodierstandard aus dem American Standards Association, welches wurde Ansi im Jahr 1969)
  • 1963/1964: Ebcdic (entwickelt von IBM und Unterstützung der gleichen alphabetischen Zeichen wie ASCII, jedoch mit unterschiedlichen Codewerten)
  • 1965-04-30: ratifiziert von ECMA wie ECMA-6[5] Basierend auf Arbeiten hat das technische Komitee des ECMA seit Dezember 1960 TC1 durchgeführt.[5]
  • 1972: ISO 646 (ISO 7-Bit-Zeichenkodierstandard, unter Verwendung der gleichen alphabetischen Codewerte wie ASCII, überarbeitet in der zweiten Ausgabe ISO 646: 1983 und der dritten Ausgabe ISO/IEC 646: 1991 als Joint ISO/IEC Standard)
  • 1983: Itu-t Rec. T.51 | ISO/IEC 6937 (eine Mehrfachbyte-Erweiterung von ASCII)
  • 1987: ISO/IEC 8859-1: 1987 (8-Bit-Charaktercodierung)
    • Anschließend wurden andere Versionen und Teile von ISO/IEC 8859 veröffentlicht.
  • Mitte bis Ende der 1980er Jahre: Windows-1250, Windows-1252und andere Kodierungen in Microsoft Windows (Einige ähnlich zu ISO/IEC 8859-1)
  • 1990: Unicode 1.0 (entwickelt von der Unicode -Konsortium),[6][7] im Block enthalten "C0 -Steuerelemente und Basic Latein"Verwenden Sie die gleichen alphabetischen Codewerte wie ASCII und ISO/IEC 646
    • Anschließend wurden andere Versionen von Unicode veröffentlicht und wurde später zu einem Joint ISO/IEC Standard auch, wie unten identifiziert.
  • 1993: ISO/IEC 10646-1: 1993, ISO/IEC -Standard für Zeichen in Unicode 1.1
    • Anschließend wurden andere Versionen von ISO/IEC 10646-1 und einer von ISO/IEC 10646-2 veröffentlicht. Seit 2003 wurden die Standards unter dem Namen "ISO/IEC 10646" ohne die Trennung in zwei Teile veröffentlicht.
  • 1997: Windows -Glyphenliste 4

Darstellung

Die Großbuchstaben des ISO Basic Latin Alphabet auf a 16-Segment-Anzeige (plus die arabische Ziffern).

In ASCII gehören die Buchstaben dem druckbare Zeichen und in Unicode seit Version 1.0 gehören sie zum Block "C0 -Steuerelemente und Basic Latein". In beiden Fällen sowie in ISO/IEC 646, ISO/IEC 8859 und ISO/IEC 10646 Sie besetzen die Positionen in Hexadezimalnotation 41 bis 5a für Großbuchstaben und 61 bis 7a für Kleinbuchstaben.

Nicht sensibel, alle Buchstaben haben Codewörter in der ICAO -Rechtschreibalphabet und kann dargestellt werden mit Morse-Code.

Verwendungszweck

Alle Kleinbuchstaben werden in der verwendet Internationales Phonetisches Alphabet (IPA). Im X-Sampa und Sampa Diese Buchstaben haben den gleichen Tonwert wie in IPA.

Alphabete, die den gleichen Buchstaben enthalten

Die folgende Liste enthält nur Alphabete, die Mangel:

Bemerkenswerte Auslassungen aufgrund dieser Regeln umfassen Spanisch, Esperanto, Filipino und Deutsch. Das deutsche Alphabet wird manchmal von der Tradition angesehen, nur 26 Buchstaben (mit ä, ö, ü betrachtet Varianten und ß als Ligatur angesehen), aber die derzeitigen deutschen orthografischen Regeln umfassen Ä, ö, ü, ß im Alphabet nach Z; Diese Reihenfolge wird jedoch normalerweise nicht in der Kollation verwendet: normalerweise werden ä, ö, ü als a, o, u (oder manchmal als AE, oe, ue), ß als ss.

Alphabet Diakritisch Multigraphen (keine unterschiedlichen Buchstaben) Ligaturen
Afrikaans Alphabet á, ä, é, è, ê, ë, í, î, ï, ó, ô, ö, ú, û, ü, ý Digraphen: ⟨aa⟩, ⟨ai⟩, ⟨CH⟩, ⟨EE⟩, ⟨ei⟩, ⟨EU⟩, ⟨Gh⟩, ⟨dh⟩, ⟨Nj⟩, ⟨ng⟩ ⟨oe⟩, ⟨oi⟩, ⟨oo⟩, ⟨OU⟩, ⟨Sj⟩, ⟨tj⟩, ⟨ts⟩, ⟨UI⟩, ⟨uu

Trigraphen: ⟨Aai⟩, ⟨eU⟩, ⟨oei⟩, ⟨ooi⟩

ʼn (N -Apostroph)
Aragonesen Alphabet (Akademie de l'Aragonés Orthographie) á, é, í, ó, ú, ü, lꞏl CH⟩, ⟨Gu⟩, ⟨ll⟩, ⟨NY⟩, ⟨Qu⟩, ⟨rr⟩, ⟨TZ
Katalanischer Alphabet à, é, è, í, ï, ó, ò, ú, ü, ç, lꞏl Gu⟩, ⟨ich G⟩, ⟨ix⟩, ⟨ll⟩, ⟨NY⟩, ⟨Qu⟩, ⟨rr⟩, ⟨ss
Niederländisches Alphabet ä, é, è, ë, ï, ö, ü Das Digraphij⟩ Wird manchmal als separater Buchstabe angesehen. Wenn dies der Fall ist, ersetzt es normalerweise oder wird mit ⟨y⟩ gemischt. Andere Digraphen: ⟨aa⟩, ⟨ae⟩, ⟨ai⟩, ⟨AU⟩, ⟨CH⟩, ⟨EE⟩, ⟨ei⟩, ⟨EU⟩, ⟨dh⟩, ⟨oe⟩, ⟨oi⟩, ⟨oo⟩, ⟨OU⟩, ⟨UI⟩, ⟨uu
englisches Alphabet Nur in Lehnwörtern (siehe unten)1 Sch⟩, ⟨CH⟩, ⟨EA⟩, ⟨OU⟩, ⟨th⟩, ⟨pH⟩, ⟨ng æ, œ (beide archaisch)
Französisches Alphabet à, â, ç, é, è, ê, ë, î, ï, ô, ù, û, ü, ÿ ai⟩, ⟨AU⟩, ⟨ei⟩, ⟨EU⟩, ⟨oi⟩, ⟨OU⟩, ⟨Eau⟩, ⟨CH⟩, ⟨pH⟩, ⟨gn⟩, ⟨ein⟩, ⟨bin⟩, ⟨en⟩, ⟨em⟩, ⟨in⟩, ⟨ich bin⟩, ⟨an⟩, ⟨om⟩, ⟨un⟩, ⟨Äh⟩, ⟨yn⟩, ⟨ym⟩, ⟨Ain⟩, ⟨Ziel⟩, ⟨Ein⟩, ⟨oin⟩, ⟨⟩, ⟨ æ (Selten), œ (obligatorisch)
Italienisches Alphabet (erweitert)[a] à, è, é, ì, ò, ù CH⟩, ⟨CI⟩, ⟨gh⟩, ⟨gi⟩, ⟨GL⟩, ⟨Gli⟩, ⟨gn⟩, ⟨sc⟩, ⟨Sci
Ido Alphabet* keiner Qu⟩, ⟨CH⟩, ⟨Sch
Indonesisches Alphabet Nur in Lernmaterialien (siehe unten)3 kh⟩, ⟨ng⟩, ⟨NY⟩, ⟨sy⟩, Diphthongs: ⟨ai⟩, ⟨Au⟩, ⟨ei⟩, ⟨oi⟩
Interlingua Alphabet* Nur in nicht assimilierten Lehnwörtern (siehe unten)2 CH⟩, ⟨pH⟩, ⟨Qu⟩, ⟨rh⟩, ⟨Sch
Javanisches lateinisches Alphabet é, è dh⟩, ⟨kh⟩, ⟨ng⟩, ⟨NY⟩, ⟨sy⟩, ⟨th
Luxemburgisches Alphabet ä, é, ë aa⟩, ⟨CH⟩, ⟨ck⟩, ⟨EE⟩, ⟨ei⟩, ⟨dh⟩, ⟨II⟩, ⟨ng⟩, ⟨oo⟩, ⟨OU⟩, ⟨Qu⟩, ⟨ue⟩, ⟨uu⟩, ⟨Sch
Malaiisch Alphabet Nur in Lernmaterialien (siehe unten)3 gh⟩, ⟨kh⟩, ⟨ng⟩, ⟨NY⟩, ⟨sy
Portugiesisches Alphabet[b] ã, õ, á, é, í, ó, ú, â, ê, ô, à, ç CH⟩, ⟨lh⟩, ⟨NH⟩, ⟨rr⟩, ⟨ss⟩, ⟨bin⟩, ⟨em⟩, ⟨ich bin⟩, ⟨om⟩, ⟨Äh⟩, ⟨ãe⟩, ⟨ão⟩, ⟨õe
Sundanesisches lateinisches Alphabet é EU⟩, ⟨ng⟩, ⟨NY

* Konstruierte Sprachen

  1. Englisch ist eine der wenigen modernen europäischen Sprachen, die keine Diakritik für einheimische Wörter benötigen (obwohl a Diaerese wird von einigen amerikanischen Verlage in Worten wie "verwendet" verwendet "Zusammenarbeit").[c][8]
  2. InterlinguaEine konstruierte Sprache verwendet niemals Diakritik, außer in nicht assimilierten Lehnwörtern. Sie können jedoch entfernt werden, wenn sie nicht zur Änderung des Vokals verwendet werden (z. Cafe, aus Französisch: café).[9]
  3. Malaiisch und Indonesisch (basierend auf Malaiisch) sind die einzigen Sprachen außerhalb Europas, die das gesamte lateinische Alphabet verwenden und keine Diakritik und Ligaturen erfordern.[d] Viele der 700+ Sprachen Indonesiens Verwenden Sie auch das indonesische Alphabet, um ihre Sprachen zu schreiben, einige - wie zum Beispiel als Javaner- Diakritik é und è und einige weglassen q, x und z.

Spaltennummerierung

Das römische (lateinische) Alphabet wird üblicherweise für die Säulennummerierung in einer Tabelle oder einem Diagramm verwendet. Dies vermeidet Verwirrung mit Zeilenzahlen mit der Verwendung arabische Ziffern. Beispielsweise würde eine 3-mal-3-Tabelle die Spalten A, B und C enthalten, die gegen die Zeilen 1, 2 und 3 gesetzt werden. Wenn mehr Spalten über Z hinaus benötigt werden (normalerweise der endgültige Buchstabe des Alphabets), wird die Spalte sofort Nach Z ist AA, gefolgt von AB und so weiter (siehe Bijektives Basis-26-System). Dies ist zu sehen, indem Sie in einem Tabellenkalkulationsprogramm weit rechts nach rechts scrollen, z. B. Microsoft Excel oder Libreoffice calc.

Dies sind zweistellige "Buchstaben" für Tabellenspalten, genauso wie 10 bis 99 zweistellige Zahlen sind. Das griechisches Alphabet hat eine ähnliche erweiterte Form, die bei Bedarf solche zweistelligen Buchstaben verwendet, aber es wird für Kapitel von a verwendet Brüderlichkeit im Gegensatz zu Spalten einer Tabelle.

Solche zweistelligen Buchstaben für Aufzählungszeichen sind AA, BB, CC usw. im Gegensatz zu dem zahlreichen Platzwertsystem, das oben für Tabellenspalten erläutert wird.

Siehe auch

Anmerkungen

  1. ^ Das italienische Alphabet hat traditionell nur 21 Briefe, ausgenommen j, k, w, x, y. In der Praxis treten diese Briefe jedoch in einer Reihe von Lehnwörtern auf. J tritt auch in einigen einheimischen italienischen Eigennamen als Variante des Semivokalics auf i.
  2. ^ Hinweis für Portugiesisch:k und y (aber nicht w) waren Teil des Alphabets bis zu mehreren Rechtschreibreformen im 20. Jahrhundert, dessen Ziel es war, die etymologische portugiesische Schreibweise in eine leichtere phonetische Schreibweise zu verwandeln. Diese Buchstaben wurden durch andere Buchstaben mit dem gleichen Geräusch ersetzt: also also Psychologie wurde PSICOLOGIA, Kioske wurde Quiosque, Märtyrer wurde Mártirusw. heutzutage k, w, und y werden nur in fremden Worten und ihren abgeleiteten Begriffen und in wissenschaftlichen Abkürzungen (z. km, Byronismo). Diese Buchstaben gelten erneut als Teil des Alphabets, der dem folgt 1990 orthografischer Vereinbarung portugiesische Sprache, was am 1. Januar 2009 in Brasilien in Kraft trat. Sehen Reformen der portugiesischen Orthographie.
  3. ^ Als Beispiel eines Artikels mit a Diaerese in "Co -Operate" sowie Akzente von Darlehenswörtern auf Englisch wie a Cedilla in "Fassaden" und a Zirkumflex Im Wort "Crêpe" siehe Grafton, Anthony (23. Oktober 2006). "Bücher: Die nussigen Professoren, die Geschichte des akademischen Charisma". Der New Yorker.
  4. ^ Malaiische und indonesische Lernmaterialien können jedoch ⟨é⟩ (e mit akuter) verwenden, um die Aussprache des Buchstabens E zu klären; In diesem Fall wird ⟨e⟩ ausgesprochen /ə /während ⟨é⟩ ausgesprochen /e /und (è) ist ausgesprochen /ɛ /.

Verweise

  1. ^ a b c "Internationalisierung Standardisierung von 7-Bit-Codes, ISO 646". Trans-Europäische Forschungs- und Bildungsnetzwerkvereinigung (TERAA). Abgerufen 3. Oktober, 2010.
  2. ^ "C0 -Kontrollen und Grundlatein" (PDF). Unicode.org. Abgerufen 8. August, 2016.
  3. ^ "Halbbreite und Fullwidth Formen" (PDF). Unicode.org. Abgerufen 8. August, 2016.
  4. ^ "Die Postgeschichte von ICAO". www.icao.int. Abgerufen 17. Februar, 2019.
  5. ^ a b Standard ECMA-6: 7-Bit-codierter Zeichensatz (PDF) (5. Aufl.). Genf, Schweiz: Europäische Computerherstellervereinigung (ECMA). März 1985. Archiviert (PDF) Aus dem Original am 29. Mai 2016. Abgerufen 29. Mai, 2016. Das technische Komitee TC1 von ECMA Im Dezember 1960 zum ersten Mal getroffen, um Standardcodes für Eingangs-/Ausgangszwecke vorzubereiten. Am 30. April 1965 wurde Standard ECMA-6 von der Generalversammlung von ECMA übernommen.
  6. ^ "Unicode -Zeichendatenbank". Der Unicode -Standard. Abgerufen 22. März, 2013.
  7. ^ Die Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
  8. ^ "Die seltsame Marke des New Yorkers - die Diaerese". 16. Dezember 2010. archiviert von das Original am 16. Dezember 2010.
  9. ^ "Einführung Al ied (in Anglese)". www.interlingua.com. Abgerufen 21. September, 2020.