ISO 639-3
ISO 639-3: 2007, Codes für die Darstellung von Namen von Sprachen-Teil 3: Alpha-3-Code für eine umfassende Berichterstattung über Sprachen, ist ein internationaler Standard für Sprachcodes in dem ISO 639 Serie. Es definiert Drei-Buchstaben-Codes zur Identifizierung von Sprachen. Der Standard wurde von veröffentlicht von Internationale Standardisierungsorganisation (ISO) am 1. Februar 2007.[1]
ISO 639-3 erweitert die ISO 639-2 Alpha-3-Codes mit dem Ziel, alle bekannten abzudecken natürliche Sprachen. Die erweiterte Sprachberichterstattung basierte hauptsächlich auf den in der verwendeten Sprachcodes Ethnolog (Bände 10–14) veröffentlicht von SIL International, was jetzt das ist Registrierungsbehörde für ISO 639-3.[2] Es bietet eine Aufzählung von Sprachen, die so vollständig wie möglich wie möglich und ausgestorben sind, alt und konstruiert, Haupt- und Minderjähriger, geschrieben und ungeschrieben.[1] Es beinhaltet jedoch nicht rekonstruierte Sprachen wie zum Beispiel Proto-indo-europäisch.[3]
ISO 639-3 ist für die Verwendung als Verwendung vorgesehen Metadaten Codes in einer Vielzahl von Anwendungen. Es wird häufig in Computer- und Informationssystemen wie dem Internet verwendet, in dem viele Sprachen unterstützt werden müssen. In Archiven und anderen Informationsspeichern wird es in Katalogisierungssystemen verwendet, um anzuzeigen, in welcher Sprache eine Ressource ist oder woher sich befindet. Die Codes werden auch häufig in der sprachlichen Literatur und anderswo verwendet, um die Tatsache auszugleichen, dass Sprachnamen dunkel oder mehrdeutig sind.
Finde eine Sprache |
---|
Geben Sie einen ISO 639-3-Code ein, um den entsprechenden Sprachartikel zu finden. |
Sprachcodes
ISO 639-3 enthält alle Sprachen in ISO 639-1 und alle einzelnen Sprachen in ISO 639-2. ISO 639-1 und ISO 639-2 konzentrierten sich auf wichtige Sprachen, die am häufigsten im Gesamtkörper der Weltliteratur vertreten sind. Da ISO 639-2 auch Sprachsammlungen enthält und Teil 3 nicht, ist ISO 639-3 kein Superet von ISO 639-2. Wo B- und T -Codes In ISO 639-2 existieren ISO 639-3 die T-Codes.
Sprache | 639-1 | 639-2 (b/t) | 639-3 Typ | 639-3 Code |
---|---|---|---|---|
Englisch | en | Eng | Individuell | Eng |
Deutsch | de | Ger/deu | Individuell | Deu |
Arabisch | ar | Ara | Makro | Ara |
Standard -Arabisch | Individuell | Arb | ||
Ägyptisches Arabisch | Individuell | Arz | ||
Chinesisch | zh | Chi/Zho[4][5] | Makro | Zho |
Mandarin | Individuell | CMN | ||
Kantonesisch | Individuell | Yue | ||
Südliche min | Individuell | Nan |
Ab dem 18. Februar 2021[aktualisieren]Der Standard enthält 7.893 Einträge.[6] Das Inventar der Sprachen basiert auf einer Reihe von Quellen, darunter: die einzelnen Sprachen in 639–2, moderne Sprachen aus dem Ethnolog, historische Sorten, alte Sprachen und künstliche Sprachen von dem Linguist -Liste,[7] sowie Sprachen, die innerhalb der jährlichen öffentlichen Kommentarperiode empfohlen werden.
Maschinenlesbare Daten Dateien werden von der Registrierungsbehörde bereitgestellt.[6] Zuordnungen von ISO 639-1 oder ISO 639–2 bis ISO 639-3 können mit diesen Datendateien erfolgen.
ISO 639-3 soll Unterscheidungen auf der Grundlage von Kriterien annehmen, die nicht vollständig objektiv sind.[8] Es ist nicht beabsichtigt, Identifikatoren für Dialekte oder andere Untersprachvariationen zu dokumentieren oder bereitzustellen.[9] Beurteilungen über die Unterscheidung zwischen Sprachen können jedoch subjektiv sein, insbesondere bei Sprachsorten ohne etablierte literarische Traditionen, Verwendung in Bildung oder Medien oder anderen Faktoren, die zur konventionellen Sprache beitragen. Daher sollte der Standard nicht als maßgebliche Aussage darüber angesehen werden, welche unterschiedlichen Sprachen in der Welt existieren (über die in einigen Fällen erhebliche Meinungsverschiedenheiten bestehen können), sondern einfach eine nützliche Möglichkeit, verschiedene Sprachsorten genau zu identifizieren.
Coderaum
Da der Code drei Buchstaben alphabetisch ist, beträgt eine Obergrenze für die Anzahl der Sprachen, die dargestellt werden können, 26 × 26 × 26 = 17.576. Da ISO 639-2 spezielle Codes (4), einen reservierten Bereich (520) und nur B-Codes (22) (22) definiert, können 546 Codes in Teil 3 nicht verwendet werden. Daher beträgt eine strengere Obergrenze 17.576-546 = 17.030.
Die Obergrenze wird noch strenger, wenn man die in 639-2 definierten Sprachsammlungen subtrahiert und diejenigen, die noch definiert werden sollen ISO 639-5.
MACROLANGUAGES
Es gibt 58 Sprachen in ISO 639-2, die für die Zwecke des Standards als "Macrolanguages" in ISO 639-3 betrachtet werden.[10]
Einige davon MACROLANGUAGES hatte keine individuelle Sprache gemäß ISO 639–3 im Code-Satz von ISO 639-2, z. 'ara' (generisches Arabisch). Andere mögen 'noch' (norwegisch) ihre beiden einzelnen Teile ('nno' ('(' nno '(Nynorsk), 'nob' (Bokmål)) bereits in ISO 639-2.
Das bedeutet, dass einige Sprachen (z. B. 'ARB', Standard -Arabisch), die von ISO 639–2 als Dialekten einer Sprache ('ARA') betrachtet wurden, in ISO 639–3 in bestimmten Kontexten, die als individuelle Sprachen angesehen werden, in ISO 639–3 betrachtet wurden.
Dies ist ein Versuch, sich mit Sorten zu befassen, die sich möglicherweise sprachlich voneinander unterscheiden, aber von ihren Sprechern als zwei Formen derselben Sprache behandelt werden, z. in Fällen von Diglossia.
Zum Beispiel:
- https://iso639-3.sil.org/code/ara (Generisches Arabisch, 639–2)
- https://iso639-3.sil.org/code/arb (Standard Arabisch, 639–3)
Sehen[11] Für die vollständige Liste.
Kollektive Sprachen
"Ein kollektives Sprachcode -Element ist eine Kennung, die eine Gruppe einzelner Sprachen darstellt, die in keinem Verwendungskontext als eine Sprache angesehen werden."[12] Diese Codes stellen keine bestimmte Sprache oder Makrolagie genau dar.
Während ISO 639-2 drei Buchstaben für kollektive Sprachen enthält, sind diese Codes von ISO 639-3 ausgeschlossen. Daher ist ISO 639-3 kein Superet von ISO 639-2.
ISO 639-5 Definiert 3-Buchstaben-Kollektivcodes für Sprachfamilien und Gruppen, einschließlich der kollektiven Sprachcodes von ISO 639-2.
Spezielle Codes
Vier Codes sind in der Relevanz beiseite gelegt ISO 639-2 und ISO 639-3 für Fälle, in denen keiner der spezifischen Codes angemessen ist. Diese sind hauptsächlich für Anwendungen wie Datenbanken bestimmt, in denen ein ISO -Code unabhängig davon erforderlich ist, ob es vorhanden ist.
-
mis
(Unkodierte Sprachen, ursprünglich eine Abkürzung für "Verschiedenes") ist für Sprachen bestimmt, die (noch) nicht in den ISO -Standard aufgenommen wurden. -
mul
(Mehrere Sprachen) sind für Fälle bestimmt, in denen die Daten mehr als eine Sprache enthalten, und (z. B.) für die Datenbank benötigt ein einzelner ISO -Code. -
und
(unbestimmt) ist für Fälle bestimmt, in denen die Sprache in den Daten nicht identifiziert wurde, z. Es ist nicht für Fälle wie z. Trojaner wo eine unbefriedigte Sprache einen Namen erhalten hat. -
zxx
(Kein sprachlicher Inhalt / nicht zutreffend) ist für Daten bestimmt, die überhaupt keine Sprache sind, wie z. B. Tieraufrufe.[13]
Darüber hinaus 520 Codes im Bereich qaa
–qtz
sind "für die lokale Verwendung reserviert". Zum Beispiel weist Rebecca Bettencourt einen Code zu konstruierte Sprachenund neue Aufgaben werden auf Anfrage erfolgen.[14] Das Linguist -Liste benutzt sie für ausgestorbene Sprachen. Die Linguist -Liste hat einem von ihnen einen generischen Wert zugewiesen: qnp
, Unbenanntes Protosprachguss. Dies wird für vorgeschlagene Zwischenknoten in einem Stammbaum verwendet, der keinen Namen hat.
Wartungsprozesse
Die Code-Tabelle für ISO 639-3 ist für Änderungen geöffnet. Um die Stabilität der bestehenden Nutzung zu schützen, beschränken sich die zulässigen Änderungen auf:[15]
- Änderungen an den Referenzinformationen für einen Eintrag (einschließlich Namen oder Kategorisierungen für Typ und Umfang),
- Zugabe von Neueinträgen,
- Abwertung von Einträgen, die Duplikate oder falsch sind,
- Ein- oder mehrere Einträge in einen anderen Eintrag verwandeln, und
- Aufteilung eines vorhandenen Spracheintrags in mehrere neue Spracheinträge.
Der einer Sprache zugewiesene Code wird nicht geändert, es sei denn, es gibt auch eine Änderung der Bezeichnung.[16]
Änderungen werden in einem jährlichen Zyklus vorgenommen. Jede Anfrage wird für die öffentliche Überprüfung eine Mindestdauer von drei Monaten erhoben.
Die ISO 639-3-Website enthält Seiten, auf denen "Denotation Scopes" beschrieben wird,[17] (Sprachtypen) und Arten von Sprachen,[18] die erklären, welche Konzepte im Rahmen der Codierung und bestimmten Kriterien sind, die erfüllt werden müssen. Zum Beispiel können konstruierte Sprachen codiert werden, jedoch nur, wenn sie für die menschliche Kommunikation ausgelegt sind und über eine Literaturstelle verfügen, um Anfragen nach eigenwilligen Erfindungen zu verhindern.
Die Registrierungsbehörde dokumentiert auf ihren Website-Anweisungen im Text des ISO 639-3-Standards, wie die Code-Tabellen gewartet werden sollen.[19] Es dokumentiert auch die Prozesse, die zum Empfangen und Verarbeiten von Änderungsanforderungen verwendet werden.[20]
Es wird ein Änderungsanforderungsformular bereitgestellt, und es gibt ein zweites Formular zum Sammeln von Informationen über vorgeschlagene Ergänzungen. Jede Partei kann Änderungsanfragen einreichen. Bei der Einreichung werden die Anfragen zunächst von der Registrierungsbehörde auf Vollständigkeit überprüft.
Wenn eine vollständig dokumentierte Anforderung empfangen wird, wird sie einem veröffentlichten Änderungsanforderungsindex hinzugefügt. Außerdem werden Ankündigungen an die allgemeine Linguist -Diskussionsliste in der Linguist -Liste gesendet und andere Listen, die die Registrierungsbehörde für relevante, einladende öffentliche Überprüfung und Eingaben in die angeforderte Änderung berücksichtigen kann. Jeder Listenbesitzer oder eine Person kann Benachrichtigungen über Änderungsanfragen für bestimmte Regionen oder Sprachfamilien anfordern. Kommentare, die empfangen werden, werden für andere Parteien veröffentlicht, die sie überprüfen können. Basierend auf Konsens in den erhaltenen Kommentaren kann ein Änderungsantrag zurückgezogen oder zum "Status des Kandidaten" gefördert werden.
Drei Monate vor dem Ende eines Jahresüberprüfungszyklus (normalerweise im September) wird eine Ankündigung für die Linguist -Diskussionsliste und andere Listen zu Änderungsanfragen von Kandidatenstatus festgelegt. Alle Anfragen bleiben bis zum Ende des jährlichen Überprüfungszyklus geöffnet.
Entscheidungen werden am Ende des Jahresüberprüfungszyklus (in der Regel im Januar) bekannt gegeben. Zu diesem Zeitpunkt können Anfragen ganz oder teilweise übernommen, geändert und in den nächsten Überprüfungszyklus übertragen oder abgelehnt werden. Ablehnungen enthalten häufig Vorschläge zur Änderung von Vorschlägen zur Wiedervermittlung. Ein öffentliches Archiv jeder Änderungsanfrage wird zusammen mit den Entscheidungen und dem Grund für die Entscheidungen aufrechterhalten.[21]
Kritik
Linguisten Morey, Post und Friedman eröffnen verschiedene Kritikpunkte an ISO 639 und insbesondere ISO 639-3:[16]
- Die Drei-Buchstaben-Codes selbst sind problematisch, da sie zwar offiziell willkürliche technische Etiketten sind, aber häufig aus mnemonischen Abkürzungen für Sprachnamen abgeleitet werden, von denen einige abwertend sind. Zum Beispiel, Yemsa wurde der Code zugewiesen
jnj
, von abwertend "Janejero". Diese Codes können daher von Muttersprachlern als beleidigend angesehen werden. Codes können jedoch mit einer Anfrage eingeschaltet werden SILs Website. - Die Verwaltung des Standards ist problematisch, da SIL eine Missionsorganisation mit unzureichender Transparenz und Rechenschaftspflicht ist. Entscheidungen darüber, was es verdient, als Sprache kodiert zu werden, werden intern getroffen. Während die externen Eingaben möglicherweise begrüßt werden oder nicht, sind die Entscheidungen selbst undurchsichtig, und viele Linguisten haben es aufgegeben, den Standard zu verbessern.
- Die dauerhafte Identifizierung einer Sprache ist mit Sprachänderung unvereinbar.
- Sprachen und Dialekte können oft nicht streng unterschieden werden, und Dialekt Continua kann in vielerlei Hinsicht unterteilt werden, während die Standard -Privilegien eine Wahl haben. Solche Unterschiede basieren häufig stattdessen auf sozialen und politischen Faktoren.
- ISO 639-3 kann von Behörden missverstanden und missbraucht werden, die Entscheidungen über die Identität und Sprache der Menschen treffen und das Recht der Sprecher aufgeben, ihre Sprachvielfalt zu identifizieren oder zu identifizieren. Obwohl SIL für solche Probleme empfindlich ist, ist dieses Problem der Art eines etablierten Standards inhärent, der auf eine Weise verwendet (oder missbraucht) werden kann, die ISO und SIL nicht beabsichtigen.
Martin Haspelmath stimmt mit vier dieser Punkte überein, aber nicht mit dem Punkt über die Sprachänderung.[22] Er ist nicht einverstanden, weil jede Darstellung einer Sprache sie identifiziert und wir leicht unterschiedliche Phasen einer Sprache identifizieren können. Er schlägt vor, dass Linguisten es vorziehen, eine Kodifizierung zu verwenden, die auf Sprachebene erfolgt, da "Linguisten selten wichtig sind, ob es sich um eine Sprache, einen Dialekt oder eine engmaschige Sprachenfamilie handelt". Er fragt auch, ob ein ISO -Standard für die Sprachidentifizierung angemessen ist, da ISO eine industrielle Organisation ist, während er Sprachdokumentation und Nomenklatur als wissenschaftliches Unterfangen ansieht. Er zitiert den ursprünglichen Bedarf an standardisierten Sprachkennungen als "die wirtschaftliche Bedeutung der Übersetzung und Software -Lokalisierung, "In welchen Zwecken wurden die Standards der ISO 639-1 und 639-2 festgelegt. Aber er wirft Zweifel an der Notwendigkeit der Industrie nach der umfassenden Berichterstattung von ISO 639-3, auch wie es tut" wenig bekannte Sprachen kleiner Gemeinschaften, die sind nie oder kaum schriftlich verwendet und das ist oft in Gefahr des Aussterbens. "
Verwendungszweck
- Ethnolog
- Linguist -Liste
- Olac: Die Open Languages Archive Community[23]
- Microsoft Windows 8:[24] Unterstützt alle Codes in ISO 639–3 zum Zeitpunkt der Veröffentlichung.
- Wikimedia Foundation: Neue sprachbasierte Projekte (z. B. Wikipedias in neuen Sprachen) müssen eine Kennung von ISO 639-1, -2 oder -3 haben.[25]
- Andere Standards, die auf ISO 639-3 beruhen:
- Sprachtags wie definiert durch die Internet Engineering Task Force (IETF), wie dokumentiert in:
- Das Epub 3.0 Standard für Sprachmetadaten[27] Verwendet Dublin Core Metadata -Elemente. Diese Sprachmetadatenelemente in EPUBs müssen gültig enthalten RFC5646 Codes für Sprachen.[27] RFC5646 zeigt auf ISO 639-3 für Sprachen ohne kürzere IANA-Codes.
- Dublin Core Metadata Initiative: DCMI -Metadatenbegriff[28] für die Sprache über IETFs RFC4646 (jetzt abgelöst von RFC5646).
- Internet zugewiesene Zahlen Autorität (IANA) Die Internationalisierungsbemühungen des W3C empfehlen die Verwendung des IANA -Sprach -Subtag -Registrals zur Auswahl von Codes für Sprachen.[29] Das IANA -Sprach -Subtag -Register[30] Hängt von ISO 639-3-Codes für Sprachen ab, die zuvor in anderen Teilen des ISO 639-Standards keine Codes hatten.
- HTML5:[31] über IETFs BCP 47.
- Marc Bibliothekscodes.
- MODIFIKATIONEN Bibliothekscodes:[32] Integriert IETFs RFC3066 (jetzt abgelöst von RFC5646).
- Textcodierungsinitiative (TEI):[33] über IETFs BCP 47.
- Lexikaler Markup -Framework: ISO-Spezifikation zur Darstellung maschinenlesbarer Wörterbücher.
- Unicode's Gemeinsames Gebietsschema -Datenrepository: Verwendet mehrere hundert Codes von ISO 639-3, die nicht in ISO 639-2 enthalten sind.
Verweise
- ^ a b "ISO 639-3 Status und abstrakt". ISO.org. 2010-07-20. Abgerufen 2012-06-14.
- ^ "Wartungsagenturen und Registrierungsbehörden". ISO.
- ^ "Arten einzelner Sprachen - alte Sprachen". sil.org. Abgerufen 2018-06-11.
- ^ Ethnologiebericht für ISO 639 Code: Zho Archiviert 2014-09-12 bei der Wayback -Maschine auf ethnologue.com
- ^ ISO639-3 auf sil.org
- ^ a b "ISO 639-3 Code Set". Sil.org. 2021-02-18. Abgerufen 2021-04-07.
- ^ "ISO 639-3". sil.org.
- ^ "Umfang der Bezeichnung: Einzelne Sprachen". sil.org.
- ^ "Umfang der Bezeichnung: Dialekte". sil.org.
- ^ "Umfang der Bezeichnung: Macrolanguages". sil.org. Abgerufen 2012-06-14.
- ^ "Macrolanguage Mappings". sil.org. Abgerufen 2021-11-02.
- ^ "Umfang der Bezeichnung: Kollektive Sprachen". sil.org. Abgerufen 2012-06-14.
- ^ Feldaufnahmen von Vervet Monkey -Anrufen. Eintritt in den Katalog der Sprachdatenkonsortium. Abgerufen 2012-09-04.
- ^ Bettencourt, Rebecca. "Conlang Code Registry". Kreativivekorp. Abgerufen 2021-03-12.
- ^ "Senden von ISO 639-3 Änderungsanforderungen: Arten von Änderungen". sil.org.
- ^ a b Morey, Stephen; Post, Mark W.; Friedman, Victor A. (2013). Die Sprachcodes von ISO 639: eine vorzeitige, letztendlich unbegrenzte und möglicherweise schädliche Standardisierung. Paradisec RRR -Konferenz. Archiviert von das Original am 2016-02-23. Abgerufen 2015-11-03.
- ^ "Umfang der Bezeichnung für Sprachkennungen". sil.org.
- ^ "Arten von Sprachen". sil.org.
- ^ "ISO 639-3 Change Management". sil.org.
- ^ "Senden von ISO 639-3 Änderungsanfragen". sil.org.
- ^ "ISO 639-3 Änderungsanforderungsindex". sil.org.
- ^ Martin Haspelmath, "Kann Sprachidentität standardisiert werden? Über die Kritik von Morey et al. An ISO 639-3", Diversity Linguistics Kommentar, 2013/12/04
- ^ "OLAC Spracherweiterung". Language-Archives.org. Abgerufen 3. August 2015.
- ^ "Über 7.000 Sprachen, nur 1 Fenster". Microsoft. 2014-02-05.
- ^ "Sprachvorschlag Politik". Wikimedia.org. Abgerufen 3. August 2015.
- ^ "BCP 47 - Tags zur Identifizierung von Sprachen". ietf.org. Abgerufen 3. August 2015.
- ^ a b "Epub Publications 3.0". idpf.org. Abgerufen 3. August 2015.
- ^ "DCMI -Metadaten" Begriffe ". purl.org. Abgerufen 3. August 2015.
- ^ "Zwei-Buchstaben- oder Drei-Buchstaben-ISO-Sprachcodes". W3.org. Abgerufen 3. August 2015.
- ^ "Sprachregister". Iana.org. Abgerufen 2015-08-12.
- ^ "3 Semantik, Struktur und APIs von HTML -Dokumenten - HTML5". W3.org. Abgerufen 3. August 2015.
- ^ "Elemente - Mods Benutzerrichtlinien: Metadata -Objektbeschreibung Schema: Mods (Kongressbibliothek)". loc.gov. Abgerufen 3. August 2015.
- ^ "TEI -Elementsprache". tei-c.org. Abgerufen 3. August 2015.
Weitere Lektüre
- Aristar, Anthony (2006). "ISO standardisierte Sprachcodes und das Ethnolog" " (PDF). SSILA Bulletin. 247. Archiviert von das Original (PDF) am 20. Mai 2014.
- Dobrin, Lise M.; Gut, Jeff (2009). "Praktische Sprachentwicklung: Wessen Mission?" (PDF). Sprache. 85 (3): 619–629. doi:10.1353/lan.0.0152. S2CID 144749106.
- Epps, Patience (2006). "Im Gegensatz zur Übernahme der Sprachcodes von Ethnologuen für ISO 639-3" (PDF). SSILA Bulletin. 246. Archiviert von das Original (PDF) am 20. Mai 2014.
- Golla, Victor, hrsg. (2006). "SSILA-Erklärung zu ISO 639-3 Sprachcodes" (PDF). SSILA Bulletin. 249. Archiviert von das Original (PDF) am 20. Mai 2014.
- Gut, Jeff; Cysouw, Michael (2013). "Languoid, Docuect und Glossym: Formalisierung des Begriffs" Sprache "". Sprachdokumentation und Erhaltung. 7: 331–359. HDL:10125/4606.