SAMPA

Das Sprachbewertungsmethoden Phonetisches Alphabet (Sampa) ist ein computerlesbares phonetisches Skript mit 7-Bit-druckbar ASCII Charaktere, basierend auf dem Internationales Phonetisches Alphabet (IPA). Es wurde ursprünglich Ende der 1980er Jahre für sechs europäische Sprachen von der entwickelt EEC ESPRIT Forschungs- und Entwicklungsprogramm für Informationstechnologie. So viele Symbole wie möglich wurden aus der IPA übernommen; Wenn dies nicht möglich ist, werden andere verfügbare Zeichen verwendet, z. [@] zum Schwa (IPA [ə]), [2] Für den Vokal -Sound in gefunden in Französisch Deux (IPA [Ö]), und [9] Für den Vokal -Sound in Französisch gefunden Neuf (IPA [œ]).

Heute, offiziell, wurde Sampa für alle Klänge der folgenden Sprachen entwickelt:

Die Charaktere ["S {mp@] stellen die Aussprache des Namens Sampa in Englisch dar, wobei das anfängliche Symbol ["] Primärspannung anzeigt. Wie IPA ist Sampa normalerweise in eingeschlossen in eckige Klammern oder Schrägstriche, die nicht Teil des richtigen Alphabets sind und lediglich bedeuten, dass es im Gegensatz zum regulären Text phonetisch ist.

Merkmale

Sampa wurde Ende der 1980er Jahre in der entwickelt Europäische Kommission-Funded ESPRIT Projekt 2589 "Sprachbewertungsmethoden" (SAM) - daher "SAM Phonetic Alphabet" - In der Zeit, um den E -Mail -Datenaustausch und die Rechenverarbeitung von Transkriptionen in der Phonetik und der Sprachtechnologie zu erleichtern.

Sampa ist teilweise Codierung des IPA. Die erste Version von Sampa war die Vereinigung der Phonemcodes für Dänisch, Niederländisch, Englisch, Französisch, Deutsch und Italienisch. Spätere Versionen erweiterten Sampa, um andere europäische Sprachen abzudecken. Da Sampa auf Phoneminventaren basiert, gilt jede Sampa -Tabelle nur in der Sprache, für die sie erstellt wurde. Um dies zu machen IPA Codierungstechnik allgemein anwendbar, X-Sampa wurde erstellt, was bietet eine einzige Tabelle ohne sprachspezifische Unterschiede.

Sampa wurde als als erledigt hacken um die Unfähigkeit von zu arbeiten Textcodierungen IPA -Symbole darstellen. Folglich als Unicode Die Unterstützung für IPA-Symbole wird weiter verbreitet. Die Notwendigkeit eines separaten, computerlesbaren Systems zur Darstellung der IPA in ASCII nimmt ab. Die Texteingabe beruht jedoch auf bestimmte Tastaturcodierungen oder Eingabegeräte. Aus diesem Grund werden Sampa und X-Sampa immer noch weit verbreitet[1] in der rechnerischen Phonetik und in Sprachtechnologie.

Siehe auch

Verweise

  1. ^ "Projekte Euphonia personalisierte Spracherkennung für nicht standardmäßige Rede". Google AI Blog. Abgerufen 2019-08-16.
  • Ranchhod, Elisabeth & J. Mamede, Nuno (2002). Fortschritte in der Verarbeitung natürlicher Sprache: Dritte internationale Konferenz, Portal 2002, Faro, Portugal, 23. bis 26. Juni 2002. Proceedings (Proceedings (ProceedingsVorlesungsnotizen in Informatik). (1. Aufl.). Springer. ISBN3-540-43829-7.
  • L. Demiller, Anna & Rettig, James (2000). Linguistik: Ein Leitfaden zur Referenzliteratur (2. Aufl.). Bibliotheken unbegrenzt. ISBN1-56308-619-0.
  • Lamberts, Koen & Goldstone, Rob (2004). Handbuch der Kognition. Sage Publications Ltd. ISBN0-7619-7277-3.

Externe Links