Gemeinsame Stimme
![]() | |
Entwickler (en) | Mozilla Foundation |
---|---|
Erstveröffentlichung | 19. Juni 2017 |
Repository | https://github.com/mozilla/voice-web |
Verfügbar in | Mehrsprachig (Liste der Sprachen) |
Lizenz | Creative Commons CC0 |
Webseite | CommonVoice.mozilla.org |
Gemeinsame Stimme ist ein Crowdsourcing Projekt gestartet von Mozilla um eine kostenlose zu erstellen Datenbank zum Spracherkennungssoftware. Das Projekt wird von unterstützt von Freiwillige wer zeichnen Beispielsätze mit a auf Mikrofon und Überprüfen Sie die Aufzeichnungen anderer Benutzer. Die transkribierten Sätze werden in einer Sprachdatenbank gesammelt, die unter dem verfügbar ist öffentlich zugänglich Lizenz CC0. Diese Lizenz sorgt dafür Entwickler Kann die Datenbank für Sprach-Text-Anwendungen ohne Einschränkungen oder Kosten verwenden.
Ziele
Gemeinsame Stimme zielt darauf ab, verschiedene Sprachproben bereitzustellen. Laut Mozilla's Katharina BorchertViele vorhandene Projekte nahmen Datensätze aus dem öffentlichen Radio an oder hatten auf andere Weise Datensätze, die sowohl Frauen als auch Menschen mit ausgeprägten Akzenten unterrepräsentierten.[1]
Sprachdatenbank
Der erste Datensatz wurde im November 2017 veröffentlicht. Mehr als 20.000 Benutzer weltweit hatten 500 Stunden englischer Sätze aufgezeichnet.[2]
Im Februar 2019 wurde die erste Sprachencharge zur Verwendung veröffentlicht. Dies beinhaltete 18 Sprachen: Englisch, Französisch, Deutsch und Mandarin Chinesisch, aber auch weniger weit verbreitete Sprachen als Walisisch und Kabyle. Insgesamt umfasste dies fast 1.400 Stunden aufgezeichnete Sprachdaten von mehr als 42.000 Mitwirkenden.[3]
Ab Juli 2020 hat die Datenbank 7.226 Stunden Sprachaufzeichnungen in 54 Sprachen angehäuft, von denen 5.591 Stunden von Freiwilligen überprüft wurden.[4]
Im Mai 2021 folgen Sie den Arbeiten zum Hinzufügen Kinyarwanda, sie erhielten ein Stipendium zum Hinzufügen Kiswahili.[5]
Siehe auch
Verweise
- ^ "Warum gehen wir geschlechtsspezifische KI? Sprachtechnikfirmen bewegen sich integrativer.". Der Wächter. 11. Januar 2020. Abgerufen 19. April 2020.
- ^ "Ankündigung der ersten Veröffentlichung von Mozillas Open -Source -Spracherkennungsmodell und Sprachdatensatz". Blog Mozilla.org. 29. November 2017.
- ^ "Mozilla aktualisiert gemeinsames Sprachdatensatz mit 1.400 Stunden Sprache in 18 Sprachen". VentureBeat. 28. Februar 2019.
- ^ "Mozilla Common Voice Updates helfen dabei, das Wakeword" Hey Firefox "für sprachbasiertes Webbrowsing zu trainieren.". VentureBeat. 1. Juli 2020. archiviert von das Original am 10. März 2021. Abgerufen 1. April 2021.
- ^ "Mozilla Common Voice erhält 3,4 Millionen US -Dollar Investitionen in die Demokratisierung und Diversifizierung von Voice Tech in Ostafrika.". Mozilla Foundation. 2021-05-25. Abgerufen 2021-06-03.