Sprachsynthese Markup Sprache

Sprachsynthese Markup Sprache (SSML) ist ein Xml-basierend Auszeichnungssprache zum Sprachsynthese Anwendungen. Es ist eine Empfehlung der W3c's Sprachbrowser Arbeitsgruppe. SSML ist oft eingebettet in VoiceXml Skripte, um interaktive Telefonie -Systeme zu fördern. Es kann jedoch auch allein verwendet werden, z. B. zum Erstellen von Audiobüchern. Für Desktop -Anwendungen sind andere Markup -Sprachen beliebt, einschließlich Äpfel eingebettete Sprachbefehle und Microsoft's SAPI Text zu Sprache (TTS) Markup, auch eine XML -Sprache. Es wird auch verwendet, um Sounds über den Text von Azure Cognitive Services zu Speech-API oder beim Schreiben von Fähigkeiten von Drittanbietern für zu produzieren Google Assistant oder Amazon Alexa.

SSML basiert auf dem Java Speech Markup Sprache (JSML) entwickelt von Sun MicrosystemsObwohl die aktuelle Empfehlung hauptsächlich durch Sprachsyntheseanbieter entwickelt wurde. Es deckt praktisch alle Aspekte der Synthese ab, obwohl einige Bereiche nicht spezifiziert wurden, sodass jeder Anbieter eine andere Sprachvariante akzeptiert. Ohne Markup wird erwartet, dass der Synthesizer seine eigene Interpretation des Textes durchführt.

Beispiel

Hier ist ein Beispiel für ein SSML -Dokument:

  xmlns ="http://www.w3.org/2001/10/synthesis"  xmlns: dc ="http://purl.org/dc/elements/1.1/"  Version ="1.0">     XML: Lang ="en">Telefonmenü: Stufe 1    

XML: Lang ="en-us"> Name ="David" Geschlecht ="männlich" Alter ="25"> Für Englisch, Presse eines. XML: Lang ="ES-MX"> Name ="Miguel" Geschlecht ="männlich" Alter ="25"> Para Español, Oprima El DOS.

Merkmale

SSML legt eine ganze Menge Markup für an Prosodie, was im obigen Beispiel nicht erkennbar ist. Dies beinhaltet Markup für

  • Tonhöhe
  • Kontur
  • Pitch Range
  • Bewertung
  • Dauer
  • Volumen

Siehe auch

Verweise

Externe Links