Speech Synthesis Markup Language
buonasera, per una riflessione sulla produzione di audiolibri per persone non vedenti qualcuno sa dove in Italia e fuori si lavora a livello di ricerca e/o applicativo su text-to-speech differenziato per tipologia di testo? (cioè un TTS che non dia una lettura piatta ma dia una resa espressiva appropriata al tipo di testo e ai singoli passaggi di testo). so di SSML (Speech Synthesis Markup Language) ma non ho la minima idea se esistano dei repository di testi annotati in SSML, né se sia obsoleto o avanzato, né di quali sistemi software possano ricevere in input un testo annotato in SSML. grazie dell'aiuto! Maurizio ------------------------------------------------------------------------ che faresti se vivessi così? mau mau, con chi fugge ------------------------------------------------------------------------ Maurizio Lana - 347 7370925
Buonasera Maurizio, maurizio lana <maurizio.lana@uniupo.it> writes: [...]
so di SSML (Speech Synthesis Markup Language)
conoscevo di nome SSML ma non l'ho mai usato per completezza l'articolo Wikipedia su SSML https://en.wikipedia.org/wiki/Speech_Synthesis_Markup_Language indica anche: - Pronunciation Lexicon Specification (PLS) - Speech Recognition Grammar Specification (SRGS) - Semantic Interpretation for Speech Recognition (SISR) - SABLE speech synthesis markup language, intended to combine SSML, STML, and JSML
ma non ho la minima idea se esistano dei repository di testi annotati in SSML,
eh, temo proprio di no; da quello che so markup lang come SSML sono usati per sistemi come autorisponditori o analoghi
né se sia obsoleto o avanzato,
che io sappia SSML è una W3C reccomandation [1] ancora valida, quindi AFAIU è attuale, anche se non so quanto usata
né di quali sistemi software possano ricevere in input un testo annotato in SSML.
io conosco: - eSpeakNG https://en.wikipedia.org/wiki/ESpeak https://github.com/espeak-ng/espeak-ng (dice: supported (not complete)) - flite https://en.wikipedia.org/wiki/Festival_Speech_Synthesis_System https://github.com/festvox/flite (dice: New in 2.0.0 [...] SSML support) pare che eSpeakNG supporti anche HTML, che è interessante, ma non trovo nessuna documentazione che spieghi come funziona "l'interpretazione" del markup HMTL. Un minimo di documentazione che racconta dello stato di sviluppo di eSpeakNG è questa: https://github.com/espeak-ng/espeak-ng/wiki/eSpeak-NG-roadmap [...] Saluti, 380° [1] https://www.w3.org/TR/speech-synthesis11/ -- 380° (Giovanni Biscuolo public alter ego) «Noi, incompetenti come siamo, non abbiamo alcun titolo per suggerire alcunché» Disinformation flourishes because many people care deeply about injustice but very few check the facts. Ask me about <https://stallmansupport.org>.
participants (2)
-
380° -
maurizio lana