0

J'ai suivi l'exemple d'application pour générer du discours à partir du texte en utilisant le référentiel GitHub ci-dessous.API de discours de parole de Bing Rate - Text to Speech

https://github.com/Azure-Samples/Cognitive-Speech-TTS/tree/master/Samples-Http/CSharp

Mon application est en cours d'exécution problème est bien que le taux parler ou pause/pause après chaque mot.

texte d'entrée: y u 7 f s d e 2 3

Voici l'exemple de SSML J'utilise:

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xml:lang="en-IN"><voice xml:lang="en-IN" name="Microsoft Server Speech Text to Speech Voice (en-IN, Ravi, Apollo)">y u 7 f s d 2 3 e</voice></speak>

Je veux faire une pause après chaque alphabet. Comme j'utilise cet audio pour obtenir du texte captcha en mode audio.

Veuillez suggérer une approche correcte.

P.S: Je ne veux pas répéter le code entier par copier coller. (en utilisant l'échantillon de GIT)

J'ai même suivi la conversation dans les commentaires d'un lien ci-dessous sans succès.

https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home

+0

Avez-vous essayé "." après chaque mot/lettre? –

+0

J'ai essayé tout à l'heure, "." est orthographié comme DOT dans le discours :( – Pratik

Répondre

2

this -> "y". "u". "7". "F". "s". "ré". "2". "3". "e". < - cela fonctionne sur le test de page Web de discours de bing. Cela devrait aussi vous convenir. voici le SSML:

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xml:lang="en-US"> 
    <voice xml:lang="en-US" name="Microsoft Server Speech Text to Speech Voice (en-US, ZiraRUS)">&quot;y&quot;. &quot;u&quot;. &quot;7&quot;. &quot;f&quot;. &quot;s&quot;. &quot;d&quot;. &quot;2&quot;. &quot;3&quot;. &quot;e&quot;. 
    </voice> 
</speak> 
+0

Cela a résolu le but. \ n "J'ai aussi essayé \ n" newline "qui fonctionne pareil Appréciez votre aide. – Pratik