Répondre

0

Il est difficile de faire la distinction entre les erreurs commises par le locuteur (erreurs de grammaire et de prononciation) dans le contenu audio et les erreurs faites par Speech API. Cependant, vous pouvez vérifier différentes versions de sortie de texte prédites par le modèle derrière la scène à l'aide de la propriété maxAlternatives de l'API.

Vous n'avez pas fourni l'exemple d'une telle utilisation, mais si vous attendez déjà une prononciation inhabituelle ou des acronymes, vous pouvez fournir un indice à la demande en utilisant la propriété phraseHint.

Veuillez fournir plus de détails s'il ne répond pas à votre question.