0

Je travaille sur google cloud discours api j'ai essayé leur api avec mon fichier flac mais ils ne font que transcrire une partie de mon fichier au format flac.Is-il quelque chose que je peux faire avec mon fichier faire fonctionner perfectly.I a essayé de tester leur api sur leur link .Je passe ceci dans le corps de la demandediscours Google Cloud ne pas retourner le texte intégral

{ "audio": { "uri": "gs: //kami1994/file-1506682082651.flac" }, "config": { "encoding": "flac", "advisoryText": "en-US", "sampleRateHertz": 44100, "maxAlternatives": 1 } }

Mais il ne renvoie pas le texte exactement comme je l'ai parlé.

Répondre

0

Le moteur de reconnaissance vocale devrait être très précis mais pas 100%. Pour déboguer votre problème plus loin, vous pouvez activer les décalages temporels de mot, dans Reconnaissance.

"config": { "encoding": "FLAC", "languageCode": "en-US", "sampleRateHertz": 44100, "maxAlternatives": 1, **"enable_word_time_offsets": True** } 

Ceci vous aiderait à vérifier si les limites des mots sont détectées.