2010-10-07 3 views
0

je veux commencer avec la reconnaissance vocale et la synthèse de la parole dans Prototype based on speech recognition quelqu'un m'a dit d'utiliser le serveur vocal Microsoft (sdk et ainsi de suite)mise en route avec la reconnaissance vocale et la synthèse de la parole

quand j'ai cela, comment est-ce que je programme une application, et avec quel langage de programmation (environnement de développement?)?

Quelqu'un a-t-il de l'expérience avec un astérisque ou SVOX?

que je dois faire:

reconnaissance vocale synthèse vocale

i ne dispose pas d'être une très bonne reconnaissance de la parole - je pense que devrait être suffisant 30 -50 mots pour le début. Je travaille avec Windows.

merci à l'avance

Répondre

2

Si vous choisissez d'utiliser Microsoft Speech Engine, il existe des API .NET Framework. Comme je l'ai mentionné dans l'autre post, il y a deux espaces de noms (System.Speech pour l'utilisation de bureau et Microsoft.Speech pour l'utilisation du serveur). Vous pouvez programmer dans n'importe quel langage .NET et vous pouvez utiliser Visual Studio.

Il y a un très bon article qui a été publié il y a quelques années au http://msdn.microsoft.com/en-us/magazine/cc163663.aspx. C'est probablement le meilleur article d'introduction que j'ai trouvé jusqu'ici. Cependant, il était basé sur une version préliminaire de l'API WinFX et les classes System.Speech ont été modifiées lors de la sortie de Vista. Les exemples dans l'article ne compilent pas en raison de ces changements d'API de rupture et je n'ai trouvé aucune mise à jour ou errata pour expliquer ceci. Recherche sur Internet pour le nom de méthode "AppendResultKeyValue", vous trouverez quelques messages de forum comme http://www.ms-news.net/f3012/system-speech-breaking-changes-3025734.html où les gens ont rencontré ce même problème. Il s'agit toujours d'un bon article d'introduction et vaut la peine d'être lu. avec un peu de piratage, vous pouvez faire fonctionner l'application exemple.

+0

Voir l'autre message mentionné à http://stackoverflow.com/questions/3865351/prototype-based-on-speech-recognition/3867083 –

0

Lorsque j'ai étudié la linguistique computationnelle l'outil de choix était Praat, un outil de prototypage horriblement confus qui vous permet de faire à peu près tout ce qui concerne la parole.

Je ne pense pas qu'il ait une API externe, mais son langage de script interne est suffisant pour les applications rudimentaires, et il a beaucoup de fonctions intégrées. Pour "commencer" sur la théorie et les algorithmes, ce n'est pas trop mal.

Questions connexes