2010-01-18 3 views

Répondre

0

S'il vous plaît élaborer. Quelle plateforme? Quel vocabulaire de taille? Quelles contraintes de performance? Continu? Semi-continu? Que voulez-vous dire par "pas de discours au moteur de texte"?

Si vous avez besoin de quelque chose de simple et petit, vous pouvez essayer EARS écrit en C et pas très grand, probablement bon pour les débutants.

1

Sphinx est probablement dans le sens de ce que vous cherchez. C'est une plate-forme de reconnaissance vocale open-source et un projet en cours à l'Université Carnegie-Mellon.

+0

Sphinx est un sur-ensemble de ce que le PO recherche. Sphinx est très agréable, mais il vise le problème le plus complexe: une reconnaissance vocale continue, indépendante du locuteur, à grand vocabulaire. Par conséquent, il exige une puissance de calcul considérable pour effectuer la reconnaissance - ce qui n'est pas le meilleur choix pour les petites situations de contrainte (informatique). –

0

il existe des moteurs dépendant des haut-parleurs, ils sont plus primitifs, comme l'ont fait allot des téléphones cellulaires. N'essayez pas de convertir en texte, ils font juste une comparaison de signal. et ce que j'ai besoin.

+0

Voir la mise à jour de ma réponse - EARS –

+1

Si vous voulez clarifier votre question, vous devriez éditer votre question directement. Au lieu de cela, vous avez ajouté une réponse, que beaucoup de gens pourraient ne pas voir. – davr

1

J'ai utilisé le sphinx-4 pour atteindre une précision de 82,25%. Je suis en train de déterminer comment l'augmenter de plus de 95%. Je ne transcris que la voix d'une personne, donc si un système dépendant du locuteur sera utile, ce sera génial. le vocabulaire est d'environ 40 000 mots. J'ai un système dual core et je pourrais facilement exécuter sphinx-train et sphinx4 décodeur bien que le formateur prenne une journée pour former 40 heures d'audio que j'ai et le décodeur est en temps réel.

Je veux savoir s'il y a une bibliothèque de produits/open-source que je peux utiliser pour augmenter mon pourcentage de précision.

Merci, Dharani

Questions connexes