2009-01-29 12 views
39

Comment est-ce que je pourrais prendre le MP3 et convertir le discours au texte?Comment convertir la parole en texte?

J'ai quelques notes enregistrées d'une conférence et de réunions (il y a une seule voix sur l'enregistrement, qui est ma voix). Je pensais qu'il serait plus facile et intellectuellement intéressant de convertir au texte en utilisant des outils de synthèse vocale plutôt que de simplement les transcrire à la main. Je sais qu'il existe des technologies, en particulier pour les applications VoIP utilisant Asterisk et Podcasts, mais que sont-elles et comment puis-je les utiliser?

+0

Peut-être transmettre cela à Joel et Jeff afin qu'ils puissent obtenir le texte pour leurs transcriptions wiki des podcasts SO. –

+0

Pour contourner le problème, il est possible de télécharger le contenu multimédia sur YouTube en tant que vidéo, car Youtube effectue un service CC lorsque la vidéo est téléchargée. Ce n'est pas la solution d'un développeur, mais il peut en être un à la rigueur. https://www.youtube.com/watch?v=yxmfJuC2Uno – iamtoc

Répondre

30

Open Source: CMU Sphinx

Shareware: http://www.e-speaking.com/ (Windows)

commerciale: Dragon NaturallySpeaking (Windows)

+0

Je pense que les trois ci-dessus sont de bonnes options pour vous donner ce dont vous avez besoin pour y arriver, mais il y aura du code (pas de cut n'n paste hack) pour parler au travail de texte. De mon expérience très limitée d'utiliser Sphinx avec Asterisk PBX, j'irais pour cela sur le vote libre (bière et discours) pour un petit projet personnel. –

5

.NET peut le faire avec son espace de noms System.Speech.

Vous devez d'abord convertir en .wav ou capturer l'audio en direct à partir du micro.

Détails sur la mise en œuvre peuvent être trouvés ici: Transcribing Audio with .NET

0

fin à la partie, afin de répondre plus pour référence ultérieure.

Les progrès dans le domaine + état d'esprit et l'agenda de Mozilla conduit à ces deux projets à cette fin:

Ce dernier dispose d'un ensemble de données 12Go pour le téléchargement. Le premier permet de former un modèle avec vos propres fichiers audio à ma compréhension

Questions connexes