Les suggestions de Dave sont un bon début. Sphinx est très chouette.
Je veux juste ajouter que vous devriez être aussi probabiliste que possible. En tant que linguiste ponctuel et même ancien amateur de phonologie, je peux affirmer sans crainte ne pas être pris au dépourvu de modèles linguistiques. N'oublions pas l'erreur souvent attribuée "chaque fois que je tire un linguiste, ma précision augmente". Il s'agit vraiment du modèle et de ses capacités à tenir compte du bruit et de la variation plutôt que tout ce qu'un major des arts libéraux du MIT a à dire.
Un bon livre à retenir serait Jurafsky et Martin "Speech and Language Processing". Il a quelques applications très utiles de modèles computationnels pour la tâche. Le travail de Harvey Sussman sur les corrélations linéaires dans les pentes F2 pour une variété de voyelles (en commençant par les chouettes et travaillant vers les humains) semble être une bonne chose à mettre en œuvre dans un modèle de ces jours.