2011-06-09 5 views
1

Je suis en train de développer un système de reconnaissance numérique de base connecté utilisant HTK. À l'heure actuelle, le système de reconnaissance doit reconnaître les chiffres de 0 à 10 seulement et dépend du locuteur (ce qui n'est pas un problème en ce moment). Voici comment je fais la reconnaissance:Reconnaissance de chiffres connectés avec HTK

  1. Obtenez le fichier WAV enregistré par l'utilisateur et créez MFCC.
  2. Exécutez HVite sur le fichier mfcc avec wordnet et dictionnaire comme entrées.

    Note sur la formation pour les modèles HMM:

Les unités de base pour la formation des modèles HMM initiaux ont été abattues à partir de chaînes de chiffres parlé. Je me retrouve avec environ 20 unités de chaque chiffre (environ) qui entrent dans la fabrication des modèles initiaux. Les modèles d'apprentissage intégrés ont été synthétisés en concaténant les unités de base (l'unité de base à concaténer est choisie au hasard). Le nombre total de phrases générées de cette manière est d'environ 20000. 109 autres phrases ont été prises à partir de mots réels prononcés pendant la phase de test.

Le problème auquel je suis confronté est le suivant:
1. Dans une chaîne de chiffres connectés de longueur supérieure à 4, j'obtiens des chiffres insérés dans la chaîne d'entrée à la sortie.
par ex.) Entrée: 99102, sortie: 989818082
Notez que tous les chiffres de l'entrée sont reconnus correctement, c'est juste qu'il y a des chiffres étrangers introduits à la sortie. Regarder le fichier mlf montre que les valeurs de vraisemblance associées à ces mots sont également similaires. Une idée de pourquoi cela peut-il se produire?

J'ai regardé à travers le net pour trouver des solutions, mais je n'en ai rencontré aucun. Toute aide est la bienvenue.

Répondre

1

Vous devez définir la pénalité d'insertion de mots (pour l'option HVite -p) - elle est probablement définie sur 0.0 (par défaut). Vous devrez jouer avec cette valeur. Commencez à -1,0 et allez plus négatif.

+0

merci pour la réponse. va essayer ça. – Sriram

Questions connexes