2016-06-17 2 views
1

EDIT: comme il semblait peu clair, je vais faire la question plus spécifique. Que signifie cette sortie numérique dans pocketsphinx?Pocketsphinx - Quelle est la signification de la sortie de débogage (cmn_prior, fsg_search) du processus de reconnaissance?

< INFO: cmn_prior.c(149): cmn_prior_update: to < 55.55 10.06 -1.22 10.50 -3.09 1.89 -8.37 -9.24 -5.98 -4.85 4.65 -3.25 -3.95 > 
< INFO: fsg_search.c(859): 191 frames, 4969 HMMs (26/fr), 12795 senones (66/fr), 1090 history entries (5/fr) 

je compare avec les fichiers diffent pistes wav presque identiques et obtenir des chiffres légèrement différents, et je suis intéressé à ce que des moyens de sortie, et quel type de conclusion ou d'informations peuvent être obtenues de celui-ci.

Je n'ai trouvé aucune documentation à ce sujet. Ce qui m'intéresse, c'est comprenant la sortie de débogage de pocketsphinx mieux. J'ai des notions sur les internes des modèles et la théorie derrière le processus, mais je ne sais pas comment interpréter cette sortie. Merci!

+0

Ce que vous demandez n'est pas très clair. Trop de questions et trop large. Vous devez énoncer votre question mieux. –

+0

@NikolayShmyrev là. Je l'ai fait plus spécifique et adressé un point particulier (signification de la production citée). Je ne sais pas si vous avez downvoted, mais selon http://stackoverflow.com/help/privileges/vote-down les downvotes sont pour des questions sans effort bâclées, pas pour celles qui ne sont pas claires et ne sont pas un substitut pour les commentaires et l'édition :) – jotadepicas

+0

Ok, maintenant vous devez mettre à jour le titre pour correspondre à la question. –

Répondre

1

< INFO: cmn_prior.c (149): cmn_prior_update: à 55,55 10,06 -1,22 < 10,50 -3,09 1,89 -8,37 -9,24 -5,98 -4,85 4,65 -3,25 -3,95>

Cette ligne indique que la moyenne cepstral est mise à jour pour ces valeurs spécifiques. Vous pouvez lire à propos de la normalisation moyenne cepstral here.

< INFO: fsg_search.c (859): 191 cadres, 4969 HMM (26/fr), 12795 Senones (66/fr), 1090 entrées d'histoire (5/fr)

Cette l'information est liée à Viterbi search. Il a dit que votre audio avait 191 images. Pendant la recherche 4969 HMM étaient actifs, 12795 sénones acoustiques ont été évalués. L'historique de recherche de Viterbi contenait 5 entrées par image en moyenne.

Je compare runs avec les fichiers diffent wav presque identiques et obtenir des numéros légèrement différents

Si les entrées sont légèrement différentes, il est parfaitement bien de voir des valeurs légèrement différentes aussi.

et quel type de conclusion ou d'information peut être obtenu à partir de celui-ci.

Vous ne pouvez pas dessiner quelque chose de spécifique à partir des informations que vous avez fournies. Si les chiffres étaient inhabituels, vous pourriez chercher la raison. Par exemple si CMN (0) était -200 en dehors de la gamme habituelle de 10-60. Ou s'il y avait 0 cadres. Les valeurs que vous avez fournies sont attendues.