2016-05-01 4 views
0

j'ai construit un modèle GMM-UBM dans le but de la reconnaissance du locuteur. La sortie des modèles a adapté pour chaque locuteur des scores calculés par le logarithme du rapport de vraisemblance. Maintenant, je veux convertir ces scores de probabilité en nombre équivalent entre 0 et 100. Quelqu'un peut-il me guider s'il vous plaît?scores GMM-UBM à la précision equicalent pour cent

Répondre

0

Il n'y a pas de formule simple. Vous pouvez faire des choses simples comme

prob = exp(logratio_score) 

mais cela pourrait ne pas refléter la vraie distribution de vos données. Le pourcentage de probabilité calculé de vos échantillons ne sera pas distribué uniformément.

Idéalement vous devez prendre un grand ensemble de données et de recueillir des statistiques sur ce taux d'acceptation/rejet avez-vous pour ce score. Ensuite, une fois que vous construisez un histogramme, vous pouvez normaliser la différence de score par ce spectrogramme pour vous assurer que 30% de vos sujets sont acceptés si vous voyez la différence de score. Cette normalisation vous permettra de créer des pourcentages de probabilité uniformément distribués. Voir par exemple How to calculate the confidence intervals for likelihood ratios from a 2x2 table in the presence of cells with zeroes

Ce problème est rarement résolu dans les systèmes d'identification de haut-parleur car les intervalles de confiance ne sont pas ce que vous voulez réellement afficher. Vous avez besoin d'une simple décision d'acceptation/de rejet et pour cela, vous devez connaître la quantité de faux rejets et accepter le taux. Il suffit donc de trouver juste un seuil, pas de construire toute la distribution.

+0

J'ai utilisé la fonction sigmoïde pour ce problème, mais comme vous le savez il ne reflète pas la distribution des scores. J'avais l'intention d'utiliser la deuxième voie. Merci pour votre bonne suggestion. –