0

J'ai implémenté la classification de documents Naive-Bayes avec une bonne filtration de texte et j'ai accepté des résultats statistiques avec une bonne précision, j'ai besoin d'améliorer mes résultats en utilisant un algorithme EM.Implémentation de l'algorithme de maximisation des attentes avec NaiveBayes

Mais je ne sais pas si je peux appliquer l'algorithme EM avec les résultats Naive-Bayes ou appliquer l'algorithme sur les données et tout recommencer donc je peux comparer les résultats

Dans les deux cas j'ai besoin à comprendre l'algorithme EM sur cette question parce que c'est vraiment me confondre

Tout bien expliqué les documents seront appréciés

Répondre

1

EM vous aide généralement avec des données non marquées. Si vous avez des données non étiquetées, vous utilisez essentiellement dans un cycle comme celui-ci

estimate some initial parameters, perhaps even randomly 
while not converged: 
    relabel data using estimates 
    update estimates using new labels 

Si vous faites l'apprentissage supervisé, l'étape relabel ne souffle pas vos étiquettes, et est susceptible de rendre votre classement pire.

D'autre part, ce is a nice, detailed tutorial on semi-supervised naive bayes pour la classification de texte. Si vous disposez d'un petit jeu de documents étiquetés et d'un grand nombre de documents non étiquetés, vous pouvez les utiliser pour estimer les paramètres initiaux, puis effectuer les étapes itératives sur les données non étiquetées et obtenir un meilleur classificateur.

+0

Merci pour le lien, Donc je ne peux pas fusionner l'EM avec les résultats NB afin de ne pas obtenir mes résultats bruts, Si vous en savez beaucoup sur EM pensez-vous que cela vaut la peine d'essayer et de comparer entre eux? –

+0

NB est un classificateur, EM est un algorithme d'inférence. Qu'est-ce que vous voulez exactement comparer? –

Questions connexes