Je veux utiliser Mallet dans le cadre d'un projet de recherche d'experts. Je suis presque nouveau à Mallet mais je sais qu'il forme des sujets à partir d'un ensemble de documents. Disons que j'ai 50 sujets formés par Mallet. Je veux calculer cette probabilité: ou soitComment obtenir la probabilité de sujet donné une requête en utilisant Mallet
q
est la requête. C'est un mot (tel que l'algorithme, android et etc) que je suis désireux de trouver les experts dans la zone spécifiée. Comme j'ai lu cet article: how to get word-topic probability using mallet, un des utilisateurs a dit que nous pouvons calculer la probabilité en utilisant l'option --word-topic-counts-file
. Disons que j'ai généré ce fichier par Mallet. Il a la structure suivante:
0 android 2:21
1 is 3:3
.
.
.
Je sais la sémantique de cette structure, mais je ne sais pas comment puis-je calculer la probabilité de requête de sujet donné (c.-à-p(topic|q)
ou soit p(q|topic)
)
PS: J'utilise le mot « soit » parce que je ne suis pas sûr maillet calcule lequel d'entre eux
Toute aide serait appréciée
Merci, j'ai vraiment été bloqué sur ce problème –