1

Je veux utiliser Mallet dans le cadre d'un projet de recherche d'experts. Je suis presque nouveau à Mallet mais je sais qu'il forme des sujets à partir d'un ensemble de documents. Disons que j'ai 50 sujets formés par Mallet. Je veux calculer cette probabilité: ou soitComment obtenir la probabilité de sujet donné une requête en utilisant Mallet

q est la requête. C'est un mot (tel que l'algorithme, android et etc) que je suis désireux de trouver les experts dans la zone spécifiée. Comme j'ai lu cet article: how to get word-topic probability using mallet, un des utilisateurs a dit que nous pouvons calculer la probabilité en utilisant l'option --word-topic-counts-file. Disons que j'ai généré ce fichier par Mallet. Il a la structure suivante:

0 android 2:21 
1 is 3:3 
. 
. 
. 

Je sais la sémantique de cette structure, mais je ne sais pas comment puis-je calculer la probabilité de requête de sujet donné (c.-à-p(topic|q) ou soit p(q|topic))

PS: J'utilise le mot « soit » parce que je ne suis pas sûr maillet calcule lequel d'entre eux

Toute aide serait appréciée

Répondre

0

Prenez cette ligne exemple de GlieBrt's answer to the linked question

1 needham 19:2 17:1 

ici p (sujet | q) peut être calculé comme

p (19 | Needham) = 2/3 = 0,67

et

p (17 | Needham) = 1/3 = 0,33

Avec vous propre exemple, il est encore plus simple:

0 android 2:21 

p (2 | android) = 1.0

+0

Merci, j'ai vraiment été bloqué sur ce problème –