2017-05-11 2 views
0

Afin d'être clair, j'aimerais savoir si le code/l'utilisation de gensim est correct ou non?id2word_token2Id confusion d'utilisation dans Gensim

Merci d'avance pour votre précieux temps.

import gensim  

train = ["John likes to watch movies Mary likes movies too" , 
     "John also likes to watch football games" ] 

test = ["Football is my dream"] 

train_texts = [[word for word in document.lower().split()] for document in train] 
test_texts = [[word for word in document.lower().split()] for document in test] 

dictionary =gensim.corpora.Dictionary(train_texts) 

train_corpus = [dictionary.doc2bow(text) for text in train_texts] 
test_corpus = [dictionary.doc2bow(text) for text in test_texts] 

ldaModel = gensim.models.LdaModel(corpus=train_corpus , 
      id2word=dictionary , num_topics=2) 
bound_perplex = ldaModel.bound(test_corpus) 
+0

J'objet d'une enquête avec d'autres personnes. C'est comme il est censé être. Je vous remercie – TheWho

Répondre