Pour utiliser la méthode d'indexation sémantique latente de gensim, je veux commencer par un petit exemple "classique" comme:Latent Semantic Indexation avec gensim
import logging, gensim, bz2
id2word = gensim.corpora.Dictionary.load_from_text('wiki_en_wordids.txt')
mm = gensim.corpora.MmCorpus('wiki_en_tfidf.mm')
lsi = gensim.models.lsimodel.LsiModel(corpus=mm, id2word=id2word, num_topics=400)
etc..
Ma question est: Comment obtenir le corpus iterator 'wiki_en_tfidf.mm'? Dois-je le télécharger de quelque part? J'ai cherché sur Internet mais je n'ai rien trouvé. Aidez-moi, s'il vous plaît ?