J'utilise la bibliothèque gensim pour appliquer LDA à un ensemble de documents. En utilisant gensim je peux appliquer LDA à un corpus quel que soit le terme poids: binaire, tf, tf-idf ...Pondération à court terme pour le LDA original dans le gensim
Ma question est, quel est le terme de pondération qui devrait être utilisé pour l'original LDA? Si j'ai bien compris, les poids devraient être des fréquences à terme, mais je ne suis pas sûr.