J'ai utilisé tf/idf pour calculer la similarité entre deux documents. Il a certaines limites et ne fonctionne pas très bien. J'ai cherché LDA (allocation de Dirichlet latent) pour calculer la similarité de document. Je ne connais pas beaucoup de choses à ce sujet. Je ne pouvais pas trouver beaucoup de choses sur mon problème.Similitude de document
Pouvez-vous s'il vous plaît me fournir un tutoriel lié à mon problème? Ou pouvez-vous donner quelques conseils comment puis-je réaliser cette tâche avec LDA ???
Merci
P.S: est-il un code source availabe pour effectuer cette tâche avec LDA ??
Pouvez-vous s'il vous plaît expliquer pourquoi similarité cosinus n'a pas fonctionné pour vous? –