J'ai fait de la similitude de document sur mon corpus en utilisant Doc2Vec et cela produit moins de similitudes. Je me demandais si je pouvais faire un modèle de sujet à partir de ce que Doc2Vec me donne pour augmenter la précision de mon modèle afin d'obtenir de meilleures similitudes?Puis-je créer un modèle de sujet (tel que LDA) à partir de la sortie du modèle doc2vec?
1
A
Répondre
1
Vous devez former un nouveau modèle (comme LDA) à partir du corpus d'origine.
Si les similitudes natives données par le processus Doc2Vec ne sont pas très bonnes, vous pouvez peut-être les améliorer en ajustant votre processus. Mais si cela ne fonctionne pas, alors Doc2Vec n'a pas distillé des informations utiles de vos données - et les calculs en aval construits sur ces (bruts) chiffres bruts ne sont pas susceptibles d'être magiquement meilleurs.