J'ai formé des vecteurs de paragraphe pour environ 2300 paragraphes (entre 2000 et 12000 mots chacun) avec une taille de vecteur de 300. Maintenant, je dois déduire des vecteurs de paragraphe d'environ 100.000 phrases que j'ai considérées comme des paragraphes. -30 mots correspondant chacun aux 2300 paragraphes précédents déjà formés).doc2vec - Comment inférer des vecteurs de documents plus rapidement?
Alors, je utilise
model.infer_vector(sentence)
Mais, le problème est qu'il prend trop de temps, et il ne prend pas d'arguments tels que « workers
».! Y a-t-il un moyen d'accélérer le processus en enfilant ou d'une autre manière? J'utilise une machine avec ram 8gb et quand j'ai vérifié les noyaux disponibles en utilisant
cores = multiprocessing.cpu_count()
il sort d'être 8.
Je en ai besoin pour répondre à des questions à choix multiples. En outre, existe-t-il d'autres bibliothèques/modèles tels que doc2vec
qui peuvent aider dans cette tâche?
Merci d'avance pour votre temps.