Doc2Vec hérite de Word2Vec, et donc vous pouvez accéder à mot vecteurs les mêmes que dans Word2Vec, directement par l'indexation du modèle:
wv = d2v_model['apple']
Notez cependant qu'un mode de formation Doc2Vec comme DBOW pur (dm=0
) n'a pas besoin ou créer des vecteurs de mot. (Pure DBOW fonctionne encore assez bien et rapidement pour beaucoup de buts!) Si vous accédez à des vecteurs de mots à partir d'un tel modèle, ils seront juste les vecteurs automatiques randomisés, sans signification. Ce n'est que lorsque le mode Doc2Vec lui-même cohabite des vecteurs de mots, comme dans le mode DM (dm=1
par défaut) ou lors de l'ajout d'un mot de passe facultatif à DBOW (dm=0, dbow_words=1
), les vecteurs de mots et les doc-vecteurs sont tous deux appris simultanément .