2017-03-06 4 views
1

J'ai téléchargé des vecteurs de mots de Wikipedia de here. J'ai chargé les vecteurs avec:Gensim: KeyedVectors.train()

model_160 = KeyedVectors.load_word2vec_format(wiki_160_path, binary=False) 

et que vous voulez les entraîner avec:

model_160.train() 

Je reçois l'erreur de retour:

--------------------------------------------------------------------------- 
AttributeError       Traceback (most recent call last) 
<ipython-input-11-22a9f6312119> in <module>() 
----> 1 model.train() 

AttributeError: 'KeyedVectors' object has no attribute 'train' 

Ma question est maintenant: Il semble que KeyedVectors n'a pas de fonction de train, mais je veux continuer à former les vecteurs sur mes phrases personnelles, au lieu d'utiliser simplement les vecteurs Wikipédia. Comment est-ce possible?

Merci à l'avance, Jan

Répondre

1

Vous ne pouvez pas utiliser KeyedVectors pour cela. De the documentation:

stockage

antivectorielle Word et look-ups similitude.
Les vecteurs de mots sont considérés comme étant en lecture seule dans cette classe.

Et also:

Le mot vecteurs peuvent également être instancié à partir d'un fichier existant sur le disque dans le format word2vec C comme une instance de KeyedVectors.
[...]
REMARQUE: Il est impossible de continuer à former les vecteurs chargés du format C en raison des poids cachés, la fréquence du vocabulaire et l'arbre binaire est manquant.