2016-03-14 3 views
1

J'utilise Gensim Library en python pour utiliser et former le modèle word2vector. Récemment, je cherchais à initialiser les poids de mon modèle avec un modèle word2vec pré-formé tel que (GoogleNewDataset pré-mannequin). J'ai lutté avec lui quelques semaines. Maintenant, je viens de chercher que dans gesim il y a une fonction qui peut m'aider à initialiser les poids de mon modèle avec des poids de modèle pré-formés. Cela est mentionné ci-dessous:Comment initialiser un nouveau modèle word2vec avec des poids de modèle pré-formés?

reset_from(other_model) 

    Borrow shareable pre-built structures (like vocab) from the other_model. Useful if testing multiple models in parallel on the same corpus. 

Je ne sais pas cette fonction peut faire la même chose ou non. S'il vous plaît aider !!!

Répondre

1

Vous pouvez maintenant faire un entraînement incrémental avec le gensim. Je recommande de charger le modèle pré-entraîné et ensuite faire une mise à jour.

from gensim.models import Word2Vec 

model = Word2Vec.load('pretrained_model.emb') 
model.build_vocab(new_sentences, update=True) 
model.train(new_sentences) 
+1

C'est la caractéristique que je recherchais fabuleux !!! –

+0

@Nomi s'il vous plaît n'hésitez pas à accepter la réponse – ksindi

+0

Que faire si les poids pré-entraîné n'ont pas été générés par gensim? Comment est-ce que j'initialiser le modèle avec des poids du fichier de texte de format word2vec? J'ai des embeddings qui ont été formés ailleurs et je veux continuer la formation en gensim ... Si vous pouvez répondre, s'il vous plaît postez dans cette question et j'accepterai @ksindi https://stackoverflow.com/questions/47959639/gensim- word2vec-transfer-learning-from-a-non-gensim-model – bluesummers