J'utilise le code suivant pour former le modèle:Tous les mots, ceux que j'utilise pour former le modèle word2vec, doivent être dans model.vocab, n'est-ce pas?
norms_train = [ [''], [ u'word', u'to', u'learn', ... ], ...]
model = word2vec.Word2Vec(norms_train, size=100, window=10)
Avec procédure pour vérifier les résultats:
i, j = 0, 0
for text in norms_train:
j += len(text)
for word in text:
if word not in model.vocab:
i += 1
print i, '/', j
13129/185379
Oui, maintenant je vois - min_count = 5 –
Essayez de mettre 'min_count' = 0 et ensuite former votre modèle à nouveau. Cela pourrait aider. – KartikKannapur