2017-10-12 9 views
0

J'utilise le gensim library for word2vec. Je veux former le modèle sur des exemples de textes qui ne sont pas liés, par exemple: "Le chat est brun, quelle heure est-il?"gensim avec un contexte différent

J'ai créé l'entrée suivante au modèle: mais

[["The", "cat", "is", "brown"], ["What", "time", "is", "it"]], je me demande si le modèle suppose que « brun » et « Qu'est-ce que » sont dans le même contexte.

J'ai essayé de trouver la réponse dans l'API, mais je n'ai pas pu le trouver.

Répondre

0

L'API gensim ne considérera pas "brown" et "Quoi" dans le même contexte. Les fenêtres inégales sont utilisées à proximité des limites de la peine. Ainsi, par votre exemple, si la taille de la fenêtre disons est 1, le (contexte, cible) paires ressemblerait comme ci-dessous:

([cat],The), ([The,is],cat), ([cat,brown],is), ([is],brown) ([time],What), ([What,is],time), ([time,it],is), ([is],it)

J'espère que cela efface le doute.