2016-09-13 3 views
0

En construisant un algorithme doc2Vec, il est nécessaire de disposer de plusieurs incorporations. Il y a des plongements pour les vecteurs de mots, alors qu'en même temps il y a des plongements pour les documents eux-mêmes. Le fonctionnement de l'algorithme est similaire à celui d'un modèle CBOW, mais l'intégration de documents est également utilisée pour chaque document en cours de formation avec une fenêtre donnée. Donc, si nous avons une fenêtre de 5 mots, nous allons de l'avant et parcourons ces 5 mots, mais pour chaque fenêtre, nous inclurons toujours le vecteur d'incorporation de document lui-même afin que nous puissions le mettre à jour.Recherche d'incorporation à partir de plusieurs intégrations dans un flux tensor

Répondre

2

Il suffit de les concaténer:

input_tensor = tf.concat(1, [wordembedding_tensor, documentembedding_tensor]) 

Ensuite, les entrées-tenseurs sont vos entrées.