En construisant un algorithme doc2Vec, il est nécessaire de disposer de plusieurs incorporations. Il y a des plongements pour les vecteurs de mots, alors qu'en même temps il y a des plongements pour les documents eux-mêmes. Le fonctionnement de l'algorithme est similaire à celui d'un modèle CBOW, mais l'intégration de documents est également utilisée pour chaque document en cours de formation avec une fenêtre donnée. Donc, si nous avons une fenêtre de 5 mots, nous allons de l'avant et parcourons ces 5 mots, mais pour chaque fenêtre, nous inclurons toujours le vecteur d'incorporation de document lui-même afin que nous puissions le mettre à jour.Recherche d'incorporation à partir de plusieurs intégrations dans un flux tensor
0
A
Répondre
2
Il suffit de les concaténer:
input_tensor = tf.concat(1, [wordembedding_tensor, documentembedding_tensor])
Ensuite, les entrées-tenseurs sont vos entrées.