2

Je veux classer 2 types de phrases: les énoncés et les questions. Pour cela, je besoin déjà appris word2vec NN passer des phrases jeter et recevoir tableau 2D pour chaque phrase, par exemple:Comment utiliser appris word2vec dans keras/tensorflow?

[[~ 300 articles], [~ 300 articles], [~ 300 articles], ...]

"300" est la longueur approximative du vecteur de mot.

comment faire cela est keras? quelle bibliothèque est préférable d'utiliser?

Répondre

2

Ce que j'adivce vous est d'utiliser une couche Embedding et définir ses poids:

input = Input(shape=(seq_len,)) 
embedding = Embedding(input_dim=vocabulary_size, 
    output_dim=300, weights=[your_w2v_matrix])(input) 
... 

Here vous pourriez trouver vraiment une question similaire.

+1

La réponse de ce quesion fait référence à l'article http://ben.bolte.cc/blog/2016/keras-gensim-embeddings.html. mais ce post est incompréhensible –

+0

'Embedding' couche qui a été montré dans ma réponse devrait également résoudre votre problème. –

+0

pouvez-vous montrer une partie du code, qui transforme les phrases en tableaux de vecteurs word2vec? –