2017-09-28 1 views
0

J'essaie de mettre en œuvre un réseau LSTM pour détecter l'ordre correct des mots en désordre dans une phrase. Comment étiqueter l'ensemble de données? Mon ensemble de données se compose de phrases avec un maximum de 6 mots. Quelle devrait être la représentation de ma couche de sortie?Résolvez les mots en utilisant des réseaux LSTM

Par exemple, si ma phrase est « est-ce neurale un réseau » commande est 2,1,4,3,5 -> c'est un réseau de neurones

Merci!

Répondre

1

Pour toute tâche NLP comme celle-ci, vous devez utiliser des incorporations de mots, par ex. Word2Vec. Chaque mot sera représenté comme un vecteur. Votre entrée sera une matrice de ces vecteurs dans l'ordre original, incorrect. Votre sortie sera une matrice de ces vecteurs dans le bon ordre. Ci-dessous, j'ai inclus un lien vers un cours Fast.ai qui traite plus en détail des plongées de mots.

https://course.fast.ai/lessons/lesson6.html

* Notez qu'en raison de la formulation du problème, je suppose votre RNN est capable de gérer des paires de phrases d'entrée/sortie. Si ce n'est pas le cas ou si vous rencontrez des problèmes dans ce sens, laissez un commentaire et je peux vous donner d'autres idées.