2016-08-21 1 views
4

J'ai du mal à approcher le sac de mots/méthode de vocabulaire pour représenter mes données d'entrée en tant que vecteurs chauds pour mon modèle de réseau neuronal dans keras. Je voudrais construire un réseau simple à 3 couches mais j'ai besoin d'aide pour comprendre et développer une approche pour transformer mes données étiquetées sous la forme de texte, sentinment qui a 7 étiquettes, dans la gamme de 0 - 1 dans étapes de 0,2. J'ai essayé d'utiliser les vectoriseurs de scikit, mais ils sont trop rigides, ils symbolisent des mots ou des caractères, alors que j'ai besoin d'une phrase à comparer au vocabulaire qui comprend les mots, les caractères, la ponctuation et les emojis. Quand j'utilise tfid sur une phrase de test, il ne compte que les mots et ignore tout le reste. J'ai également besoin de conseils sur la prise de cette approche à chaud et comment il sera mis en œuvre dans les keras.Utilisation de Keras pour la classification de texte

vraiment apprécier toute aide,

Vive

Répondre

6

Here est un exemple Keras où ils ont 8 classes de sortie et d'utiliser un sac de mots.

+1

bonne réponse - mais mieux d'ajouter une courte description dans la réponse elle-même –