2017-08-06 1 views
0

J'essaie de mettre en œuvre en tant que mineur d'aspect sur la base des commentaires des consommateurs en Amazonie pour machine à laver durable, réfrigérateur. L'idée est de produire la polarité du sentiment pour les aspects au lieu de la phrase entière. Par exemple: «La nourriture était bonne mais le service était mauvais». La revue doit produire des aliments positifs et le service négatif. J'ai lu l'article de Richard Socher sur le modèle RNTN pour classifier les sentiments à grain fin, mais je suppose que je vais devoir marquer manuellement le sentiment pour les phrases d'un domaine différent et créer ma propre arborescence pour une meilleure précision.approche NLP Aspect Mining

Voici une autre approche à laquelle j'avais pensé. Quelqu'un pourrait-il me valider/me guider avec vos commentaires? Rompre l'approche en 2 sous-tâches. 1) Identifier les aspects 2) Identifier le sentiment

Identifier les aspects

  1. Utilisez POS tagger pour identifier tous les noms. Cela devrait présélectionner potentiellement tous les aspects dans les commentaires.
  2. utilisation word2vec de ces noms pour déterminer les noms similaires et de réduire la taille du jeu de données

Identifier les sentiments

  1. train CNN ou d'un modèle réseau dense sur les examens avec 1,2,4,5 note (ignorer 3 que nous avons besoin de données qui a la polarité)
  2. Répartition des commentaires du jeu de test dans des phrases (par exemple: « la nourriture était bonne »), puis les score en utilisant le modèle ci-dessus
  3. Trouvez les aspects identifiés dans la première sous-tâche et marquez-les par leurs expressions respectives.
+0

Voir ici: https://stackoverflow.com/questions/45019446/identifying-multiple-categories-and-associated-sentiment-within-text/45025107#45025107 – polm23

+1

double possible de [Identifier plusieurs catégories et le sentiment associé dans le texte] (https://stackoverflow.com/questions/45019446/identifying-multiple-categories-and-associated-sentiment-within-text) – polm23

Répondre

0

Je ne sais pas comment répondre à cette question, mais ont quelques suggestions:

  1. Jetez un oeil à l'apprentissage multitâches dans la littérature neuralnets et essayer une neuralnet de end2end pour des tâches multiples.
  2. Utilisez des vecteurs de mots pré-alignés comme w2v ou glov comme entrées.
  3. Ne comptez pas sur les taggeurs de pos lorsque vous utilisez des données Internet,
  4. Trouvez un moyen de représenter vos entités de nom et oov dans votre conception.
  5. Ne pas ignorer 3 !!
  6. Vous devez annoter certaines données périodiquement.