2016-11-16 3 views
2

Je prévois faire une analyse de sentiment sur les avis des clients (une critique peut avoir plusieurs phrases) en utilisant word2vec. J'ai quelques questions à ce sujet:Analyse de sentiment en utilisant word2vec

  1. Dois-je former mon modèle word2vec (en gensim) en utilisant uniquement les données d'entraînement? Devrais-je considérer les données de test pour cela aussi?
  2. Comment devrais-je représenter la révision pour la classification? Cette représentation prendra-t-elle en considération l'ordre du mot car il est important de représenter une revue pour l'analyse de sentiment?

Répondre

2

Fondamentalement, la réponse de votre question est déjà un sujet de recherche, voici un document de recherche qui pourraient vous guider:

Ce travail est le dernier travail de recherche que je connais dans ce domaine:

Extrait du document: Learning Sentiment-Specific Word Embedding for Twitter Sentiment Classification http://ir.hit.edu.cn/~dytang/paper/sswe/acl-slides.pdf

Code

lié au papier https://github.com/attardi/deepnl/wiki/Sentiment-Specific-Word-Embeddings

Espérons que cela aide!