Je prévois faire une analyse de sentiment sur les avis des clients (une critique peut avoir plusieurs phrases) en utilisant word2vec. J'ai quelques questions à ce sujet:Analyse de sentiment en utilisant word2vec
- Dois-je former mon modèle word2vec (en gensim) en utilisant uniquement les données d'entraînement? Devrais-je considérer les données de test pour cela aussi?
- Comment devrais-je représenter la révision pour la classification? Cette représentation prendra-t-elle en considération l'ordre du mot car il est important de représenter une revue pour l'analyse de sentiment?