J'essaie de former un modèle LSTM pour la classification des sentiments sur de courts textes tels que des critiques de produits et des tweets. Je suis à la recherche d'un kit d'apprentissage qui qualifie positif/négatif/neutre, y a-t-il une chose (gratuite pour la recherche) qui soit vraiment basée sur des tags humains et non sur des démarrages ou des émoticônes? Je n'ai trouvé que de petits ensembles d'entraînement qui m'ont conduit à des résultats médiocres. Iv'e a essayé d'augmenter la taille de mon réseau et les couches empilées mais aucune amélioration.Quelle est la taille d'ensemble minimale requise pour la classification des sentiments sur les textes courts?
Quelle est la taille minimale pour un tel ensemble d'entraînement afin de commencer à obtenir des résultats raisonnables (F1> 0,8).