1

Typiquement classification de textes, y compris l'analyse de sentiment peut être effectuée dans l'une des 2 façons: 1. L'apprentissage supervisé s'il y a suffisamment de données de formation et 2. Une formation sans supervision lorsqu'il n'y a pas suffisamment de données de formation qui ne sont pas préalablement marquéComment l'apprentissage en profondeur non supervisé est-il utilisé dans l'analyse des sentiments?

I avoir seulement une collection de tweets qui ne contient que le texte (reviews) et il n'y a pas de polarité entre chaque twwet. Ma question est la suivante: y a-t-il une méthode pour analyser ces données à l'aide d'un apprentissage non supervisé?

Merci de me aider

+0

Vous vous intéressez particulièrement à l'apprentissage en profondeur non supervisé ou à tout apprentissage non supervisé? (Votre titre et votre tag mentionnent un apprentissage en profondeur, mais le corps de votre question ne l'est pas.) –

+0

Merci Darren pour votre réponse. Puisque j'ai des données sans cours, je suis à la recherche d'un apprentissage non supervisé. Une idée pour ça? Je vous remercie – Poisson

Répondre

1

(Basé sur votre commentaire, je me suis concentré sur la partie de votre question « sans supervision », et ignora l'apprentissage en profondeur.)

Si vous utilisez quelque chose comme vous SentiWordNet peut attribuer une note positive ou négative à chaque mot d'un tweet, puis (en tant qu'approche la plus simple) les additionner pour obtenir un seul indice de sentiment pour chaque tweet. À ce stade, peu importe que vous fassiez un apprentissage supervisé ou non, car vous obtiendrez un score pour chaque tweet, et vous pourrez diviser les tweets en, disons, positif, neutre et négatif sentiment. Ce que les données supervisées, la classe, permet d'obtenir une estimation d'erreur sur la façon dont il a bien fait de les classer.

Si vous souhaitez une estimation d'erreur lorsque vos données d'entraînement n'ont pas de cours, vous pouvez évaluer vous-même un certain pourcentage des tweets. Même en faisant seulement 30 d'entre eux commencera à vous donner une idée de l'endroit où votre algorithme de regroupement est sur l'échelle de aléatoire à parfait, et ne prendra pas longtemps.