Je suis à la recherche des fonctionnalités que je vais avoir pour mon modèle d'apprentissage automatique, avec les données que j'ai. Mes données contiennent beaucoup de textdata, alors je me demandais comment extraire des fonctionnalités de valeur. Parce que ma compréhension du sujet est limitée, je ne comprends pas pourquoi je ne peux pas analyser le texte, mais je ne comprends pas pourquoi je ne peux pas analyser le texte. d'abord pour obtenir des valeurs numériques. (par exemple: textBlob.sentiment = https://textblob.readthedocs.io/en/dev/, google Clouds Natural Language = https://cloud.google.com/natural-language/)Utiliser le sentiment de texte comme caractéristique dans le modèle d'apprentissage automatique?
Y a-t-il des problèmes avec ceci, ou est-ce que je pourrais utiliser ces valeurs comme caractéristiques pour mon modèle d'apprentissage automatique?
Merci d'avance pour toute l'aide!
Merci pour votre réponse! Cela a du sens, merci. Je fais un modèle prédisant le succès de box office de films basés sur userdata de youtube, twitter et facebook. Je dirais que le sentiment est une caractéristique précieuse. D'ailleurs, le regroupement de texte serait-il aussi applicable dans mon cas? – Lourens
Non, votre problème n'est pas le regroupement, mais la régression ou la classification de base de tâches sur la façon dont vous mesurez le succès. Je pense que l'analyse du sentiment résout votre problème. Parce que, si le commentaire de l'utilisateur est positif sur un film, le succès au box-office ou vice versa. –