2016-04-20 2 views
1

Comment est la polarité des mots dans une déclaration sont calculées comme ....Comment la polarité est-elle calculée pour une phrase ??? (Dans l'analyse des sentiments)

« je suis réussi à accomplir la tâche, mais en vain »

comment chaque mot est marqué? (comme - réussi - 0.7 accomplissant - 0.8 mais - -0.5 vain - - 0.8) comment est-il calculé? comment chaque mot reçoit-il une valeur ou un score ?? Quelle est la chose qui va derrière? Comme je fais l'analyse des sentiments, j'ai peu de choses à être clair, donc ce serait génial si quelqu'un aide.thanks à l'avance

Répondre

0

Si vous êtes prêt à utiliser Python et NLTK, puis vérifier Vader (http://www.nltk.org/howto/sentiment.html et passer à la section Vader)

+0

merci Tom Winch ... la chose que je veux savoir n'est pas exactement l'approche, mais comment la polarité est calculée ... comment est la notation faite pour chaque mot dans la phrase Exemple de votre lien fourni "Je ne dirai pas le film est stupéfiant et je ne dirais pas que le film est trop banal non plus. " composé: 0.4215, neg: 0.0, neu: 0.851, pos: 0.149, – pskumar

+0

Dans ce cas, je vous suggère de google autour de NLTK et le sentiment une analyse. –

0

Les scores des mots individuels peuvent provenir de listes de mots prédéfinies telles que ANEW, General Inquirer, SentiWordNet, LabMT ou mon AFINN. Soit les experts individuels ont marqué eux ou étudiants ou travailleurs Amazon Mechanical Turk. De toute évidence, ces scores ne sont pas la vérité ultime.

Les scores de mots peuvent également être calculés par apprentissage supervisé avec des textes annotés, ou les scores de mots peuvent être estimés à partir d'ontologies de mots ou de modèles de cooccurrence. En ce qui concerne l'agrégation de mots individuels, il existe différentes manières. Une façon serait de résumer tous les scores individuels (valences), un autre de prendre la valence max parmi les mots, un troisième de normaliser (diviser) par le nombre de mots ou par le nombre de mots notés (ie, obtenir un score moyen), - ou divisez la racine carrée de ce nombre. Les résultats peuvent différer un peu. J'ai fait une évaluation avec ma liste de mots AFINN: http://www2.imm.dtu.dk/pubdb/views/edoc_download.php/6028/pdf/imm6028.pdf

Une autre approche est avec des modèles récursifs comme les modèles de Richard Socher. Les valeurs sentimentales des mots individuels sont agrégées dans une structure arborescente et devraient trouver que la partie «mais en vain» de votre exemple devrait avoir le plus de poids.

+0

Merci Finn Arup Nielsen .. Donc, nous ne pouvons pas savoir comment les mots sont affectés valeurs et la polarité est calculée – pskumar

+0

La façon dont je l'ai fait était de marquer des mots entre -5 et 5 par ma connaissance préalable du danois et de l'anglais et en regardant comment ça a été utilisé, notamment sur Twitter. Vous trouverez généralement des détails dans les documents de recherche associés aux listes de mots qui expliquent l'attribution des valeurs. Il n'y a généralement pas de magie impliquée. –