Les scores des mots individuels peuvent provenir de listes de mots prédéfinies telles que ANEW, General Inquirer, SentiWordNet, LabMT ou mon AFINN. Soit les experts individuels ont marqué eux ou étudiants ou travailleurs Amazon Mechanical Turk. De toute évidence, ces scores ne sont pas la vérité ultime.
Les scores de mots peuvent également être calculés par apprentissage supervisé avec des textes annotés, ou les scores de mots peuvent être estimés à partir d'ontologies de mots ou de modèles de cooccurrence. En ce qui concerne l'agrégation de mots individuels, il existe différentes manières. Une façon serait de résumer tous les scores individuels (valences), un autre de prendre la valence max parmi les mots, un troisième de normaliser (diviser) par le nombre de mots ou par le nombre de mots notés (ie, obtenir un score moyen), - ou divisez la racine carrée de ce nombre. Les résultats peuvent différer un peu. J'ai fait une évaluation avec ma liste de mots AFINN: http://www2.imm.dtu.dk/pubdb/views/edoc_download.php/6028/pdf/imm6028.pdf
Une autre approche est avec des modèles récursifs comme les modèles de Richard Socher. Les valeurs sentimentales des mots individuels sont agrégées dans une structure arborescente et devraient trouver que la partie «mais en vain» de votre exemple devrait avoir le plus de poids.
merci Tom Winch ... la chose que je veux savoir n'est pas exactement l'approche, mais comment la polarité est calculée ... comment est la notation faite pour chaque mot dans la phrase Exemple de votre lien fourni "Je ne dirai pas le film est stupéfiant et je ne dirais pas que le film est trop banal non plus. " composé: 0.4215, neg: 0.0, neu: 0.851, pos: 0.149, – pskumar
Dans ce cas, je vous suggère de google autour de NLTK et le sentiment une analyse. –