2016-10-23 1 views
1

Je travaille sur un projet d'analyse de Sentiment qui utilise le lexique SentiwordNet3. Le problème est, je suis incapable de comprendre la structure du lexique. Une ligne de ce lexique est:Structure interne de SentiWordNet 3

un 00002730 0 0 acroscopiC# 1 face ou sur le côté vers le sommet

1.a =? But de a?

2.POS-ID=00002730. Quel est l'objectif de POS-ID?

3.SynsetTerms Gloss = acroscopic#1 facing or on the side toward the apex

  1. Qu'est-ce que acroscopic? Est-ce mot que nous voulons le score de? Qu'est-ce que #1? Objectif? Pourquoi la phrase après #1? facing or on the side toward the apex.

En ce qui concerne l'accès à des points est concerné, nous avons accédé comme

`list(SWN.senti_synsets(Tagged[i][0],'a')` 

a est Adjective alors v, r et n sont également dans le lexique.

Répondre

0

Le corpus a un en-tête contenant la définition des colonnes:

POS ID PosScore NegScore SynsetTerms Gloss

  1. POS 'a' est la partie du discours (adjectif)
  2. ID est le identifiant unique du lemme dans Wordnet
  3. PosScore => le score positif
  4. NegScore => le score négatif
  5. SynsetTerms => Wordnet noms synset (n ° 1 = le premier sens, # 2 = le second sens)
  6. phrase explicative
+0

Donc, si nous donnons 'la liste (SWN.senti_synsets (tagué [i] [0 ], 'a') 'quel sens sera le retour? Comment déterminer le sens? – Amar

+0

Eh bien, ça va retourner tous les sens. Il renverra une liste de synsets contenant une liste de lemmes. Voici un exemple: http://www.nltk.org/howto/sentiwordnet.html Voici comment se fait le mappage entre WN et SWN: https://github.com/bogdan-ivanov/wnext/blob/master/sentiwordnet. py – bogs

+0

Cette 'de nltk.corpus importer sentiwordnet comme swn heureux = swn.senti_synsets ('heureux', 'a') pour moi dans heureux: impression (i)' renvoie ' 'Quoi de neuf dans' glad.s.02' et pourquoi '02' ici? – Amar