2011-03-31 7 views
0
pos_tag(word_tokenize("John's big idea isn't all that bad.")) 
[('John', 'NNP'), ("'s", 'POS'), ('big', 'JJ'), ('idea', 'NN'), ('is', 
'VBZ'), ("n't", 'RB'), ('all', 'DT'), ('that', 'DT'), ('bad', 'JJ'), 
('.', '.')] 

Ne reconnaissez pas la syntaxe du tout. Comment pourrais-je itérer sur cette vérification pour JJ en 2ème valeur dans les paires.Quel type de données est la sortie?

Répondre

6

Il ressemble à une liste de paires (tuple de taille 2).

itère dessus est simple:

for text, type in pos_tag(word_tokenize("John's big idea isn't all that bad.")): 
    if type == 'JJ': 
     print 'text:', text 
     print 'type:', type 
1

Ressemble à une liste de 2-tuples pour moi.

[x for x in L if x[1] == 'JJ'] 
1
list_values = [ 
    ('John', 'NNP'), 
    ("'s", 'POS'), 
    ('big', 'JJ'), 
    ('idea', 'NN'), 
    ('is', 'VBZ'), 
    ("n't", 'RB'), 
    ('all', 'DT'), 
    ('that', 'DT'), 
    ('bad', 'JJ'), 
    ('.', '.') 
] 
for (a, b) in list_values: 
    if b == 'JJ': 
     DoSomething(a,b) 
Questions connexes