J'ai une liste de mots, qui comprend plusieurs sujets. Les sujets ont été extraits automatiquement des phrases. Je voudrais garder seulement le nom des sujets. Comme vous pouvez voir certains des sujets ont adj que je veux le supprimer.Comment ne garder que les mots nominaux dans une liste de mots? python NLTK
wordlist=['country','all','middle','various drinks','few people','its reputation','German Embassy','many elections']
returnlist=[]
for word in wordlist:
x=wn.synsets(word)
for syn in x:
if syn.pos() == 'n':
returnlist.append(word)
break
print returnlist
les résultats ci-dessus est:
['country','it', 'middle']
Cependant, je veux obtenir le résultat devrait être ressembler à ce
wordlist=['country','it', 'middle','drinks','people','reputation','German Embassy','elections']
Comment faire?
vous voulez utiliser NLTK seulement –
pas vraiment. aussi longtemps que je peux obtenir le résultat de l'idée. toute méthode est acceptable – bob90937
'middel' non nom aussi bien que' it' (pronom) –