2017-10-08 3 views
1

J'essaie de créer une nouvelle colonne qui a le tag pos de la colonne clean_word dans un bloc de données. Cette colonne contient des mots simples comme vous pouvez le voir dans l'image ci-dessous. Donc pas de tokenisation et ainsi de suite.POS tags de lignes de jeu de données avec NLTK

enter image description here

Ci-dessous est mon code.

import nltk 

datahitword['pos_tag'] = nltk.pos_tag(datahitword['clean_word']) 
datahitword.head() 

Je reçois l'erreur ci-dessous, même après avoir la colonne dans une liste et une série pour le traiter isolé puis ajouter à la trame de données.

Y at-il quelque chose qui me manque ici?

+0

Essayez cette 'datahitword [ 'clean_word'] = datahitword [ 'clean_word']. Astype (str)' before'pos_tag' – alvas

+0

@alvas, parfait! Merci beaucoup! –

Répondre

1

Comme recommandé par @alvas. Juste nécessaire pour convertir les mots en chaînes

datahitword['clean_word'] = datahitword['clean_word'].astype(str)