J'essaie de créer une nouvelle colonne qui a le tag pos de la colonne clean_word
dans un bloc de données. Cette colonne contient des mots simples comme vous pouvez le voir dans l'image ci-dessous. Donc pas de tokenisation et ainsi de suite.POS tags de lignes de jeu de données avec NLTK
Ci-dessous est mon code.
import nltk
datahitword['pos_tag'] = nltk.pos_tag(datahitword['clean_word'])
datahitword.head()
Je reçois l'erreur ci-dessous, même après avoir la colonne dans une liste et une série pour le traiter isolé puis ajouter à la trame de données.
Y at-il quelque chose qui me manque ici?
Essayez cette 'datahitword [ 'clean_word'] = datahitword [ 'clean_word']. Astype (str)' before'pos_tag' – alvas
@alvas, parfait! Merci beaucoup! –