Le NLTK ne vient pas avec des ressources pré-construits pour le français. Je recommande d'utiliser le Stanford tagger, qui est livré avec un modèle français formé. This code montre comment vous pouvez configurer le nltk pour l'utiliser avec le tagueur français POS de Stanford. Notez que le code est obsolète (et pour Python 2), mais vous pouvez l'utiliser comme point de départ.
Alternativement, le NLTK rend très facile la formation de votre propre étiqueteur POS sur un corpus étiqueté, et l'enregistre pour une utilisation ultérieure. Si vous avez accès à un corpus français (suffisamment grand), vous pouvez suivre les instructions au the nltk book et utiliser simplement votre corpus à la place du corpus Brown. Il est peu probable que vous égaliez la performance du tagueur de Stanford (sauf si vous pouvez former un tagger pour votre domaine spécifique), mais vous n'aurez rien à installer.
Par ailleurs, la boucle ne fait rien. Si 'phrase' est une chaîne, appelez simplement' nltk.word_tokenize (phrase) 'et passez le résultat à' nltk.pos_tag() '. – alexis
https://stackoverflow.com/questions/27513185/simplifying-the-french-pos-tag-set-with-nltk –