2016-06-03 3 views

Répondre

0

Si c'est la seule chose que vous voulez changer, la solution la plus simple est juste post-traitement du texte marqué:

for sentence in tagged_sentences: 
    for n, (word,tag) in enumerate(sentence): 
     if word == 'and/or': 
      sentence[n] = (word, "CC") 

Mais si votre question est la première étape pour « améliorer » le tagueur du NLTK , vous devriez prendre la vision à long terme et réfléchir à la façon dont vous pourriez construire ou installer un meilleur tagueur. Jetez un oeil sur les nombreux liens inclus dans this answer.