Comment puis-je modifier PerceptronTagger
dans le module nltk
(ou peut-être ajouter des fonctionnalités temporaires) pour qu'il reconnaisse 'et/ou' comme balise 'CC'?python: modifier PerceptronTagger dans nltk pour reconnaître 'et/ou'
0
A
Répondre
0
Si c'est la seule chose que vous voulez changer, la solution la plus simple est juste post-traitement du texte marqué:
for sentence in tagged_sentences:
for n, (word,tag) in enumerate(sentence):
if word == 'and/or':
sentence[n] = (word, "CC")
Mais si votre question est la première étape pour « améliorer » le tagueur du NLTK , vous devriez prendre la vision à long terme et réfléchir à la façon dont vous pourriez construire ou installer un meilleur tagueur. Jetez un oeil sur les nombreux liens inclus dans this answer.