J'essaye de mettre en application l'algorithme de Naive Bayes pour l'analyse de sentiment des titres de papier de nouvelles. J'utilise TextBlob à cette fin et je trouve qu'il est difficile de supprimer les mots d'arrêt comme « un », « le », « dans », etc. Voici l'extrait de mon code en python:Quel est le moyen efficace pour supprimer les mots d'arrêt dans textblob pour l'analyse du sentiment de texte?
from textblob.classifiers import NaiveBayesClassifier
from textblob import TextBlob
test = [
("11 bonded labourers saved from shoe firm", "pos"),
("Scientists greet Abdul Kalam after the successful launch of Agni on May 22, 1989","pos"),
("Heavy Winter Snow Storm Lashes Out In Northeast US", "neg"),
("Apparent Strike On Gaza Tunnels Kills 2 Palestinians", "neg")
]
with open('input.json', 'r') as fp:
cl = NaiveBayesClassifier(fp, format="json")
print(cl.classify("Oil ends year with biggest gain since 2009")) # "pos"
print(cl.classify("25 dead in Baghdad blasts")) # "neg"