Le problème que je rencontre est que dans mon code, je ne suis pas en mesure d'obtenir des mots/jetons individuels pour correspondre avec les mots d'arrêt à supprimer du texte original. Au lieu de cela, je reçois une phrase entière et je ne suis donc pas capable de faire correspondre les mots d'arrêt. S'il vous plaît montrez-moi un moyen par lequel je peux obtenir des jetons individuels et ensuite correspondre à ceux avec des mots d'arrêt et les supprimer. Aidez-moi, s'il vous plaît.Comment lire les jetons d'un fichier un par un en Python?
from nltk.corpus import stopwords
import string, os
def remove_stopwords(ifile):
processed_word_list = []
stopword = stopwords.words("urdu")
text = open(ifile, 'r').readlines()
for word in text:
print(word)
if word not in stopword:
processed_word_list.append('*')
print(processed_word_list)
return processed_word_list
if __name__ == "__main__":
print ("Input file path: ")
ifile = input()
remove_stopwords(ifile)
La raison pour laquelle vous n'êtes pas obtenir les mots dans le texte est parce que vous utilisez les 'readlines (') fonction. Cela vous donne un itérable des lignes/phrases dans le fichier, puis quand vous dites «pour le mot dans le texte:» vous obtenez les lignes une par une. –