fondamentalement j'ai le fichier texte comme entrée à tokenize.regexp de NLTK. comment fichier texte d'entrée au-dessous de code:comment prendre l'entrée en tant que fichier texte dans tokenize.regexp python de NLTK
'de RegexpTokenizer import nltk.tokenize
tokenizer = RegexpTokenizer (r' \ w + ')
brut = doc_a.lower() #instead de' doc_a «Je veux que mon fichier texte en entrée
jetons = tokenizer.tokenize (cru)`