Actuellement, je suis en train de lire du texte à partir d'un fichier Excel et d'y appliquer bigram. finalList a liste utilisée ci-dessous exemple de code a la liste de mots d'entrée lire à partir du
import re
import nltk
import pandas as pd
from nltk.chunk import RegexpParser
from textblob import TextBlob
data = open('data.txt', 'r')
data = data.read()
# region Fetch Account Type
chunkDa
Mon code devrait sortir les 10 premiers mots avec la plus haute fréquence dans le corpus. Cependant, il donne la sortie de 10 mots aléatoires. from nltk.corpus import brown
import operator
brown_ta