Je voudrais faire une distribution de fréquence de mot, avec les mots sur l'axe des x et le compte de fréquence sur l'axe des ordonnées.Faire un histogramme de fréquence à partir de la liste avec des éléments de tuple
J'ai la liste suivante:
example_list = [('dhr', 17838), ('mw', 13675), ('wel', 5499), ('goed', 5080),
('contact', 4506), ('medicatie', 3797), ('uur', 3792),
('gaan', 3473), ('kwam', 3463), ('kamer', 3447),
('mee', 3278), ('gesprek', 2978)]
J'ai essayé d'abord le convertir en une trame de données de pandas géants puis utilisez la pd.hist()
comme dans l'exemple ci-dessous, mais je ne peux pas comprendre et réfléchir est en fait simple mais il me manque probablement quelque chose.
import numpy as np
import matplotlib.pyplot as plt
word = []
frequency = []
for i in range(len(example_list)):
word.append(example_list[i][0])
frequency.append(example_list[i][1])
plt.bar(word, frequency, color='r')
plt.show()
merci pour le commentaire, c'était ce que je cherchais, aussi le zip est très utile fonction :) – jjn
s'il vous plaît définir ce que libs vous utilisez lorsque vous appelez « plt » et « np ». – biogeek
@biogeek Ceux-ci ont déjà été définis dans la question, donc je pense qu'il était un peu difficile de baisser la réponse pour cela. Mais pour rendre la réponse plus autonome, je les ai également inclus dans le code. Merci pour le commentaire. :) – MSeifert