Je travaille très dur pour comprendre comment classer les données en Python. Jusqu'à présent, je travaille sur la façon d'obtenir les bords à l'aide:Données Binning en Python
edges = pylab.hist(data, bins=10)[1]
Je ne sais pas si cela est la méthode la plus idéale, mais cela a fonctionné! Donne-moi une liste de 11 numéros nécessaires pour faire 10 bacs. Le problème est que je ne sais pas comment classer les données dans les bacs. J'ai essayé d'utiliser:
digitized = np.digitize(data, edges)
Mais que m'a donné une erreur, « ValueError: tableau zéro taille au minimum de fonctionnement de réduction qui n'a pas d'identité ». J'ai besoin de faire des bacs avant d'utiliser les pandas value_counts (j'ai déjà cette partie aussi).
Toute aide aurait été très appréciée!
double possible de [Python identifier dans quel intervalle les chiffres sont] (http://stackoverflow.com/questions/36479374/python-identify-in-which-interval- les-nombres-sont) La réponse à cette question vous montre comment faire cela. – ChrisP
J'ai déjà essayé ça, j'aurais dû inclure ça ici pour ne pas être abattu tout de suite. Pardon. – user3023715
Il serait utile d'inclure un exemple de jouet de données –