2016-04-28 2 views
-1

Je travaille très dur pour comprendre comment classer les données en Python. Jusqu'à présent, je travaille sur la façon d'obtenir les bords à l'aide:Données Binning en Python

edges = pylab.hist(data, bins=10)[1] 

Je ne sais pas si cela est la méthode la plus idéale, mais cela a fonctionné! Donne-moi une liste de 11 numéros nécessaires pour faire 10 bacs. Le problème est que je ne sais pas comment classer les données dans les bacs. J'ai essayé d'utiliser:

digitized = np.digitize(data, edges) 

Mais que m'a donné une erreur, « ValueError: tableau zéro taille au minimum de fonctionnement de réduction qui n'a pas d'identité ». J'ai besoin de faire des bacs avant d'utiliser les pandas value_counts (j'ai déjà cette partie aussi).

Toute aide aurait été très appréciée!

+1

double possible de [Python identifier dans quel intervalle les chiffres sont] (http://stackoverflow.com/questions/36479374/python-identify-in-which-interval- les-nombres-sont) La réponse à cette question vous montre comment faire cela. – ChrisP

+0

J'ai déjà essayé ça, j'aurais dû inclure ça ici pour ne pas être abattu tout de suite. Pardon. – user3023715

+1

Il serait utile d'inclure un exemple de jouet de données –

Répondre

1

La réponse est:

digitized = np.digitize(data, edges)