J'ai un dataframe avec period_start_time toutes les 15 minutes et maintenant je dois agréger à 1 heure et calculer la somme et avg pour presque chaque colonne en dataframe (il a environ 20 colonnes) etAgréger à 15 minutes en fonction de l'heure et trouver la somme, avg et max pour plusieurs colonnes dans les pandas
PERIOD_START_TIME ID val1 val2
06.21.2017 22:15:00 12 3 0
06.21.2017 22:30:00 12 5 6
06.21.2017 22:45:00 12 0 3
06.21.2017 23:00:00 12 5 2
...
06.21.2017 22:15:00 15 9 2
06.21.2017 22:30:00 15 0 2
06.21.2017 22:45:00 15 1 5
06.21.2017 23:00:00 15 0 1
...
Desired output:
PERIOD_START_TIME ID val1(avg) val1(sum) val1(max) ...
06.21.2017 22:00:00 12 3.25 13 5
...
06.21.2017 23:00:00 15 2.25 10 9 ...
et pour les colonnes val2 aussi, et pour toutes les autres colonnes de dataframe. Je n'ai aucune idée de comment grouper par heure de début de période pour chaque heure, pas pour toute la journée, aucune idée de comment commencer.
KeyError: « PERIOD_START_TIME » c'est ce que je suis si je mets PERIOD_START_TIME comme un indice. – jovicbg
Je pense utiliser une version plus ancienne des pandas, donc besoin de 'df = df.reset_index(). Groupby (['PERIOD_START_TIME', 'ID']). Agg (['signifie', 'somme'])' – jezrael
J'utilise [ ceci] (http://pandas.pydata.org/pandas-docs/stable/whatsnew.html#groupby-enhancements) amélioration. – jezrael