Je me bats pour faire l'agrégation sur timedelta y compris le traçage. Les données brutes sont ici essentiellement les données ont une soumettre (datetime), résolu (datetime), pausetime (timedelta) et résolu de soumission de pause (ce qui est le temps réel pour résoudre)Agrégation de Pandas sur Timedelta et son comportement
test_df = pd.read_csv('test_df.csv')
#convert to date time stamps
test_df[['Submit','Resolved']] = test_df[['Submit','Resolved']].apply(pd.to_datetime)
#CONVERT PauseTime and Resolved-Submit-Pausetime to Timedelta
test_df['PauseTime']=pd.to_timedelta(test_df['PauseTime'])
test_df['Resolved-Submit-Pausetime'] = pd.to_timedelta(test_df['Resolved-Submit-Pausetime'])
Je suis en train de regrouper signifie pour chaque jour de « Résolu »
test_df.groupby([pd.Grouper(key='Resolved', freq='D')])['Resolved-Submit-Pausetime'].mean()
qui me donne une erreur - 'DataError: Aucun type numérique pour agréger
1) Comment puis-je agréger sur la moyenne.
2) également quelques conseils pour tracer la tendance du temps moyen pour résoudre (axe x aura toutes les dates et y axe agg moyen timedelta de « Résolu de soumission de pausetime »)
Je suis en mesure d'obtenir test_df.groupby ([pd.Grouper (key = 'Résolu', fréq = 'D ')]) [' Resolved-Submit-Pausetime ']. Describe() travail et la version de mes pandas est' 0.20.3 ' –