J'ai une trame de données comme:Réinitialiser la base de somme cumulative sur l'état Pandas
customer spend hurdle
A 20 50
A 31 50
A 20 50
B 50 100
B 51 100
B 30 100
Je veux calculer colonne supplémentaire pour cumulative qui base de réinitialisation sur le même client lorsque la somme cumulée supérieure ou égale à l'obstacle comme suit:
customer spend hurdle Cumulative
A 20 50 20
A 31 50 51
A 20 50 20
B 50 100 50
B 51 100 101
B 30 100 30
je l'cumsum
et groupby
en pandas géants pour mais je ne sais pas comment réinitialiser la base de l'état.
Après sont le code que je suis actuellement en utilisant:
df1['cum_sum'] = df1.groupby(['customer'])['spend'].apply(lambda x: x.cumsum())
que je sais qu'il est juste une somme cumulative normale. J'apprécie beaucoup pour votre aide.
J'ai ajouté une version améliorée sur la vôtre. – Zero