Je cherche à regrouper par deux colonnes: user_id et date; cependant, si les dates sont assez proches, je veux pouvoir considérer les deux entrées faisant partie du même groupe et du même groupe en conséquence. La date est m-d-yGroupe Pandas Par plage de dates
user_id date val
1 1-1-17 1
2 1-1-17 1
3 1-1-17 1
1 1-1-17 1
1 1-2-17 1
2 1-2-17 1
2 1-10-17 1
3 2-1-17 1
Le groupe regrouperait par user_id et dates +/- 3 jours à l'autre. de sorte que le groupe en additionnant val ressemblerait à ceci:
user_id date sum(val)
1 1-2-17 3
2 1-2-17 2
2 1-10-17 1
3 1-1-17 1
3 2-1-17 1
Toute personne façon pouvait penser que cela pourrait être fait (un peu) facilement? Je sais qu'il y a des aspects problématiques de cela. par exemple, que faire si les dates s'enchaînent sans cesse à trois jours d'intervalle? mais les données exactes en utilisant seulement a 2 valeurs par personne.
Merci!
J'ai toujours peur de toucher tout moment question relative ... LOL BTW +1 – Wen
incroyable, le mérou jamais utilisé en quelque sorte – Vaishali
'Grouper' est 'TimeGrouper' – Wen