Je dispose actuellement d'un processus de fenêtrage de séries temporelles, mais je me demande s'il existe une approche vectorisée en place pour des raisons de performances/ressources.Etiquettes de fenêtre PANDAS Time Series
J'ai deux listes qui ont les dates de début et de fin des fenêtres de 30 jours:
start_dts = [01.01.2014, ...] end_dts = [30.01.2014, ... ]
J'ai une base de données avec un champ appelé 'transaction_dt'. Ce que j'essaye d'accomplir est la méthode pour ajouter deux nouvelles colonnes («start_dt» et «end_dt») à chaque rangée quand le transaction_dt est entre une paire des valeurs de «start_dt» et de «end_dt». Idéalement, ceci serait vectorisé et en place si possible.
EDIT:
Comme l'a demandé voici quelques exemples de données de mon Format:
'customer_id','transaction_dt','product','price','units'
1,2004-01-02,thing1,25,47
1,2004-01-17,thing2,150,8
2,2004-01-29,thing2,150,25
Ajoutez vos données d'échantillon – Wen
@Wen J'ai ajouté des exemples de données dans mon format comme demandé. Merci! – Pylander
vérifier ma réponse – Wen