Je souhaite rejoindre 2 dataframes. Gauche est un référentiel historique, droit est les données actuelles avec les mises à jour possibles de ce qui est répertorié dans l'historique.Pandas joindre des données avec la fonction de mise à jour
Je veux participer sur la base correspondant à 2 colonnes (Appelez-les requestor
et date
.)
Alors, je veux garder tous les éléments du référentiel et s'il y a une correspondance avec de nouvelles données basées sur les 2 colonnes Je veux mettre à jour le reste de cette ligne avec les nouvelles données. Fondamentalement, il s'agit d'une jointure externe qui clavette sur deux colonnes et écrase avec de nouvelles données s'il y a une correspondance.
Des idées sur la bonne approche pour le faire?
Edit:
history = pd.concat([history,new])
mostrecentupdate = history.groupby(['Requestor','RequestDate'])['LastUpdateDate'].transform(max)
history = history[history['LastUpdateDate'] == mostrecentupdate]
Merci pour votre perspicacité. Après quelques recherches, je crois avoir trouvé une solution qui fonctionnera. J'ai édité ma question. – pacificdune