J'ai 2 trames de données non indexées, avec la même structure de données exactes (mêmes colonnes), pour des raisons de simplicité, voici un exemple:pandas géants: différence de données (delta) entre 2 trames de données
DF1
0 1 2 3 4
JoeK Joe Kavanagh 120 [email protected]
BarryD Barry Dempsy 11 [email protected]
OrlaF Orla Farrel 236 [email protected]
SethB Seth Black 563 [email protected]
KateW Kate White 254 [email protected]
et le second:
DF2
0 1 2 3 4
JoeK Joe Kavanagh 110 [email protected]
BarryD Barry Dempsy 11 [email protected]
JimmyS Jimmy Smith 250 [email protected]
SethB Seth Blake 563 [email protected]
Je voudrais avoir un résu lting dataframes représentant les lignes de DF1 qui ne sont pas en DF2:
0 1 2 3 4
JoeK Joe Kavanagh 120 [email protected]
OrlaF Orla Farrel 236 [email protected]
SethB Seth Black 563 [email protected]
KateW Kate White 254 [email protected]
Notez que la première rangée (Joek et SethB) existent dans les deux dataframes, mais la valeur de la colonne 3 pour JoeK et la valeur de la colonne 2 pour SethB ont changé, c'est pourquoi ils sont dans le résultat final.
Toute aide est très appréciée.
Votre résultat ne devrait-il pas être juste 'df1' parce que les emails ne correspondent pas pour la deuxième rangée? Ou est-ce que votre restriction correspond juste aux cols 0-3? – EdChum
Bien repéré, c'était une faute de frappe. Je l'ai corrigé maintenant. –