Je tente de créer une colonne qui prend la moyenne des valeurs d'une autre colonne en fonction d'une valeur dans une autre colonne.Création d'une colonne dans une base de données conditionnelle à d'autres colonnes
pd.DataFrame({"A":[1, 2, 1, 2],
"B":[4, 6, 8, 12]
Je veux créer une nouvelle colonne « C » qui serait
pd.DataFrame({"A":[1, 2, 1, 2, 3],
"B":[4, 6, 8, 12, 4],
"C":[6,9,6,9,4]}
Si on ne sait pas, je veux sortir la moyenne des valeurs dans la colonne B lorsque les valeurs de la colonne A sont les mêmes. Donc, C = (4 + 6 + ...)/n où A == 1 et C = (6 + 8 + ...)/n où A == 2, etc ...
Je suis avoir du mal à trouver le pseudo code pour ça aussi. Toute explication logique en plus d'une solution de code serait appréciée.
Qu'est-ce que n? – kbball