J'ai une trame de données de pandas géants en python provenant d'un pd.concat avec une multiindice récurrente:remis à zéro un multiindice récurrent dans Pandas
customer_id
0 0 46841769
1 4683936
1 0 8880872
1 8880812
0 0 8880873
1 1000521
1 0 1135488
1 5388773
Non, je réinitialiser seulement le premier indice de la multiindice, de sorte que Je reçois un nombre récurrent sur l'index. Quelque chose comme ceci:
customer_id
0 0 46841769
1 4683936
1 0 8880872
1 8880812
2 0 8880873
1 1000521
3 0 1135488
1 5388773
En général, j'ai environ 5 millions d'enregistrements et pas la plus grande machine. Je suis donc à la recherche d'une solution efficace pour la mémoire.
ignore_index = La valeur True dans pd.concat ne fonctionne pas, car je perds alors le multi-index.
Un grand merci
Quel est votre code 'concat'? – jezrael