Trancher pandas géants multiindice dataframe en utilisant la liste des valeurs de l'indice

J'ai un dataframe de multiindice qui ressemble àTrancher pandas géants multiindice dataframe en utilisant la liste des valeurs de l'indice

uid texte tid

abc x t1

DCB y t2

uid et tid sont les index. J'ai une liste de uid s, et je veux obtenir les rangées correspondant aux uids dans cette liste, mais en gardant les valeurs d'index de deuxième niveau (tid). Je veux le faire sans exécuter de boucle explicite. Est-ce possible?

Source

2017-09-30 Rakib

données:

L = ['abc', 'bcd'] 

print (df) 
     text 
uid tid  
abc x  t1 
abc1 x  t1 
bcd y  t2

1. slicers

idx = pd.IndexSlice 
df1 = df.loc[idx[L,:],:]

2. boolean indexing + masque avec get_level_values + isin:

df1 = df[df.index.get_level_values(0).isin(L)]

3. query, docs:

df1 = df.query('@L in uid')

print (df1) 
     text 
uid tid  
abc x  t1 
bcd y  t2

Source

2017-09-30 17:46:16 jezrael

grâce @jezrael. Avec l'approche un, j'obtiens 'MultiIndex Slicing nécessite que l'index soit entièrement tuple len (2), lexsort depth (0)' erreur. Mais 2 œuvres. Lequel est le plus efficace? J'ai un énorme cadre de données. – Rakib

le plus rapide est d'abord trier par 'df = df.sort_index()' et ensuite utiliser la première méthode. 'trier 'est expliqué [' In 97 '] (http://pandas.pydata.org/pandas-docs/stable/advanced.html#sorting-a-multiindex) – jezrael

Trancher pandas géants multiindice dataframe en utilisant la liste des valeurs de l'indice

Répondre

Questions connexes