Cela doit être évident, mais je n'ai pas trouvé de solution facile.Pandas dataframe to count matrice
J'ai pandas géants dataframe comme ceci:
actual | predicted
------ + ---------
Apple | Apple
Apple | Apple
Apple | Banana
Banana | Orange
Orange | Apple
Je veux ceci:
| Apple | Banana | Orange
------ + ------- + ------- + -------
Apple | 2 | 1 | 0
Banana | 0 | 0 | 1
Orange | 1 | 0 | 0
acceptés pour 'crosstab'. Désempiler la taille() me semble un peu un hack. –
Merci d'avoir accepté! La première solution est plus rapide, mais je suis d'accord c'est un peu hack. – jezrael
'Dans [142]:% timeit pd.crosstab (df.actual, df.predicted) 100 boucles, le meilleur de 3: 5,04 ms par boucle' et ' Dans [143]:% timeit df.groupby ([ 'réel', 'prédit']). size(). unstack (fill_value = 0) 1000 boucles, le meilleur de 3: 1,28 ms par boucle' – jezrael