2017-09-05 2 views

Répondre

1

Vous pouvez utiliser la fonction get_dummies de pandas géants. Les variables fictives sont juste une autre façon de dire sur-hot-encoding.

import pandas as pd 
df = pd.DataFrame({'CODE': ['0001', '0001', '0001', '0002','0003'], 
        'TYPE': ['A', 'B', 'C', 'A', 'B']}) 
pd.get_dummies(df, columns=['TYPE']) 

Le toi let argument columns spécifier les colonnes à un hot-encode.

Cela donnera:

CODE TYPE_A TYPE_B TYPE_C 
0 0001  1  0  0 
1 0001  0  1  0 
2 0001  0  0  1 
3 0002  1  0  0 
4 0003  0  1  0 
+0

see mis à jour réponse, vous pouvez ajouter le argument 'columns' – tomp

+0

Great! Merci beaucoup – moufkir