Je gère un sous-ensemble d'un grand ensemble de données.Créer des variables d'une colonne pour un sous-ensemble de données, qui ne contient pas toutes les valeurs de catégorie dans cette colonne
Il existe une colonne nommée "type" dans la structure de données. Le "type" devrait avoir des valeurs comme [1,2,3,4].
Dans un sous-ensemble, je trouve le « type » colonne ne contient que certaines valeurs comme [1,4], comme
In [1]: df
Out[2]:
type
0 1
1 4
Lorsque je crée des mannequins de la colonne « type » sur ce sous-ensemble, il se comme ceci:
In [3]:import pandas as pd
In [4]:pd.get_dummies(df["type"], prefix = "type")
Out[5]: type_1 type_4
0 1 0
1 0 1
Il does't ont les colonnes nommées "type_2", "type_3" .Quel que je veux est comme:
Out[6]: type_1 type_2 type_3 type_4
0 1 0 0 0
1 0 0 0 1
Y a-t-il une solution pour cela?
Glad peut vous aider. Belle journée! – jezrael