2016-09-18 2 views
0

J'ai déjà utilisé X = X.fillna(X.mean()) pour remplir les champs NaN. Mais je reçois toujours une erreurPython/Pandas: Comment remplir les espaces vides dans mon dataframe?

"ValueError: Found arrays with inconsistent numbers of samples: [ 7 210]"

lorsque j'essaie mon train_test_split.

J'ai regardé mon X df et il semble qu'il y ait encore des valeurs manquantes (espaces).

Comment remplir ces espaces blancs avec la moyenne de cette colonne par exemple?

Répondre

0

Vous pouvez essayer quelque chose comme cet exemple:

df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [6,7,8,np.nan,10]}) 
    A  B 
0 1 6.0 
1 2 7.0 
2 3 8.0 
3 4 NaN 
4 5 10.0 

print(df.B.fillna(df['B'].mean())) 
0  6.00 
1  7.00 
2  8.00 
3  7.75 
4 10.00 
Name: B, dtype: float64