2017-03-21 2 views
2

J'utilise un algorithme d'apprentissage supervisé Random Forest classifier pour l'apprentissage des données.Erreur GridSearchCV "Trop d'indices dans le tableau"

clf = RandomForestClassifier(n_estimators=50, n_jobs=3, random_state=42) 

paramètre différent de la grille sont:

param_grid = { 
    'n_estimators': [200, 700], 
    'max_features': ['auto', 'sqrt', 'log2'], 
    'max_depth': [5,10], 
    'min_samples_split': [5,10] 
    } 

Classificateur "CLF" et grille paramètre "param_grid" sont transmis dans le procédé de GridSearhCV.

clf_rfc = GridSearchCV(estimator=clf, param_grid=param_grid) 

Lorsque je forme les caractéristiques avec des étiquettes en utilisant

clf_rfc.fit(X_train, y_train) 

je reçois l'erreur « Trop d'index dans le tableau ». La forme de X_train est (204,3) et de y_train est (204,1).

Essayé avec l'option clf_rfc.fit (X_train.values, y_train.values) mais n'a pas pu se débarrasser de l'erreur.

Toutes les suggestions seraient appréciées !!

+0

Veuillez publier la trace d'erreur de la pile complète. –

+0

Essayez également de remodeler votre 'y_train' en y_train.reshape (204) pour en faire une séquence à partir d'un tableau à 1 d –

Répondre

0

La forme de la trame de données 'y-train' est incorrecte. Essayez ceci:

clf_rfc.fit(X_train, y_train[0].values)

OU

clf_rfc.fit(X_train, y_train.values.ravel())

0

y_train devrait être un tableau 1 dimensions

J'ai essayé clf_rfc.fit(X_train, y_train.flatten()), et il n'a pas fonctionné!