2016-05-04 4 views
0

Je recherche sur les paramètres dans le pipeline en utilisant GridSearchCV dans Scikit. J'ai fait fonctionner mon code, mais si je veux ajouter class_weights, je frappe un mur.Gridsearch dans le pipeline

from sklearn.pipeline import Pipeline 

RFC = RandomForestClassifier() 
PCA = PCA() 
pipe = Pipeline(steps=[('PCA', PCA), ('RFC', RFC)]) 

param_dict = {'RFC__n_estimators': [100,150], 
       'RFC__class_weights': [{0:1,1:2},{0:1,1:4}], 
       'PCA__n_components': [60,80]} 

from sklearn.grid_search import GridSearchCV    
estimator = GridSearchCV(pipe, param_dict, scoring='roc_auc') 
estimator.fit(X_train, y_train) 

Quelle est la bonne façon d'ajouter ce paramètre à GridSearch?

Répondre

2

simple - Vous avez le mal parameter name:

class_weight: dict, liste des dicts, « équilibrée », « balanced_subsample » ou None, en option

+0

Eh bien, cela est gênant. Je vous remercie. Je vais probablement supprimer la question, il ne mérite pas les mégabites pour le stocker. – HonzaB