J'utilise GridSearchCV avec un pipeline comme suit:sklearn - Comment récupérer les composants PCA et la variance expliquée à l'intérieur d'un pipeline est passé à GridSearchCV
grid = GridSearchCV(
Pipeline([
('reduce_dim', PCA()),
('classify', RandomForestClassifier(n_jobs = -1))
]),
param_grid=[
{
'reduce_dim__n_components': range(0.7,0.9,0.1),
'classify__n_estimators': range(10,50,5),
'classify__max_features': ['auto', 0.2],
'classify__min_samples_leaf': [40,50,60],
'classify__criterion': ['gini', 'entropy']
}
],
cv=5, scoring='f1')
grid.fit(X,y)
Comment puis-je récupérer maintenant les détails PCA comme components
et explained_variance
de la grid.best_estimator_
modèle?
En outre, je veux également enregistrer le best_estimator_
dans un fichier en utilisant pickle et le charger plus tard. Comment puis-je récupérer les détails de la PCA à partir de cet estimateur chargé? Je pense que ce sera le même que ci-dessus.
Je ne comprends pas votre part de grille PCA: ' 'reduce_dim__n_components': gamme (0.7,0.9 , 0.1) 'quelles sont les valeurs de la gamme ici? – guy