Dans cet exemple simplifié, j'entraîne une régression logistique avec GridSearchCV. Comme toujours, je veux que le modèle se généralise bien, donc je veux regarder de près les résultats du test . Je ne peux pas trouver un moyen facile de le faire en utilisant GridSearchCV.Scikit: Existe-t-il un moyen de récupérer tous les éléments non formés (l'ensemble de test) à partir du meilleur estimateur lors de l'utilisation de GridSearchCV?
lr_pipeline = Pipeline([('clf', LogisticRegression())])
lr_parameters = {'clf__fit_intercept':[True,False]}
lr_gs = GridSearchCV(lr_pipeline, lr_parameters)
lr_gs = lr_gs.fit(X,y)
lr_gs.best_estimator_.test_set # would like to be able to do something like this
Je veux analyser davantage les exemples que le modèle n'a pas formé sur (par exemple la vue. Leur matrice de confusion), mais depuis la validation croisée est passé de manière transparente, je ne peux pas choisir ces exemples. Je pourrais faire un nouveau train-test-split et me recycler, mais cela me semble inutile.