pipe = Pipeline([('reduce_dim', LinearDiscriminantAnalysis()),('classify', LogisticRegression())])
param_grid = [{'classify__penalty': ['l1', 'l2'],
'classify__C': [0.05,0.1, 0.3, 0.6, 0.8, 1.0]}]
gs = GridSearchCV(pipe, param_grid=param_grid, cv=5, scoring='roc_auc', n_jobs=3)
gs.fit(data, label)
J'ai une question pour l'utilisation de pipeline et gridsearchcv. maintenant je commence d'abord à utiliser lda pour réduire la dimension, je veux connaître le processus de gridsearchcv avec pipeline? split train/test-> lda-> ajustement & prédire ou lda-> split train/test-> ajustement & prédire?sklearn lda gridsearchcv avec pipeline
La première option est viable pour un scénario réel. Parce que dans la seconde, le LDA aura des fuites d'informations à partir des données de test. Quoi qu'il en soit, cette question est moins sur la programmation et plus sur la méthodologie et donc approprié pour [Cross-validated] (https://stats.stackexchange.com) –
Après le commentaire de @sera, je veux aussi être clair si vous voulez le dans lequel fonctionne gridSearchCV, ou voulez-vous savoir quel ordre est le plus adapté à la tâche. –