2017-01-16 4 views
1

Lorsque j'effectue une recherche en utilisant la grille GridSearchCV et xgboostnombre de tours xgboost dans GridSearchCV

kfold = StratifiedKFold(n_splits=3, shuffle=False, random_state=random_state) 

model = xgb.XGBClassifier() 

grid_search = GridSearchCV(model, param_grid, scoring="roc_auc", 
     n_jobs=4, cv=kfold, verbose=1) 

quel est le nombre de tours utilisé en interne par GridSearchCV?

+0

Pouvez-vous clarifier ce que vous voulez dire par tours? Voulez-vous dire le nombre d'étapes de validation croisée qu'il prend à chaque exécution? Ou combien de permutations différentes essaie-t-elle? –

+0

@dataprincess rien de ce qui précède ... c'est un paramètre du classificateur ... il indique le nombre de tours pour booster – gabboshow

+0

@dataprincess Je voudrais savoir quel est le réglage de ce paramètre lorsque je cours GridSearchCV – gabboshow

Répondre

0

Il n'y a pas de bonne réponse à cette question, mais la meilleure stratégie consiste à utiliser nombre 500/1000 ou même grand avec paramètre early_stopping_rounds. Le CV continuera jusqu'à ce qu'il commence à sur-équiper le pli de test. C'est quand vous obtiendrez des paramètres assez bons (du point de vue du compromis biais-variance) que vous voulez du CV. En substance, bien que vous pourriez être en train de mettre en place trop de mesures de renforcement, mais peut-être stimuler ne se produira jamais pour autant de tours.

+0

ma question portait sur le nombre de tours utilisé en interne par GridSearchCV – gabboshow