J'ai formé le modèle XGBRegressor en utilisant l'interface sklearn. Code pertinente est la suivante:XGBRegressor.predict() renvoie l'erreur après pickle.load()
def xgb_regressor_wrapper(X_train, y_train):
xgb_regressor = XGBRegressor(objective='reg:linear', n_estimators=1000, learning_rate=0.01, base_score=0.005)
xgb_regressor.fit(X=X_train, y=y_train) #, eval_set=[(X_test, y_test)], verbose=True)
return xgb_regressor
def save_regressor(station, feature, regressor):
fname = generate_regressor_fname(station, feature)
pickle.dump(regressor, open(fname, "wb"))
# regressor_list dict contains wrapper functions
# I currently have XGBRegressor and CatBoostRegressor in the list.
regressor_wrapper = regressor_list.get(name)
# Create and fit XGBRegressor
regressor = regressor_wrapper(X_train, y_train)
# Save regressor
save_regressor(station_id, feature, best_regressor)
Quelque temps plus tard, j'utilise le code suivant pour recharger le régresseur, et faire les prédictions:
def load_regressor(station, feature):
fname = generate_regressor_fname(station, feature)
return pickle.load(open(fname, "rb"))
# Load the regressor
regressor = load_regressor(station_id, feature)
# Do the prediction
y_predict = regressor.predict(X_test)
Je reçois l'erreur suivante:
File "regressor_stuff.py", line 169, in regressor_check_for_station_feature
y_predict = regressor.predict(X_test)
File "D:\Anaconda\envs\Deep\lib\site-packages\xgboost\sklearn.py", line 268, in predict
return self.booster().predict(test_dmatrix,
TypeError: 'str' object is not callable
Après quelques déboguages, j'ai vu que self.booster
stocke effectivement la chaîne 'gbtree'. Après l'entraînement regressor pour hundereds de fonctionnalités (qui a pris quelques jours d'ailleurs) ce n'était pas cool.
Une suggestion pour expliquer pourquoi cela aurait pu se produire?
Ma solution actuelle est de reconstruire le XGBBooster comme suit:
# Load the regressor
if isinstance(regressor, XGBRegressor):
regressor = XGBRegressor()
r = pickle.load(open(fname, "rb"))
print r.get_xgb_params()
regressor._Booster = r._Booster
regressor.set_params(**r.get_xgb_params())
# Do the prediction
y_predict = regressor.predict(X_test)
Merci
Kursat
Hi @InfiniteExistence, Bonne prise. J'ai deux environnements différents pour XGBoost. Je vais vérifier ce que je peux faire. Merci K. –