XGBRegressor.predict() renvoie l'erreur après pickle.load()

J'ai formé le modèle XGBRegressor en utilisant l'interface sklearn. Code pertinente est la suivante:XGBRegressor.predict() renvoie l'erreur après pickle.load()

def xgb_regressor_wrapper(X_train, y_train): 
    xgb_regressor = XGBRegressor(objective='reg:linear', n_estimators=1000, learning_rate=0.01, base_score=0.005) 
    xgb_regressor.fit(X=X_train, y=y_train) #, eval_set=[(X_test, y_test)], verbose=True) 
    return xgb_regressor 

def save_regressor(station, feature, regressor): 
    fname = generate_regressor_fname(station, feature) 
    pickle.dump(regressor, open(fname, "wb")) 

# regressor_list dict contains wrapper functions 
# I currently have XGBRegressor and CatBoostRegressor in the list. 
regressor_wrapper = regressor_list.get(name) 

# Create and fit XGBRegressor 
regressor = regressor_wrapper(X_train, y_train) 

# Save regressor 
save_regressor(station_id, feature, best_regressor)

Quelque temps plus tard, j'utilise le code suivant pour recharger le régresseur, et faire les prédictions:

def load_regressor(station, feature): 
    fname = generate_regressor_fname(station, feature) 
    return pickle.load(open(fname, "rb")) 

# Load the regressor 
regressor = load_regressor(station_id, feature) 

# Do the prediction 
y_predict = regressor.predict(X_test)

Je reçois l'erreur suivante:

File "regressor_stuff.py", line 169, in regressor_check_for_station_feature 
    y_predict = regressor.predict(X_test) 
    File "D:\Anaconda\envs\Deep\lib\site-packages\xgboost\sklearn.py", line 268, in predict 
    return self.booster().predict(test_dmatrix, 
TypeError: 'str' object is not callable

Après quelques déboguages, j'ai vu que self.booster stocke effectivement la chaîne 'gbtree'. Après l'entraînement regressor pour hundereds de fonctionnalités (qui a pris quelques jours d'ailleurs) ce n'était pas cool.

Une suggestion pour expliquer pourquoi cela aurait pu se produire?

Ma solution actuelle est de reconstruire le XGBBooster comme suit:

# Load the regressor 
if isinstance(regressor, XGBRegressor): 
    regressor = XGBRegressor() 
    r = pickle.load(open(fname, "rb")) 
    print r.get_xgb_params() 
    regressor._Booster = r._Booster 
    regressor.set_params(**r.get_xgb_params()) 

# Do the prediction 
y_predict = regressor.predict(X_test)

Merci

Kursat

Source

2017-07-31 Kursat I.

Je pense que vous pourriez avoir une incompatibilité de version xgboost dans vos environnements de formation et de notation. J'ai rencontré le même problème et j'ai trouvé que j'avais utilisé xgboost == 0.6 pour l'entraînement vs xgboost == 0.6a2 pour le scoring.

Source

2017-08-21 23:58:36 InfiniteExistence

Hi @InfiniteExistence, Bonne prise. J'ai deux environnements différents pour XGBoost. Je vais vérifier ce que je peux faire. Merci K. –

XGBRegressor.predict() renvoie l'erreur après pickle.load()

Répondre

Questions connexes