2017-07-31 2 views
2

J'ai formé le modèle XGBRegressor en utilisant l'interface sklearn. Code pertinente est la suivante:XGBRegressor.predict() renvoie l'erreur après pickle.load()

def xgb_regressor_wrapper(X_train, y_train): 
    xgb_regressor = XGBRegressor(objective='reg:linear', n_estimators=1000, learning_rate=0.01, base_score=0.005) 
    xgb_regressor.fit(X=X_train, y=y_train) #, eval_set=[(X_test, y_test)], verbose=True) 
    return xgb_regressor 

def save_regressor(station, feature, regressor): 
    fname = generate_regressor_fname(station, feature) 
    pickle.dump(regressor, open(fname, "wb")) 

# regressor_list dict contains wrapper functions 
# I currently have XGBRegressor and CatBoostRegressor in the list. 
regressor_wrapper = regressor_list.get(name) 

# Create and fit XGBRegressor 
regressor = regressor_wrapper(X_train, y_train) 

# Save regressor 
save_regressor(station_id, feature, best_regressor) 

Quelque temps plus tard, j'utilise le code suivant pour recharger le régresseur, et faire les prédictions:

def load_regressor(station, feature): 
    fname = generate_regressor_fname(station, feature) 
    return pickle.load(open(fname, "rb")) 

# Load the regressor 
regressor = load_regressor(station_id, feature) 

# Do the prediction 
y_predict = regressor.predict(X_test) 

Je reçois l'erreur suivante:

File "regressor_stuff.py", line 169, in regressor_check_for_station_feature 
    y_predict = regressor.predict(X_test) 
    File "D:\Anaconda\envs\Deep\lib\site-packages\xgboost\sklearn.py", line 268, in predict 
    return self.booster().predict(test_dmatrix, 
TypeError: 'str' object is not callable 

Après quelques déboguages, j'ai vu que self.booster stocke effectivement la chaîne 'gbtree'. Après l'entraînement regressor pour hundereds de fonctionnalités (qui a pris quelques jours d'ailleurs) ce n'était pas cool.

Une suggestion pour expliquer pourquoi cela aurait pu se produire?

Ma solution actuelle est de reconstruire le XGBBooster comme suit:

# Load the regressor 
if isinstance(regressor, XGBRegressor): 
    regressor = XGBRegressor() 
    r = pickle.load(open(fname, "rb")) 
    print r.get_xgb_params() 
    regressor._Booster = r._Booster 
    regressor.set_params(**r.get_xgb_params()) 

# Do the prediction 
y_predict = regressor.predict(X_test) 

Merci

Kursat

Répondre

1

Je pense que vous pourriez avoir une incompatibilité de version xgboost dans vos environnements de formation et de notation. J'ai rencontré le même problème et j'ai trouvé que j'avais utilisé xgboost == 0.6 pour l'entraînement vs xgboost == 0.6a2 pour le scoring.

+0

Hi @InfiniteExistence, Bonne prise. J'ai deux environnements différents pour XGBoost. Je vais vérifier ce que je peux faire. Merci K. –