2017-07-26 3 views
2

J'essaie d'utiliser XGBoost pour améliorer la précision de mon modèle. Bien que je sois nouveau à xgboost, j'ai essayé de comprendre cet algorithme à travers diverses sources. J'ai mis la liste param avec le code suivant:Erreur lors de l'utilisation de xgb.cv

param = list("objective"="binary:logistic", "eval_metric"="logloss", "eta"=1, "max.depth"=2) 

puis utilisé:

xg.cv = xgb.cv(params=param, data=as.matrix(train), label=train$StatusDesc, 
       nthread=2, nrounds=2, nfold=5) 

Quand je cours, j'obtiens l'erreur ci-dessous:

Error in xgb.DMatrix(data, label = label, missing = missing) : 
    [19:55:03] amalgamation/../dmlc-core/src/io/local_filesys.cc:66: 
    LocalFileSystem.GetPathInfo 20160906 Error:No such file or directory. 

peut-elle aider quelqu'un moi avec cette erreur?

+0

Juste un FYI, vous n'avez pas besoin de citer les noms de votre liste lorsque vous définissez, 'la liste (objectif = « binaire: logistique », eval_metric = « logloss », ...)' oeuvres très bien et est plus facile à taper. – Gregor

+0

Est-il nécessaire que lors de l'utilisation de Xgboost, toutes les variables catégorielles soient codées à 0 et à 1? – Chandra

+0

Oui. Vos données d'entraînement sont une «matrice» et toutes les données d'une matrice doivent être de la même classe. Vous ne pouvez pas avoir de colonnes de facteur. Vous devriez probablement commencer par 'xgboost()' et ensuite, quand vous avez quelque chose qui fonctionne, passez au 'xgb.cv()' un peu plus compliqué. – Gregor

Répondre

0

Essayez-le. Cela a résolu certains de mes problèmes.

install.packages("drat", repos="https://cran.rstudio.com") 
drat:::addRepo("dmlc") 
install.packages("xgboost", repos="http://dmlc.ml/drat/",type="source")