2017-07-08 5 views
1

Dans les modèles h2o qui ont le paramètre "ignore_const_cols", comment "constant" est-il déterminé par rapport aux valeurs manquantes? Si une colonne n'a qu'une seule valeur non manquante et des valeurs manquantes, et que "ignore_const_cols" est sélectionné, aucune séparation ne se produira-t-elle sur cette colonne pour séparer les valeurs manquantes de la valeur constante?ignore_const_cols valeurs manquantes

Répondre

2

Il est assez facile de tester cette

Code R:

library(h2o) 
h2o.init() 
iris_data<-as.data.frame(iris) 
iris_data$Petal.Width<-1 
iris_data[iris_data$Species=='setosa','Petal.Width']<-NA 
iris_h2o<-as.h2o(iris_data) 
h2o.gbm(training_frame=iris_h2o,y='Species') 
iris_data$Petal.Width<-as.factor(iris_data$Petal.Width) 
iris_h2o<-as.h2o(iris_data) 
h2o.gbm(training_frame=iris_h2o,y='Species') 

Quelle que soit si la colonne constante avec des valeurs manquantes est numérique ou un facteur, est donné le même avertissement:

Warning message: 
In .h2o.startModelJob(algo, params, h2oRestApiVersion) : 
    Dropping constant columns: [Petal.Width]. 

Par conséquent, la réponse à votre question semble être que h2o ignore les valeurs manquantes pour déterminer si une colonne est constante