Dans les modèles h2o qui ont le paramètre "ignore_const_cols", comment "constant" est-il déterminé par rapport aux valeurs manquantes? Si une colonne n'a qu'une seule valeur non manquante et des valeurs manquantes, et que "ignore_const_cols" est sélectionné, aucune séparation ne se produira-t-elle sur cette colonne pour séparer les valeurs manquantes de la valeur constante?ignore_const_cols valeurs manquantes
1
A
Répondre
2
Il est assez facile de tester cette
Code R:
library(h2o)
h2o.init()
iris_data<-as.data.frame(iris)
iris_data$Petal.Width<-1
iris_data[iris_data$Species=='setosa','Petal.Width']<-NA
iris_h2o<-as.h2o(iris_data)
h2o.gbm(training_frame=iris_h2o,y='Species')
iris_data$Petal.Width<-as.factor(iris_data$Petal.Width)
iris_h2o<-as.h2o(iris_data)
h2o.gbm(training_frame=iris_h2o,y='Species')
Quelle que soit si la colonne constante avec des valeurs manquantes est numérique ou un facteur, est donné le même avertissement:
Warning message:
In .h2o.startModelJob(algo, params, h2oRestApiVersion) :
Dropping constant columns: [Petal.Width].
Par conséquent, la réponse à votre question semble être que h2o ignore les valeurs manquantes pour déterminer si une colonne est constante