En GBM Modèle - J'ai près de 150 colonnes utilisées pour former et créer un modèle - J'ai un cas où, pour certains enregistrements, je ne recevrai pas toutes les colonnes. Dans ce cas, le modèle fonctionnera - je ne veux pas mettre les valeurs à 0 dans ce cas.Puis-je utiliser seulement quelques colonnes qui ont été utilisées pour créer un modèle GBM et encore Predict dans l'apprentissage supervisé?
1
A
Répondre
0
Le titre et la description de votre question parlent de 2 choses différentes et le titre n'est pas clair sur ce que vous demandez. Ma réponse suivante est basée sur votre question dans le champ de description:
Si vous utilisez H2O pour construire votre modèle GBM H2O remplace & valeurs numériques manquantes manquant à NA. S'il vous plaît consulter la documentation suivante concernant « la gestion des valeurs manquantes dans GBM » qui vous aidera à mieux comprendre votre cas:
Désolé ce fut une erreur de frappe. Je demandais Puis-je utiliser seulement certaines des colonnes de l'ensemble des colonnes que j'ai utilisées pour former des données à l'aide du modèle GBM - La raison en est que nous créons un modèle de ressemblance dans lequel certains des ensembles de données que nous avons n'ont pas toutes les colonnes utilisées pour créer le modèle. –
Oui, vous pouvez créer un nouveau cadre en sélectionnant uniquement des colonnes intéressantes (disons que vous sélectionnez les 10 principales fonctionnalités d'entrée) ou vous pouvez spécifier l'option option ignore_columns (en fonction de l'API que vous utilisez) – Michal