Est-il possible de voir comment les caractéristiques qualitatives sont codées lorsque nous permettons à h2o de créer automatiquement des données catégoriques en lançant une colonne type enum
?caractéristiques qualitatives encodée dans h2o en python
Je suis en train d'implémenter l'empilage de holdout où mes données d'entraînement sous-jacentes diffèrent pour chaque modèle. J'ai une caractéristique commune que je veux m'assurer que le codage est identique de la même manière à travers les deux ensembles. La fonctionnalité contient des noms (str). Il est garanti que tous les noms apparaissant dans un ensemble de données apparaîtront dans l'autre.