2017-08-23 1 views
0

J'utilise le h2oflow ui pour créer un fichier .csv sur lequel je peux former un modèle. Lorsque je télécharge le fichier et modifier les types de colonnes avant l'analyse, ce que je suis en train une colonne de date:h2o.ai - L'interface utilisateur de flux ne détecte pas la mise en forme de la date pour la convertir en temps

enter image description here

Après l'analyse, le résumé des données montre que toutes les valeurs de colonne de date sont « portés disparus 'et l'affichage des données avec le bouton view data indique qu'il s'agit bien d'espaces vides (.).

Vous cherchez here pour les formats de date acceptables, il est dit que:

« Le premier format est pour les dates au format aaaa-mm-jj Année est un numéro à quatre chiffres, le mois est un deux. nombre de chiffres compris entre 1 et 12, et le jour est une valeur à deux chiffres allant de 1 à 31. Ce format peut également être suivi d'un espace, puis d'un temps (spécifié ci-dessous). "

J'ai essayé ce format avec et sans (voir image ci-dessus) des zéros en tête pour les nombres à un seul chiffre et ont toujours le même résultat que h2o analyse les champs de date et blanc, comme celui-ci:

enter image description here

Que se passe-t-il ici et comment puis-je le réparer. Merci :)

+0

importez-vous le fichier d'Excel? Si vous essayez de changer le type de colonne dans Excel à partir de l'heure à la chaîne. Si vous définissez cette colonne sur un type de chaîne, H2O devrait interpréter correctement le '06/07/2015'. Le problème est probablement que vous convertissez une colonne de type enum en une colonne de type heure. – Lauren

+0

@Lauren J'importe le fichier à partir d'un fichier .csv, mais j'ai créé le fichier .csv à partir d'Excel, que j'ai utilisé pour formater les dates pour les obtenir au format aaaa/mm/jj. – lampShadesDrifter

+0

ok une solution de contournement serait de garder le même look mais changer le type en texte. J'ai entre-temps déposé un bug pour voir pourquoi H2O interprète la 'date' d'Excel comme une énumération https://0xdata.atlassian.net/browse/PUBDEV-4844 – Lauren

Répondre

0

a trouvé le problème. Dans les documents mentionnés dans le message original, il est précisé que les dates doivent être yyyy-mm-dd. J'entrais les données de date dans h2o dans le format yyyy/mm/dd. La modification des informations de date au format yyyy-mm-dd semble avoir corrigé le problème (en vérifiant que les deux premières dates correspondent correctement aux deux premières sorties époque horodatage).

+1

h2o devrait être capable de lire yyyy/mm/jj ce format mais heureux de vous voir trouvé un travail autour. – Lauren