2017-08-23 1 views
0

comment puis-je sous-ensemble une trame h2o en python. si x est une df & Origin est une variable alors en pandas géants, nous pouvons faire en général par subsettingsous-ensemble h2o cadre en python

x[x.Origin == 'AAF'] 

mais avec cadre h2o il donne l'erreur suivante: « H2OResponseError: Erreur serveur java.lang.IllegalArgumentException: Erreur: La recherche de nom de 'x.hex' a échoué "

Répondre

3

Il existe plusieurs façons de découper une ligne H2OFrame, en ligne. Les méthodes sont décrites dans la section H2O User Guide sur Slicing Rows.

Voici un exemple Python de jeux partiels d'un H2OFrame basé sur une colonne étant fixée à une valeur particulière en utilisant l'ensemble de données Iris:

import h2o 
h2o.init() 

# Load data 
path = "http://h2o-public-test-data.s3.amazonaws.com/smalldata/iris/iris_wheader.csv" 
df = h2o.import_file(path=path) 

# Subset data 
mask = df["class"] == "Iris-setosa" 
newdf = df[mask, :] 

# equivalent to both of these, which also work 
# newdf = df[df["class"] == "Iris-setosa", :] 
# newdf = df[df["class"] == "Iris-setosa"] 

La version newdf = df[df["class"] == "Iris-setosa"] est presque identique au format que vous avez ci-dessus, à l'exception H2OFrames ne supporte pas le référencement d'une colonne comme celle-ci: df.class; vous devez utiliser: df["class"].