2017-06-27 5 views
0

J'ai chargé l'ensemble de données MNIST en utilisant la commande suivante:charge MNIST Dataset au format Sklearn-Friendly

from dataget import data 

dataset = data("mnist").get() 

Comment puis-je convertir au format Sklearn convivial, à savoir features_train, labels_train, features_test, labels_test?

J'ai essayé "np.loadtxt" mais a obtenu cette erreur:

ValueError: could not convert string to float: data 

J'ai aussi essayé les lignes de code suivantes:

df = next(dataset.training_set.random_batch_dataframe_generator(10)) 

df 

Et il a renvoyé cette erreur:

AttributeError: training_set 

S'il vous plaît, quelqu'un peut-il m'aider, j'ai été googling méthodes alternatives mais je reçois toujours des erreurs. Je vous remercie!

P.S. Voici une autre manière que j'ai utilisée pour obtenir l'ensemble de données MNIST:

dataset = fetch_mldata('MNIST original') 
+0

Bonjour. D'où téléchargez-vous les données? –

+0

Je l'ai utilisé cette ligne de code pour l'obtenir: dataset = données ("mnist") get() Je l'ai obtenu à partir de la base de données MNIST –

+0

Dans l'expression des données '(le "mnist").. get() ', vous n'avez pas montré comment vous avez défini ou importé le nom' data'. –

Répondre

0

@ E.Z. m'a aidé avec la réponse!

features, labels = dataset.data, dataset.target 

Je puis les diviser en formation et de test en utilisant les lignes de code suivantes:

msk = np.random.rand(len(features)) < 0.8 
mrk = np.random.rand(len(labels)) < 0.8 

features_train = features[msk] 
features_test = features[~msk] 
labels_train = labels[mrk] 
labels_test = labels[~mrk]