2017-02-01 4 views
1

J'ai une compréhension de base des réseaux de neurones. Je comprends qu'il devrait y avoir une matrice y (résultat attendu) qui stocke 0 ou 1 correspondant à des étiquettes de catégories différentes. Par exemple, pour la reconnaissance de chiffres, si le nombre à identifier est 6 alors le vecteur y devrait être [0,0,0,0,0,1,0,0,0,0]. Cependant, quand je vois l'exemple MXNet in MXNet.jl repository on Github, je n'ai pu identifier aucun code qui prépare ce type de matrice de résultats. Je pense que la magie réside dans la méthode get_mnist_providers() qui retourne 2 fournisseurs:Comprendre l'exemple de MLP simple couche 3 en utilisant MXNet dans Julia

train_provider, eval_provider = get_mnist_providers(batch_size) 

Je ne sais pas ce que ces fournisseurs sont - train_provider, eval_provider. S'il vous plaît, aidez-moi à comprendre ces fournisseurs. J'essaie d'écrire un algorithme qui a différentes classifications, donc comprendre ce fournisseur est vital.

+1

L'exemple auquel je fais référence est présent ici - https://github.com/dmlc/MXNet.jl –

+0

N'oubliez pas d'accepter une réponse une fois que votre question a été répondue. Voir [Que dois-je faire lorsque quelqu'un répond à ma question?] (Https://stackoverflow.com/help/someone-answers). – charlesreid1

Répondre

2

Vous avez raison de fournir le vecteur y correspondant aux étiquettes. Dans MXNet, il y a le concept des itérateurs. Les itérateurs sont utilisés pour lier les données aux étiquettes. Ce que fait probablement votre méthode get_mnist_providers, c'est de fournir l'itérateur de données auquel l'étiquette correspondante est attachée.

Pour une compréhension plus détaillée sur la façon dont les données itérateurs entrent dans l'image entière de l'optimisation du modèle, vous pouvez essayer ce tutoriel (liens vers mxnet-notebooks référentiel GitHub): linear-regression.ipynb

(Vous aurez besoin d'ordinateur portable jupyter pour exécuter le tutoriel.pip juste installer jupyter et ensuite exécuter la commande 'jupyter notebook' dans le dossier où le fichier tutoriel existe)

+0

Merci d'expliquer. –

+0

La définition de la fonction réelle pour 'get_mnist_providers()' peut être trouvée dans le référentiel lié à l'OP, dmlc/MXNet.jl, dans le fichier [mnist-data.jl] (https://github.com/dmlc/MXNet .jl/blob/maître/exemples/mnist/mnist-data.jl # L1) – charlesreid1