Merci d'avance pour toute aide.Formation mxnet ne progresse pas
J'ai quelques problèmes pour faire converger un modèle mxnet vers n'importe quoi: il semble bloqué près de ses poids initiaux.
Un exemple de travail (bien que j'ai eu beaucoup de mal à faire fonctionner beaucoup de ces modèles aujourd'hui). J'ai essayé l'approche ci-dessous avec une gamme d'époques (jusqu'à 100), et une gamme de taux d'apprentissage (0,001 à 10), et je ne peux rien obtenir de sensé.
import mxnet as mx
import numpy as np
inputs = np.expand_dims(np.random.uniform(size=10000), axis=1)
labels = np.sin(inputs)
data_iter = mx.io.NDArrayIter(data=inputs, label=labels, data_name='data', label_name='label', batch_size=50)
data = mx.sym.Variable('data')
label = mx.sym.Variable('label')
fc1 = mx.sym.FullyConnected(data=data, num_hidden=128)
ac1 = mx.sym.Activation(data=fc1, act_type='relu')
fc2 = mx.sym.FullyConnected(data=ac1, num_hidden=64)
ac2 = mx.sym.Activation(data=fc2, act_type='relu')
fc3 = mx.sym.FullyConnected(data=ac2, num_hidden=16)
ac3 = mx.sym.Activation(data=fc3, act_type='relu')
output = mx.sym.FullyConnected(data=ac3, num_hidden=1)
loss = mx.symbol.MakeLoss(mx.symbol.square(output - label), name="loss")
model = mx.module.Module(symbol=loss, data_names=('data',), label_names=('label',))
import logging
logging.getLogger().setLevel(logging.DEBUG)
model.fit(data_iter,
optimizer='sgd',
optimizer_params={'learning_rate':0.1},
eval_metric='mse',
num_epoch=5)
donne lieu à:
INFO:root:Epoch[0] Train-mse=0.221155
INFO:root:Epoch[0] Time cost=0.173
INFO:root:Epoch[1] Train-mse=0.225179
INFO:root:Epoch[1] Time cost=0.176
INFO:root:Epoch[2] Train-mse=0.225179
INFO:root:Epoch[2] Time cost=0.179
INFO:root:Epoch[3] Train-mse=0.225179
INFO:root:Epoch[3] Time cost=0.176
INFO:root:Epoch[4] Train-mse=0.225179
INFO:root:Epoch[4] Time cost=0.183
où il est clair que la formation n'est pas vraiment progresse.
Vous devriez essayer avec une activation tanh à la couche de sortie, de cette façon la plage du péché et de la sortie de votre réseau correspondent. –
Bon point. C'est un exemple rapide que j'ai rédigé pour SO, mais ma question est valable même pour un calque de sortie plus sensible :) J'utilise mal mxnet, mais je ne vois pas où! – Ats