2016-06-27 1 views
1

J'essaye d'entraîner un modèle de Lasagne Siamois par lots de 100. Les entrées sont X1 (100x3x100x100) et X2 (même taille) et Y (100x1) et ma dernière couche est une couche dense de une dimension de sortie car j'attends une valeur de 0 ou 1 comme valeur cible. Cependant, il lance une erreur pour une dimension inattendue. Voici les extraits de code:Forme de la valeur cible dans Lasagnes

input1 = lasagne.layers.InputLayer(shape=(None,3, 100, 100), input_var=None) 
conv1_a = lasagne.layers.Conv2DLayer(input1, 
           num_filters=24, 
           filter_size=(7, 7), 
           nonlinearity=lasagne.nonlinearities.rectify) 

pool1_a = lasagne.layers.MaxPool2DLayer(conv1_a, pool_size=(3, 3), stride=2) 

La couche 2 est la même que ci-dessus. couche de sortie:

dense_b = lasagne.layers.DenseLayer(dense_a, 
           num_units=128, 
           nonlinearity=lasagne.nonlinearities.rectify) 
dense_c = lasagne.layers.DenseLayer(dense_b, 
           num_units=1, 
           nonlinearity=lasagne.nonlinearities.softmax) 

net_output = lasagne.layers.get_output(dense_c) 
true_output = T.ivector('true_output') 

Le code de formation est ci-dessous:

loss_value = train(X1_train,X2_train,Y_train.astype(np.int32)) 
print loss_value 

ValueError: Input dimension mis-match. (input[0].shape[1] = 100, input[1].shape[1] = 1) Apply node that caused the error: Elemwise{Composite{((i0 * i1) + (i2 * log1p((-i3))))}}(InplaceDimShuffle{x,0}.0, LogSoftmax.0, Elemwise{sub,no_inplace}.0, SoftmaxWithBias.0) Toposort index: 113 Inputs types: [TensorType(int32, row), TensorType(float32, matrix), TensorType(float64, row), TensorType(float32, matrix)] Inputs shapes: [(1, 100), (100, 1), (1, 100), (100, 1)] Inputs strides: [(400, 4), (4, 4), (800, 8), (4, 4)] Inputs values: ['not shown', 'not shown', 'not shown', 'not shown'] Outputs clients: [[Sum{acc_dtype=float64}(Elemwise{Composite{((i0 * i1) + (i2 * log1p((-i3))))}}.0)]]

+0

pouvez-vous également ajouter la définition de 'dense_a'? –

Répondre

0

Essayez d'utiliser draw_net.py comme suit:

import draw_net 
dot = draw_net.get_pydot_graph(lasagne.layers.get_all_layers(your_last_layer), 
verbose = True) 

dot.write("test.pdf", format="pdf") 

pour vider le graphique Lasagne au format pdf (nécessite graphviz à installer)