2017-10-21 78 views
0

je le code suivant:R-Cnn rapide et des problèmes avec spatialScale dans BrainScript

model (features, rois) = { 

     convOut = convLayers (features) 
     roiOut = ROIPooling (convOut, rois, (9:9),spatialScale=64.0/196.0) 
     z = fcLayers (roiOut) 


    }.z 

originale tirée de: cntk \ Exemples \ images \ Détection \ FastRCNN \ BrainScript

Qu'est-ce que spatialScale dans ROIPooling et comment puis-je le calculer?

Si vous l'avez trouvé dans la sortie de cntk.exe.

Validation -> z.convOut.z.rn3.rr = RectifiedLinear (z.convOut.z.rn3.rr_): [49 x 49 x 64 x *] -> [49 x 49 x 64 x *]

Validation -> = InputValue rois(): -> [4 x 1000 x *]

Validation -> z.roiOut = ROIPooling (z.convOut.z.rn3.rr, rois): [49 x 49 x 64 x *], [4 x 1000 x *] -> [9 x 9 x 64 x 1000 x *]

Répondre

1

l'échelle spatiale est le rapport de la résolution spatiale de l'entrée à la ROI et la résolution spatiale de l'image d'entrée sur le réseau. 1/16.0 est la valeur utilisée dans l'implémentation R-CNN rapide et rapide, cette valeur dépend du réseau.

À peu près, l'échelle spatiale est l'échelle de l'entrée de la ROI par rapport à l'image originale.

Merci,
Emad

+0

donc mon exemple j'ai en avoir un retour sur investissement de 64x64 et une image d'entrée de 196x196. Cela donnera un spatialScale = 64/196 = 0,32 –

+0

Quelle est la résolution d'entrée de votre noeud ROI, pas la taille de ROI. –

+0

Ok, si je vous comprends bien, vous demandez la résolution d'entrée au roiOut. J'ai ajouté ce que je pense être la résolution à la question. –