Implémentation de la convolution vers l'arrière dans CNN pour les données multicanaux

J'ai essayé d'obtenir une meilleure compréhension du fonctionnement convolutionnel, car je suis en train de mettre en œuvre un réseau de neurones convolutionnels. Mais je suis coincé en essayant de calculer le recul ou la déconvolution.Implémentation de la convolution vers l'arrière dans CNN pour les données multicanaux

Disons que l'entrée est une image RGB en 3 dimensions avec la cote 3x7x7 Le filtre a la cote 3x3x3. Sur convolving avec la foulée réglée à 2 nous obtiendrons une sortie de dimension 3x3.

Maintenant, voici mon problème. J'ai lu que la déconvolution est la convolution de la sortie avec le noyau retourné. Mais en retournant le noyau, il sera toujours de dimension 3x3x3 et la sortie est de dimension 3x3 qui. L'entrée était de dimension 3x7x7. Alors, comment la déconvolution est-elle calculée?

Source

2017-10-13 Ayush Chaurasia

Parlez-vous de la convolution 2D ou 3D? Qu'entendez-vous par «forme de filtre 3x3x3»? – Maxim

@maxim Je parle de convolution 3D c'est pourquoi le filtre est 3D –

@Maxim Je crois qu'il veut dire image couleur 2D, le 3 est pour les 3 canaux –

Here est une belle visualisation comment la convolution et la déconvolution (convolution transposée). Les pièces blanches sont simplement des zéros.

Source

2017-10-13 07:03:04

L'article est génial mais je ne comprends toujours pas comment fonctionne la déconvolution pour la 3D données comme la résultante de la convolution est 2D mais le filtre lui-même est 3D. –

Une image couleur a trois canaux, rouge, vert et bleu. Ainsi, une image 7x7x3 signifie ses 3 cartes 7x7 distinctes qui enregistrent les intensités de chacune des couleurs RVB. –

Implémentation de la convolution vers l'arrière dans CNN pour les données multicanaux

Répondre

Questions connexes