Je lisais un papier here. Les auteurs de l'article ont proposé un réseau de générateurs symétriques qui contient une pile de couches de convolution suivie d'un empilement de couches de convolution (convolution transposée). Il est également mentionné qu'une foulée de 1 avec un rembourrage approprié est utilisée pour s'assurer que la taille de la carte de caractéristiques est la même que la taille de l'image d'entrée. Ma question est de savoir s'il n'y a pas de sous-échantillonnage, alors pourquoi les couches de convergence transposées sont-elles utilisées? Le générateur ne peut-il pas être construit uniquement avec des couches de convolution? Ai-je manqué quelque chose à propos des couches de convolution transposées ici (est-ce qu'elle est utilisée à d'autres fins)? S'il vous plaît aider.nécessité de convolution transposée lorsque les cartes de caractéristiques ne sont pas sous-échantillonnées
Mise à jour: Je suis en train de rouvrir cette question, je suis tombé sur du papier this qui stipule dans la section 2.1.1 que « déconvolution est utilisé pour compenser les détails ». Cependant, je ne suis pas en mesure d'apprécier cela parce qu'il n'y a pas de sous-échantillonnage des cartes de caractéristiques dans le modèle proposé. Quelqu'un peut-il expliquer pourquoi la déconvolution est préférée à la convolution ici? Qu'est-ce qui rend la couche de déconvolution plus performante que la convolution dans ce cas?
Salut, j'ai rouvert cette question après avoir lu un nouveau papier. Je vous demande de lire la question mise à jour s'il vous plaît. Je serai heureux si vous pouviez aider! – kunal18