Je serai reconnaissant si vous répondez à ma question. J'ai peur que je me trompe, car mon réseau donne toujours une image noire sans aucune segmentation. Je fais une segmentation sémantique en Caffe
. La sortie de score layer
est < 1 5 256 256>batch_size no_classes image_width image_height
. Ce qui est envoyé au calque SoftmaxWithLoss
, et l'entrée de sortie de la couche de perte est l'image de référence avec 5 étiquettes de classe < 1 1 256 256>.Devrions-nous créer des images différentes pour chaque étiquette de classe dans la segmentation sémantique?
Ma question est: la dimension de ces deux entrées de couche de perte ne correspond pas. Dois-je créer 5 images d'étiquettes pour ces 5 classes et envoyer une taille de lot de 5 dans la couche d'étiquettes dans la couche de perte?
Comment puis-je préparer des données d'étiquette pour la segmentation sémantique?
Cordialement
Merci pour votre commentaire. Donc, cela signifie qu'il n'est pas nécessaire de créer 5 images d'étiquettes différentes qui deviennent des images à deux classes et qui séparent chacune une classe spécifique de l'arrière-plan? Désolé, je suis un peu confus en regardant ce [lien] (https://github.com/BVLC/caffe/issues/1341) –