2017-03-28 4 views
0

Je serai reconnaissant si vous répondez à ma question. J'ai peur que je me trompe, car mon réseau donne toujours une image noire sans aucune segmentation. Je fais une segmentation sémantique en Caffe. La sortie de score layer est < 1 5 256 256>batch_size no_classes image_width image_height. Ce qui est envoyé au calque SoftmaxWithLoss, et l'entrée de sortie de la couche de perte est l'image de référence avec 5 étiquettes de classe < 1 1 256 256>.Devrions-nous créer des images différentes pour chaque étiquette de classe dans la segmentation sémantique?

Ma question est: la dimension de ces deux entrées de couche de perte ne correspond pas. Dois-je créer 5 images d'étiquettes pour ces 5 classes et envoyer une taille de lot de 5 dans la couche d'étiquettes dans la couche de perte?

Comment puis-je préparer des données d'étiquette pour la segmentation sémantique?

Cordialement

Répondre

0

vos dimensions sont d'accord. vous produisez 5 vecteurs par pixel indiquant la probabilité de chaque classe. La vérité de terrain est une seule étiquette (entier) et la perte encourage la probabilité que l'étiquette correcte soit le maximum pour le pixel

+0

Merci pour votre commentaire. Donc, cela signifie qu'il n'est pas nécessaire de créer 5 images d'étiquettes différentes qui deviennent des images à deux classes et qui séparent chacune une classe spécifique de l'arrière-plan? Désolé, je suis un peu confus en regardant ce [lien] (https://github.com/BVLC/caffe/issues/1341) –