Devrions-nous créer des images différentes pour chaque étiquette de classe dans la segmentation sémantique?

Je serai reconnaissant si vous répondez à ma question. J'ai peur que je me trompe, car mon réseau donne toujours une image noire sans aucune segmentation. Je fais une segmentation sémantique en Caffe. La sortie de score layer est < 1 5 256 256>batch_size no_classes image_width image_height. Ce qui est envoyé au calque SoftmaxWithLoss, et l'entrée de sortie de la couche de perte est l'image de référence avec 5 étiquettes de classe < 1 1 256 256>.Devrions-nous créer des images différentes pour chaque étiquette de classe dans la segmentation sémantique?

Ma question est: la dimension de ces deux entrées de couche de perte ne correspond pas. Dois-je créer 5 images d'étiquettes pour ces 5 classes et envoyer une taille de lot de 5 dans la couche d'étiquettes dans la couche de perte?

Comment puis-je préparer des données d'étiquette pour la segmentation sémantique?

Cordialement

Source

2017-03-28 S.EB

vos dimensions sont d'accord. vous produisez 5 vecteurs par pixel indiquant la probabilité de chaque classe. La vérité de terrain est une seule étiquette (entier) et la perte encourage la probabilité que l'étiquette correcte soit le maximum pour le pixel

Source

2017-03-28 05:03:34 Shai

Merci pour votre commentaire. Donc, cela signifie qu'il n'est pas nécessaire de créer 5 images d'étiquettes différentes qui deviennent des images à deux classes et qui séparent chacune une classe spécifique de l'arrière-plan? Désolé, je suis un peu confus en regardant ce [lien] (https://github.com/BVLC/caffe/issues/1341) –

Devrions-nous créer des images différentes pour chaque étiquette de classe dans la segmentation sémantique?

Répondre

Questions connexes