3

Je cherche un moyen qui, étant donné une image d'entrée et un réseau neuronal, produise une classe étiquetée pour chaque pixel de l'image (ciel, herbe, montagne, personne, voiture etc.).Image par pixel Problème de sortie d'étiquetage de scène (en utilisant la segmentation sémantique FCN-32s)

J'ai configuré Caffe (la future branche) et exécuté avec succès le modèle FCN-32s Fully Convolutional Semantic Segmentation on PASCAL-Context. Cependant, je suis incapable de produire des images clairement étiquetées avec.

images qui Visualise mon problème:
image d'entrée

de vérité terrain

Et mon résultat:

Cela pourrait être une question de résolution. Une idée d'où je vais mal?

Répondre

5

Il semble que le modèle 32s fasse de grandes foulées et travaille ainsi à une résolution grossière. Pouvez-vous essayer le 8s model qui semble effectuer moins de réduction de la résolution.
En regardant J Long, E Shelhamer, T Darrell Fully Convolutional Networks for Semantic Segmentation, CVPR 2015 (en particulier à la figure 4), il semble que le modèle 32s n'est pas conçu pour capturer les détails fins de la segmentation.

+1

Merci! Cela semblait faire l'affaire. Je reçois de bons résultats maintenant. – irri

+0

@irri est-ce que le modèle à 8 foulées formé par shelhamer fonctionne avec vous? https://gist.github.com/shelhamer/91eece041c19ff8968ee –

+0

@Shai: Pourriez-vous probablement répondre [Qu'est-ce que la "segmentation sémantique" par rapport à "la segmentation" et "l'étiquetage de scène"?] (http://stackoverflow.com/q/33947823/562769)? –