2016-06-09 1 views
0

Étant donné l'algorithme de découpage de graphe Push-Relabel décrit dans this article, je souhaite effectuer une segmentation d'image binaire. Ma question concerne l'initialisation du graphique. Lors de la représentation de l'image sous la forme d'un graphe à structure réticulaire (MRF), on formulerait généralement le problème selon la fonction d'énergie unaire et par paire standard, selon la section 3, équation 1 dans this paper, où le terme unaire est une énergie de données et la fluidité des modèles par paires dans certains quartiers.Graphique d'initialisation pour l'algorithme de repérage par pression

J'ai du mal à faire le lien entre cette formulation d'optimisation MRF et la formulation de l'algorithme de flux max dans l'article lié. À ma connaissance, les capacités entre nœuds voisins peuvent être représentées par une fonction de distance (basée sur la distance spatiale et les valeurs d'intensité), par exemple la section 2, l'équation 7 en this paper. Cependant, il n'est pas clair comment on pourrait incorporer la connaissance préalable dans l'initialisation du graphe, comme les distributions initiales pour les points de graine. À un niveau supérieur, étant donné une image avec des points de départ étiquetés appartenant à des classes d'arrière-plan ou d'objet, comment initialiser le graphe de flux de sorte que max-flow puisse être utilisé pour effectuer une segmentation binaire?

Répondre

0

Le graphique a un sommet pour chaque pixel, mais il a également un sommet source et un sommet de puits, qui ne correspondent pas à un pixel. Une interprétation possible de ces sommets spéciaux est que la source représente le segment «de premier plan» et le récepteur le segment «de fond».

La capacité de l'arc de la source à un sommet de pixel est une log-vraisemblance que ce pixel soit au premier plan. La capacité de l'arc d'un sommet de pixel au puits est une log-vraisemblance que ce pixel soit en arrière-plan. La capacité d'un arc entre les sommets des pixels représente une probabilité logarithmique que les pixels soient à la fois au premier plan ou les deux en arrière-plan. Cette croyance devrait être plus élevée lorsque les pixels sont proches les uns des autres et lorsque les pixels ont des couleurs similaires.

+0

Merci pour la réponse. Aurais-je raison de penser que pour les termes logarithmiques sur les connexions source et descendante, on calculerait la moyenne et la covariance de l'échantillon pour les points étiquetés et utiliser les paramètres résultants dans la fonction de vraisemblance logarithmique de la distribution normale? –

+0

@VisionIncision Vous parlez de la distribution a priori, pour laquelle il n'y a pas de choix "correct". Je n'ai vraiment aucune idée si cela fonctionne dans la pratique. –