2017-03-15 1 views
0

J'ai rencontré ces termes quand j'étudie la méthode SIFT pour détecter des caractéristiques sur une image. Je me suis confus. Cela signifie-t-il que si une fonctionnalité est agrandie et pivotée, cette méthode peut toujours détecter la fonctionnalité?Que signifient l'invariance d'échelle et l'invariance d'orientation?

+0

Non seulement la fonctionnalité sera détectée, mais le descripteur SIFT aura les mêmes valeurs –

Répondre

1

Fondamentalement Oui!

Vous pouvez effectuer une distinction entre la détection de fonction et la description ici. La caractéristique détecteur (en utilisant SIFT c'est Difference of Gaussian) recherche des caractéristiques de différentes échelles. Si une caractéristique est trouvée, elle recherche à quelle échelle la réponse de la fonction ("quelle est cette caractéristique") a son maximum. L'échelle décrit la taille de la zone autour du centre de caractéristiques qui est prise en compte lors du calcul du descripteur.

En outre, l'orientation dominante des gradients dans cette zone/image patch est calculée. Ensuite, le patch d'image est tourné de sorte que l'orientation dominante pointe toujours dans la même direction (par exemple vers le haut). Pour cette raison, le patch d'image est en quelque sorte normalisé avant le calcul de la description de l'objet réel. Cela signifie que le détecteur de caractéristiques s'adapte à la fonction en termes de rotation et d'échelle (je lis parfois "covariant" au lieu de "invariant" en ne considérant que le détecteur). En résumé, le détecteur spécifie comment calculer le descripteur d'entité pour fournir le même résultat (pour SIFT, généralement 128 nombres à virgule flottante) pour les mêmes objets avec une rotation et une échelle différentes.