2017-10-12 6 views
0

Je sais que nous prenons une fenêtre 16x16 de "entre-deux" pixels autour du point clé. nous avons divisé cette fenêtre en seize fenêtres 4x4. A partir de chaque fenêtre 4x4, nous générons un histogramme de 8 cases. Chaque bac correspond à 0-44 degrés, 45-89 degrés, etc. Les orientations de gradients du 4x4 sont placées dans ces bacs. Ceci est fait pour tous les blocs 4x4. Finalement, nous normalisons les 128 valeurs que vous obtenez. Où ils obtiennent leur valeurla valeur de 128 descripteur de crible?

mais je me méprends d'où le nombre 128 obtenir leur valeur? a-t-il fait référence à la grandeur correspondante de la valeur d'orientation ou quoi?

Je vous serais reconnaissant si quelqu'un décrit un exemple numérique Cordialement!

+0

Pourriez-vous être un peu plus clair sur ce que vous demandez? –

Répondre

0

Dans EIPD (Fonction échelle invariante Transform), le 128 vecteur caractéristique dimensionnelle est composé de échantillons 4x4 par fenêtre dans 8 directions par échantillon - 4x4x8 = 128

Pour un guide illustré voir A Short introduction to descriptors , et notamment cette image, montrant les mesures 8-direction (cardinal et inter-cardinal) noyé dans chacune des cases de la grille de 4x4 (image centrale) et un histogramme des directions (image de droite):

enter image description here

De y notre question je crois que vous êtes également peu clair sur ce que l'information à l'intérieur du descripteur est - il est appelé Histogrammes de Dégradés Orientés (HOG). Pour en savoir plus, Wikipedia a une vue d'ensemble HOG gradient computation:

Chaque pixel dans la cellule émet un vote pondéré pour un canal d'histogramme basé orientation sur la base des valeurs trouvées dans le calcul du gradient.

Tout est construit sur ces "votes" par pixel.