1

Ma question concerne la mise en œuvre de R-CNN plus rapide.Détection d'objet utilisant R-CNN plus rapide

Je lis le papier et qui se passait dans le fichier config.py est écrit par l'auteur de l'algorithme qui est disponible ici: https://github.com/rbgirshick/py-faster-rcnn/blob/master/lib/fast_rcnn/config.py

Je suis tout à fait incapable de comprendre que pourquoi avons-nous besoin BBOX_INSIDE_WEIGHTS (mentionné au ligne 84) et RPN_POSITIVE_WEIGHT (mentionné à la ligne 124)?

Dans une autre mise en œuvre, j'ai vu aussi des masques d'ancrage (ligne 659), les poids de régression d'ancrage et des masques de régression d'ancrage qui sont disponibles ici: https://github.com/DeepRNN/object_detection/blob/master/model.py

Peut quelqu'un s'il vous plaît donner la réponse simple et facile que ce sont ces paramètres pour et pourquoi avons-nous réellement besoin d'eux?

Répondre

1

En plus rapide RCNN vous avez un RPN (Région réseau de proposition) qui fait partie du modèle et il est formé avec le tout réseau

Le rôle du RPN est de proposer des boîtes englobantes dans l'image sur laquelle un objet est censé être. Pour chaque endroit de l'image, le RPN essaye de s'adapter à chacune des k «ancres» prédéfinies et pour chacune d'entre elles, il donne 4 paramètres qui définissent la proposition de la boîte englobante par rapport à l'ancre et 2 scores de probabilité pour la probabilité qu'un objet se trouve à l'intérieur de la boîte englobante.

Les ancres sont un ensemble prédéfini si des boîtes avec différents rapports d'aspect et échelles. Si nous regardons le code à code aux lignes 359 et 360 où nous calculons la perte, nous pouvons voir que les «masques d'ancrage» sont utilisés pour définir les zones dans l'image avec des ancres de régression vraie. En effet, dans la définition de la fonction de perte de Fast-RCNN, nous calculons la perte de la régression uniquement pour les ancres positives.

de même pour les « anchor_reg_masks », comme on peut le voir dans la ligne 362.

Le terme « anchor_weights » est utilisé pour normaliser le terme loos0. Après la ligne 359, la perte0 a une perte nulle pour les emplacements qui ne sont pas dans le masque, si nous calculons la perte à partir de ceci nous obtiendrons des résultats de biais. Les "anchor_weights" normalisent la perte0 à calculer uniquement à partir des vraies ancres.

+0

Cela signifie que les masques d'ancrage, les poids de régression d'ancrage et les masques de régression d'ancre et BBOX_INSIDE_WEIGHTS sont identiques? Comme j'ai compris le papier, en plus des scores de probabilité, il y a 4 * k sorties (partie de régression) de RPN pour chaque emplacement de l'image, où k est le nombre d'ancres. Donc, il ne devrait pas y avoir 4 * k poids pour la partie de régression de la RPN? –