2016-07-20 1 views
0

Je peux utiliser Scikit-Learn pour former un modèle et reconnaître des objets mais je dois aussi pouvoir dire où se trouve l'objet dans mes images de données de test. Y a-t-il quelque part où je pourrais peut-être obtenir les coordonnées de la partie de l'image de test qui a l'objet que j'essaie de reconnaître?Comment puis-je obtenir la position d'un objet identifié dans Scikit-Learn?

Sinon, veuillez me diriger vers une autre bibliothèque qui m'aidera à accomplir cette tâche.

Thankyou

Répondre

0

Je suppose que vous parlez d'une application de vision par ordinateur. Habituellement, la façon dont une boîte est dessinée autour d'un objet identifié est en utilisant une fenêtre glissante et en exécutant votre classificateur sur chaque fenêtre au fur et à mesure qu'elle traverse l'écran. Vous pouvez suivre les fenêtres qui reviennent avec des résultats positifs et utiliser ces fenêtres comme limites. Vous pouvez utiliser des fenêtres de taille différente si l'échelle de l'objet change d'image en image. Dans ce cas, vous préférerez probablement la plus petite des deux fenêtres qui se chevauchent.

+0

Merci pour la réponse! Donc, j'ai réussi à reconnaître des objets en utilisant SciKit-Learn. J'ai utilisé le descripteur SIFT pour la détection de caractéristiques et la technique Bag-Of-Words pour atteindre mon objectif. Mon programme réussit très bien à reconnaître l'objet. Tout ce qui reste maintenant est de créer un rectangle englobant autour d'elle. La technique que vous avez mentionnée n'a pas vraiment de sens ici car SIFT est indépendant de l'échelle et avoir une fenêtre coulissante ne ferait qu'ajouter au calcul, non? Pourrais-je, peut-être, utiliser OpenCV et quelques techniques de CV pour localiser l'objet? – legolasshegolas