2016-12-27 2 views
1

TensorFlow a une API utilisant le modèle v3 initial pour l'identification d'objets. Je me demandais, s'il y avait un moyen de localiser des images plus petites dans une image plus grande. Par exemple, localiser toutes les oranges sur un oranger. J'ai essayé de diviser l'image plus grande en une grille d'images plus petites et en appliquant un flux tensoriel sur chaque image plus petite, mais avoir une grille constante est extrêmement sujet aux erreurs, existe-t-il une solution autour de cela?Exécution d'une API de reconnaissance d'images TensorFlow pour rechercher un objet

Répondre

1

Le terme que vous cherchez est détection d'objet. Vous pouvez utiliser une fenêtre coulissante à différentes échelles. C'est un moyen, il y en a probablement de meilleurs, mais je ne sais pas ce qu'ils sont.

Disons que certaines oranges sont plus proches que d'autres. Commencez avec une boîte 10x10 (ou quelque chose) dans le coin supérieur gauche, et voyez si votre modèle le classe comme une orange. Déplacez votre boîte vers la droite 2 pixels (ou quelque chose). Réessayer. Continuez à avancer, puis descendez 2 pixels et commencez une nouvelle ligne, etc. Maintenant, redimensionnez l'image pour qu'elle soit plus petite (maintenant vous cherchez des oranges plus grosses), et répétez tout le processus. Vous pouvez google choses comme "détection de fenêtre glissante", et "image pyramide" pour en savoir plus. Une fois que vous avez parcouru votre image, vous aurez un tas de détections - vous devrez trouver un moyen d'effectuer la suppression non maximale sur vos détections, car vous pourriez avoir beaucoup trop.