2016-12-06 5 views
0

J'essaie de participer à un défi de classification des images de caméra de tableau de bord (pour voiture) avec des étiquettes étant -traffic lumière rouge/vert/inexistante. Les feux de circulation sont une petite partie de l'image, et aucune boîte de délimitation n'est fournie. J'essaie d'affiner l'image comme suggéré here actuellement avec le net Inception, mais obtenir une précision de 0,55 à 0,6. Besoin d'atteindre 0.95+.Classification de l'image par petit objet

Je pense que le réseau ne fonctionne pas bien en raison de la petite partie du feu de circulation dans l'image.

Comment puis-je progresser dans ce domaine?

Répondre

0

Je suggère au lieu d'utiliser toute l'image à la fois, prendre des cultures de l'image avec une fenêtre coulissante avec chevauchement. Vous devez également étiqueter les cultures.

+0

cela ne signifie-t-il pas que j'ai besoin d'un ensemble de données de seulement le feu de circulation pour former d'abord? ou plus précisément - un ensemble de données de fond rouge/vert/rue (c'est-à-dire: pas de feu) –

+0

Comment allez-vous vous entraîner sans données étiquetées, de toute façon? –

+0

J'ai étiqueté les données des images dashcam avec juste des étiquettes de rouge/vert/aucun ... aucune boîte englobante –