1

Je catégoriser les 30 types de vêtements de l'image en utilisant R-CNN Object Library Détection de tensorflow: https://github.com/tensorflow/models/tree/master/research/object_detectionDevrais-je mettre à l'échelle l'image en niveaux de gris?

Est-ce que la matière couleur lorsque nous recueillons des images pour la formation et les essais?

Si je ne mets que des chemises pourpres et bleues, je suppose qu'il ne reconnaîtra pas les chemises rouges?

Devrais-je mettre à l'échelle toutes les images en gris pour détecter les types de vêtements? :)

Répondre

1

Oui, la couleur compte. L'extraction des caractéristiques visuelles sous-jacentes est basée sur un réseau neuronal convolutif, pré-formé pour effectuer une reconnaissance d'image sur des images couleur dans l'ensemble de données ImageNet.

Les instructions du référentiel R-CNN sur bringing in your own dataset requièrent des images RVB.

Dataset Exigences

Pour chaque exemple dans votre ensemble de données, vous devriez avoir les informations suivantes:

  1. Une image RVB pour l'ensemble de données codées comme jpeg ou png.
  2. Une liste de boîtes englobantes pour l'image. Chaque boîte englobante doit contenir:
    • Une boîte de délimitation coordonnée (avec l'origine dans le coin supérieur gauche) définie par 4 nombres à virgule flottante [ymin, xmin, ymax, xmax]. Notez que nous stockons les coordonnées normalisées (x/width, y/height) dans l'ensemble de données TFRecord.
    • Classe de l'objet dans la zone de délimitation.
+0

cool. Pensez-vous que la mise à l'échelle de l'image permettra de résoudre ce problème? –

+1

Si vous gravez les images en niveaux de gris, les classes de votre boîte englobante sont simplement "chapeau", "chemisier", "pantalon", "robe", etc. Si vous ne gravissez pas les images en niveaux de gris, les classes de cadre peuvent être soit la même chose, ou ils peuvent être plus fins, par exemple "chapeau rouge", "chemisier blanc", "pantalon vert", "robe à pois". –

+0

Cool! C'est ce que je voulais! Merci! –