2

Je travaille sur une application de vision par ordinateur et je suis bloqué à un barrage conceptuel. J'ai besoin de reconnaître un ensemble de logos dans une vidéo, et jusqu'ici j'ai utilisé des méthodes d'appariement de caractéristiques comme SIFT (et ASIFT par Yu et Morel), SURF, FERNS - essentiellement tout dans les "Interfaces Communes des Correspondeurs de Descripteurs Génériques" section de la documentation OpenCV. Mais récemment, j'ai étudié les méthodes utilisées dans OCR/Random Trees classifier (je jouais avec ce jeu de données: http://archive.ics.uci.edu/ml/datasets/Letter+Recognition) et pensant que cela pourrait être une meilleure façon de trouver les logos. Le problème est que je ne peux pas trouver un moyen fiable de segmenter automatiquement une image arbitraire.techniques de segmentation d'image

Mes questions:

  1. Dois-je la peine de regarder dans des méthodes autres que descripteur/keypoint, ou est-ce la meilleure façon de reconnaître un logo typique (stylisé, peu de couleurs, arêtes vives)?
  2. Comment est-ce que je peux segmenter une image arbitraire (ou une image vidéo, dans mon cas) de sorte que je puisse
    correspondre correctement à une base de données d'exemple?
  3. Il semblerait que HaarCascades fonctionne de manière similaire (bases de données d'échantillons), mais je ne peux pas comprendre comment les processus sont liés. Y a-t-il une segmentation?

Désolé de ces questions sont trop larges. J'essaye d'envelopper ma tête autour de ce truc avec peu d'aide. Merci!

Répondre

2

Il semble que la segmentation ne soit pas ce que vous voulez. Je pense qu'il doit en faire plus avec la détection et la reconnaissance d'objets. Vous voulez détecter la présence d'un certain ensemble de logos, dans un certain ensemble d'images. Cela ne semble pas lié à la segmentation qui concerne l'étiquetage des surfaces ou des zones d'une couleur, d'une texture, d'une forme, etc. communes, bien que l'examen des méthodes basées sur la segmentation puisse être utile.

Je vous encouragerais certainement à regarder le problème et à examiner toutes les méthodes possibles qui peuvent être appliquées, pas seulement celles qui sont à la mode (telles que SIFT, GLOH, SURF, etc). Je vous recommande de regarder des méthodes plus anciennes, plus simples comme la correspondance de gabarit, le chanfreinage, etc.

Haar cascades est devenu populaire après un papier de 2000 par Viola et Jones utilisé pour la détection de visage (similaire à ce que vous voyez dans le point et cliquez sur moderne appareils photo). Cela semble un peu similaire au problème qui vous intéresse. Vous devriez peut-être également examiner cette partie du problème, mais essayez de ne pas trop vous concentrer sur la partie apprentissage.