Je travaille sur une application de vision par ordinateur et je suis bloqué à un barrage conceptuel. J'ai besoin de reconnaître un ensemble de logos dans une vidéo, et jusqu'ici j'ai utilisé des méthodes d'appariement de caractéristiques comme SIFT (et ASIFT par Yu et Morel), SURF, FERNS - essentiellement tout dans les "Interfaces Communes des Correspondeurs de Descripteurs Génériques" section de la documentation OpenCV. Mais récemment, j'ai étudié les méthodes utilisées dans OCR/Random Trees classifier (je jouais avec ce jeu de données: http://archive.ics.uci.edu/ml/datasets/Letter+Recognition) et pensant que cela pourrait être une meilleure façon de trouver les logos. Le problème est que je ne peux pas trouver un moyen fiable de segmenter automatiquement une image arbitraire.techniques de segmentation d'image
Mes questions:
- Dois-je la peine de regarder dans des méthodes autres que descripteur/keypoint, ou est-ce la meilleure façon de reconnaître un logo typique (stylisé, peu de couleurs, arêtes vives)?
- Comment est-ce que je peux segmenter une image arbitraire (ou une image vidéo, dans mon cas) de sorte que je puisse
correspondre correctement à une base de données d'exemple? - Il semblerait que HaarCascades fonctionne de manière similaire (bases de données d'échantillons), mais je ne peux pas comprendre comment les processus sont liés. Y a-t-il une segmentation?
Désolé de ces questions sont trop larges. J'essaye d'envelopper ma tête autour de ce truc avec peu d'aide. Merci!