Je ne suis pas tout à fait sûr de savoir comment mettre en œuvre l'approche «sac de mots» avec des descripteurs HOG. J'ai vérifié plusieurs sources qui fournissent généralement plusieurs étapes à suivre:Sac de mots avec des descripteurs HOG
- Calculer les Porcs pour l'ensemble des images de formation valides.
- Applique un algorithme de clustering pour récupérer n centroïdes à partir des descripteurs.
- Effectuez un peu de magie pour créer des histogrammes avec la fréquence des centroïdes les plus proches des HOG calculés ou utilisez l'implémentation OpenCVs pour cela.
- train un SVM linéaire avec les histogrammes
L'étape qui implique la magie (3) n'est pas vraiment clair. Si je n'utilise pas OpenCV, comment l'implémenterais-je?
Les HOG sont des vecteurs qui sont calculés par cellule. J'ai donc un vecteur pour chaque cellule. Je pourrais itérer sur le vecteur et calculer le centroïde le plus proche pour chaque élément du vecteur et créer l'histogramme en conséquence. Serait-ce une bonne façon de le faire? Mais si c'est le cas, j'ai encore des vecteurs de différentes tailles et aucun avantage.
Merci pour votre réponse! Comment ferait-on cela avec les porcs felzenszwalb? Depuis, ces types de HOGs sont généralement un ensemble de 32 vecteurs dimensionnels. –
Je n'ai pas de solution exacte, peut-être que vous pouvez essayer d'abord la façon la plus simple de calculer la moyenne des vecteurs. Ex: x1 + x2 + ... + xn/n = X et ce X pourrait être votre descripteur de taille fixe. Peut-être que cela ne fonctionne pas, nous pouvons simplement essayer. – BlackCode
Avez-vous essayé une solution pour résoudre ce problème? Si vous avez une solution, pouvez-vous partager avec nous? Merci – BlackCode