J'essaie de reproduire le processus d'entraînement de frontlface_detector() de dlib. J'utilise le même ensemble de données (à partir de http://dlib.net/files/data/dlib_face_detector_training_data.tar.gz) comme dlib disent qu'ils ont utilisé, par l'union des faces frontales et des profils + leurs réflexions.reproduction dlib frontale_face_detector() formation
Mes problèmes sont les suivants: 1. utilisation de la mémoire très élevée pour l'ensemble des données (30 + Gb) 2. Formation sur dataset partielle ne donne pas très élevé taux de rappel, 50-60 pour cent par rapport à celui 80-90 frontal_face_detector (test sur un sous-ensemble d'images non utilisées pour la formation). 3. Les détecteurs fonctionnent mal sur les images à basse résolution et ne parviennent donc pas à détecter les visages de plus de 1-1,5 mètres de profondeur. 4. augmente le temps de fonctionner de formation de manière significative avec le paramètre SVM C que je dois augmenter pour obtenir un meilleur taux de rappel (je soupçonne que c'est juste artefact surapprentissage)
Ma motivation originale trainig était a. acquérir la capacité de s'adapter à l'environnement spécifique dans lequel la caméra est installée, par ex. exploitation minière négative b. amélioration de la détection en profondeur + temps d'exécution en réduisant la fenêtre 80x80 à 64x64 ou même 48x48.
Suis-je sur le bon chemin? Est-ce que je manque quelque chose? S'il vous plaît aider ...
Où puis-je trouver l'ensemble de données et les fichiers XML à télécharger? –
C'est l'URL que vous avez publiée. –
Trouvé, merci. En ce qui concerne les versions rotation-gauche, rotation-droite: sont-elles augmentées, c'est-à-dire, calculées artificiellement à partir des faces frontales, et comment? –