Ma tâche: J'ai besoin de former un réseau de neurones convolutionnels pour reconnaître la plaque d'immatriculation de la voiture.Formation réseau neuronal convolutionnel pour reconnaître la plaque d'immatriculation de voiture
entrée: d'image (matrice de pixels (i peut normaliser))
sortie: informations sur la position de la plaque d'immatriculation.
Questions:
1) Quelle forme est préférable d'obtenir un résultat? Par exemple: si je veux reconnaître des chiffres, je vais utiliser un vecteur de 10 éléments dont les valeurs contiendront la probabilité du chiffre approprié. Mais je ne sais pas quelle forme de sortie utiliser dans mon cas.
2) Quelle taille convient le mieux pour les images d'entrée?
3) Ce problème est lié au premier. Comment puis-je créer mon jeu de données d'entraînement? Mes variantes: masque de bits où 1 signifie que c'est un pixel de plaque d'immatriculation, et description JSON du rect de la plaque (x, y, largeur, hauteur). Et quel programme puis-je utiliser pour mapper?
Je suis désolé, si mes questions vous semblent trop stupide :)
Bienvenue dans StackOverflow. Veuillez lire et suivre les consignes de publication dans la documentation d'aide. [sur le sujet] (http://stackoverflow.com/help/on-topic) et [comment demander] (http://stackoverflow.com/help/how-to-ask) s'appliquent ici. – Prune