-3

Ma tâche: J'ai besoin de former un réseau de neurones convolutionnels pour reconnaître la plaque d'immatriculation de la voiture.Formation réseau neuronal convolutionnel pour reconnaître la plaque d'immatriculation de voiture

entrée: d'image (matrice de pixels (i peut normaliser))

sortie: informations sur la position de la plaque d'immatriculation.

Questions:

1) Quelle forme est préférable d'obtenir un résultat? Par exemple: si je veux reconnaître des chiffres, je vais utiliser un vecteur de 10 éléments dont les valeurs contiendront la probabilité du chiffre approprié. Mais je ne sais pas quelle forme de sortie utiliser dans mon cas.

2) Quelle taille convient le mieux pour les images d'entrée?

3) Ce problème est lié au premier. Comment puis-je créer mon jeu de données d'entraînement? Mes variantes: masque de bits où 1 signifie que c'est un pixel de plaque d'immatriculation, et description JSON du rect de la plaque (x, y, largeur, hauteur). Et quel programme puis-je utiliser pour mapper?

Je suis désolé, si mes questions vous semblent trop stupide :)

+0

Bienvenue dans StackOverflow. Veuillez lire et suivre les consignes de publication dans la documentation d'aide. [sur le sujet] (http://stackoverflow.com/help/on-topic) et [comment demander] (http://stackoverflow.com/help/how-to-ask) s'appliquent ici. – Prune

Répondre

1

il n'est pas clair pour moi si vous voulez détecter la plaque de voiture ou de reconnaître les chiffres de la plaque de voiture. Pour vous répondre dans les deux cas, tout dépend de votre jeu de données.

  1. si votre ensemble de données comprend des images de voitures dans différentes positions avec différentes tailles

    • si votre tâche est de détecter la plaque de sorte que votre tâche est de former le système pour détecter s'il y a plaque de voiture dans l'image et localisez-le en faisant de la segmentation, de l'attention, de la régression d'emplacement pix quelle que soit la procédure que vous choisissez d'appliquer. Si votre tâche est de reconnaître les chiffres, vous devez d'abord appliquer la détection des plaques, puis vous appliquez la reconnaissance des chiffres en appliquant séquentiellement votre entrée ou en segmentant les chiffres avant d'appliquer la reconnaissance.

  2. si votre ensemble de données comprend les chiffres alors il vous suffit d'appliquer votre modèle pour reconnaître les chiffres en choisissant un modèle que vous préférez.

Je vous conseille de faire des recherches d'abord à comprendre ce que vous allez faire et ce que les gens ont fait avant de définir votre stat de l'art depuis que je vois de votre question, le problème est flou très pour toi.