2012-08-31 1 views
1

J'ai récemment suivi un cours de Machine Learning sur coursera et réussi le cours avec des notes décentes. J'ai utilisé des algorithmes de KNN, de régression logistique, de NN etc. pendant le cours, une tâche consistait à écrire un algorithme d'apprentissage pour l'identification des chiffres que je pouvais compléter. Le cours s'est terminé par une étude de cas de Photo OCR qui m'a vraiment excité, mais j'ai trouvé difficile d'appliquer l'algo de base enseigné dans le cours pour cet énorme problème. Alors quelqu'un peut-il me suggérer des algorithmes sur Photo OCR?Algorithmes pour la reconnaissance optique de caractères dans l'apprentissage automatique

Répondre

3

Le problème avec la reconnaissance d'image est qu'il est très sensible à toute modification. Leur cerveau humain moyen est capable d'extraire certaines caractéristiques de l'image, ce qui nous permettra d'identifier une image donnée même si certaines opérations d'image (comme l'inclinaison, la rotation, etc.) ont été appliquées. Cela étant dit, à ma connaissance, les réseaux neuronaux artificiels sont les plus largement utilisés (jeter dans une couche cachée ou deux aide également généralement). Wisard (ou Wizard) est une autre technique dont j'ai entendu parler, mais je ne trouve rien à ce sujet. Cette technique casse une image en sections et vous obtenez un pourcentage de similarité lorsque vous comparez le segment d'image avec ce que vous avez dans votre base de connaissances. Cela étant dit, si je devais vous coller à des réseaux neuronaux plus une bibliothèque de manipulation graphique décent tels que OpenCV (il existe divers wrappers pour cela, y compris Java et C#). L'objectif est d'éliminer autant d'informations inutiles que possible. Dans certains cas, par exemple, réduire l'image à une échelle de gris ou des pixels strictement noir et blanc aide.

Questions connexes