J'ai récemment suivi un cours de Machine Learning sur coursera et réussi le cours avec des notes décentes. J'ai utilisé des algorithmes de KNN, de régression logistique, de NN etc. pendant le cours, une tâche consistait à écrire un algorithme d'apprentissage pour l'identification des chiffres que je pouvais compléter. Le cours s'est terminé par une étude de cas de Photo OCR qui m'a vraiment excité, mais j'ai trouvé difficile d'appliquer l'algo de base enseigné dans le cours pour cet énorme problème. Alors quelqu'un peut-il me suggérer des algorithmes sur Photo OCR?Algorithmes pour la reconnaissance optique de caractères dans l'apprentissage automatique
Répondre
Le problème avec la reconnaissance d'image est qu'il est très sensible à toute modification. Leur cerveau humain moyen est capable d'extraire certaines caractéristiques de l'image, ce qui nous permettra d'identifier une image donnée même si certaines opérations d'image (comme l'inclinaison, la rotation, etc.) ont été appliquées. Cela étant dit, à ma connaissance, les réseaux neuronaux artificiels sont les plus largement utilisés (jeter dans une couche cachée ou deux aide également généralement). Wisard (ou Wizard) est une autre technique dont j'ai entendu parler, mais je ne trouve rien à ce sujet. Cette technique casse une image en sections et vous obtenez un pourcentage de similarité lorsque vous comparez le segment d'image avec ce que vous avez dans votre base de connaissances. Cela étant dit, si je devais vous coller à des réseaux neuronaux plus une bibliothèque de manipulation graphique décent tels que OpenCV (il existe divers wrappers pour cela, y compris Java et C#). L'objectif est d'éliminer autant d'informations inutiles que possible. Dans certains cas, par exemple, réduire l'image à une échelle de gris ou des pixels strictement noir et blanc aide.
- 1. Reconnaissance optique des caractères
- 2. Reconnaissance optique de caractères dans android
- 3. MATLAB Reconnaissance optique de caractères - besoin d'aide
- 4. numérisation de texte (reconnaissance optique de caractères)
- 5. Android OCR (reconnaissance optique de caractères)
- 6. OCR (Reconnaissance optique de caractères) pour le texte à l'écran
- 7. Bonnes API pour la reconnaissance optique de caractères Chinois <-> Caractères anglais?
- 8. QRcode reconnaissance optique dans le navigateur
- 9. Reconnaissance optique des marques (OMR) sur l'iPhone
- 10. Algorithmes de reconnaissance d'objets open source
- 11. Algorithmes de reconnaissance de formes/code pour Java
- 12. Algorithmes de reconnaissance de formes dans Node.js ou PHP?
- 13. Reconnaissance de caractères
- 14. Reconnaissance de caractères ANPR
- 15. (MOBILE) la reconnaissance optique de l'image pour compter le nombre d'articles
- 16. Quels types de problèmes les réseaux neuronaux peuvent-ils résoudre? (à l'exclusion de la reconnaissance optique des caractères)
- 17. Reconnaissance de caractères dans l'image dans asp.net
- 18. Comment les algorithmes de reconnaissance vocale reconnaissent-ils les homophones?
- 19. Quelles fonctionnalités extraire pour la reconnaissance de caractères manuscrits?
- 20. Algorithmes de mise en correspondance/reconnaissance d'empreintes digitales/implémentations
- 21. Les menus de reconnaissance automatique de Google?
- 22. Reconnaissance de caractères uniques dans Java à l'aide de la reconnaissance vocale
- 23. Reconnaissance automatique sur imprimante POS
- 24. Bibliothèque de reconnaissance de visage pour cluster automatique
- 25. reconnaissance de la langue et la direction textbox automatique commutateur
- 26. Reconnaissance d'image (reconnaissance de forme)
- 27. Framework/Algorithmes/Bibliothèque pour l'estimation côté serveur/reconnaissance de la similarité des fichiers audio?
- 28. entrée Flink HBase pour les algorithmes d'apprentissage automatique
- 29. en utilisant des algorithmes génétiques pour améliorer la reconnaissance des commandes vocales C#
- 30. Reconnaissance de caractères étendus en utilisant JAVACC