2017-01-25 3 views
2

J'essaie de lire les documents manuscrits. Pour lequel je vais segmenter les caractères puis OCR/ICR les caractères ainsi segmentés.Segmentation des caractères pour la reconnaissance de l'écriture manuscrite

Je veux des résultats comme ça! Bien que ce soit un cas très trivial. L'écriture peut être cursive, le trait unique peut être utilisé pour segmenter les caractères mais cela ne fonctionne pas toujours.

enter image description here

+3

https://xkcd.com/1425/ –

Répondre

0

Après beaucoup de lecture et de recherche, réalisé que j'abordait le problème d'une mauvaise façon. Pour la reconnaissance de l'écriture manuscrite, il est difficile de segmenter les caractères, puis de les reconnaître.

Comme le paradoxe va

Une lettre ne peut être segmentée avant d'avoir reconnu et ne peut pas être reconnu avant d'avoir segmenté.

Ainsi, la solution correcte consiste à traiter le problème comme «Étiquetage de séquence supervisée». Ce qui distingue ces problèmes du cadre traditionnel de la classification des modèles supervisés est que les points de données individuels ne peuvent pas être considérés comme indépendants. Au lieu de cela, les entrées et les étiquettes forment des séquences fortement corrélées.

Je suggérerais le papier here en utilisant RNN multidimensionnel et CTC.