2016-09-18 1 views
10

Je me demandais juste à quel point tesseract peut être précis pour la reconnaissance de l'écriture manuscrite s'il est utilisé avec des majuscules dans leurs propres petites boîtes sous une forme.Utilisation de Tesseract pour la reconnaissance de l'écriture manuscrite

Je sais que vous pouvez l'entraîner pour reconnaître votre propre écriture un peu mais le problème dans mon cas est que je dois l'utiliser sur plusieurs écritures. Est-ce que quelqu'un peut-il me montrer la bonne direction?

Merci beaucoup.

Répondre

7

En bref, vous devez entraîner le moteur Tesseract pour reconnaître l'écriture. Jetez un oeil à ce lien:

Tesseract handwriting with dictionary training

C'est ce que le poste lié dit:

Il est possible de former Tesseract de reconnaître l'écriture manuscrite. Voici les instructions: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

Mais ne vous attendez pas à de très bons résultats. Les universitaires ont généralement obtenu des résultats de précision dépassant environ 90%. Voici quelques références pour les mots et les nombres. Donc, si votre cas d'utilisation peut gérer au moins 1/10 , cela peut fonctionner pour vous.

ici aussi est un bon article académique écrit à ce sujet:

Recognition of Handwritten Textual Annotations using Tesseract Open Source OCR Engine for information Just In Time (iJIT)

+0

Merci! C'était très utile. – Jackdaw

+2

@ hcam1 Comment tesseract se compare-t-il en termes de précision à d'autres ocr en tant qu'applications de service? –