2010-09-02 2 views
1

En regardant un scénario dans lequel un formulaire (constitué, par souci de simplicité, des cases à cocher uniquement) est envoyé par télécopie à un serveur de fax capable d'OCR. Maintenant, avec le texte typographique, j'ai vu que diverses implémentations d'OCR faisaient un travail décent, mais je ne suis pas sûr de savoir comment gérer les cases à cocher, spécialement les x ou les chèques manuscrits, sans parler des coordonnées.Analyse d'un formulaire faxé

De retour à l'école primaire, nous avions l'habitude de remplir ces tests de Gauss (sic) avec HB shading dans la bonne réponse; quelque part, en quelque sorte, qui a été analysé et analysé.

Où en sommes-nous aujourd'hui? Y at-il quelque chose d'out-of-the-box?

Répondre

3

Vous faites référence à la technologie de reconnaissance optique des marques (OMR) couramment utilisée par Scantron et NCS dans de nombreuses écoles américaines.

La plupart des serveurs OCR n'auraient aucun concept réel de lecture de l'OMR à moins d'être spécifiquement conçus pour reconnaître différents types de formulaires. Il semble que votre logiciel de serveur de fax OCR ne fait probablement qu'une OCR pleine page et n'aurait aucun concept de champs OMR.

Vous pourriez éventuellement monter quelque chose sans investir trop d'efforts ou de coûts. Si vous concevez des questions selon les directives suivantes, cela pourrait très bien fonctionner.

Quels fruits préférez-vous manger?
<> Apple
<> Pear
<> Orange
<> Banana

Lorsque le moteur OCR revient avec le texte OCR, vous pouvez supposer que les caractères lus entre les < et> est un OMR marquer même s'il s'agit d'un caractère non reconnu.

Quels fruits préférez-vous manger?
<> Apple
< x> poire
<? > Orange
<> Banane

Cela indiquerait que les marques Poire et Orange ont été marquées.

TeleForm est un package commercial qui permet d'importer les images et de traiter les pages de télécopie, mais vous devez d'abord concevoir le formulaire dans Teleform. http://www.cardiff.com/products/index.html