Je souhaite que mon application remplisse un seul champ sous une forme qui existe sous la forme d'un fichier image en noir et blanc . Le formulaire commence toujours par la même version papier, mais au moment où mon application l'obtient de mes utilisateurs, il a peut-être été scanné ou faxé plus d'une fois. Pour cette raison, le champ dont j'ai besoin n'est pas dans le même endroit dans tous les fichiers.Comment trouver un champ vide sur l'image d'un document numérisé
Mes utilisateurs ne reçoivent pas toujours le formulaire vierge de moi, donc je n'ai pas avoir la possibilité d'imprimer une marque ou un espace réservé que je peux reconnaître plus tard.
Il y a du texte dans le formulaire vierge original, mais parce qu'il a été envoyé par fax, j'ai seulement 200 dpi de résolution. Le texte est toujours assez grand pour un humain à lire, mais je suis sceptique quant à l'OCR.
J'ai un peu de budget, donc je n'ai pas besoin d'une solution gratuite ... disons juste $ 2000.
Cela dit, je considère
Obtenez une solution d'OCR pour trouver le texte étiquette sur le terrain que j'ai besoin. Je ne pense pas avoir les ressources ou d'expertise pour rouler-moi-même. Je n'ai pas besoin de reconnaissance parfaite, car je sais déjà ce que dit le texte. Mais j'ai besoin de savoir X- et Y-coordonnées. Y a-t-il un logiciel qui fait cela? Ou est la programmation plus facile que je pense?
Créer ou acheter un logiciel pour reconnaître les bords du formulaire. De là, je pourrais obtenir la position relative de le champ dont j'ai besoin. Je pense à la ligne en pointillés mon logiciel de numérisation met autour de l'image de un petit document. Est-ce un algorhthm connu ou existe-t-il une solution disponible ? Une autre façon de reconnaître le champ dont j'ai besoin. Tentatives de google logiciel de remplissage de formulaire donnez-moi des centaines de correspondances pour les formulaires Web, formulaires pdf, etc. qui ne font pas ce que j'ai besoin .
Je ne suis pas difficile sur la langue. Mon application fonctionne sur Linux, mais si la meilleure solution est Microsoft, je peux probablement faire ce travail.
J'apprécierais vos pensées.
Je pense que vous comprenez exactement correctement. C'est une bonne information. – bmb
Pouvez-vous expliquer ce que vous appelez la descente de coordonnées? Merci – Raj
@Raj: Une version simple de descente en dégradé. Parcourez les variables. Trouvez pour chaque variable la nouvelle valeur de la variable qui optimise la fonction objectif. Répétez jusqu'à convergence. Consultez http://books.google.com/books?id=epc5fX0lqRIC&lpg=PA53&dq=%22coordinate%20descent%22&pg=PA53#v=onepage&q=%22coordinate%20descent%22&f=false et posez une question dans la balise algorithmes si nécessaire. . –