2013-05-17 3 views
2

Problème: J'ai une version scannée d'un rapport de taxe (par exemple https://docs.google.com/file/d/0B3TmJsb1vYhqclFFendvTlRoV28/edit?usp=sharing), et je dois le remplir par programme. Donc, il faut trouver des zones vides et y mettre des valeurs dans le programme. Maintenant, je ne vois qu'une seule solution - trouver manuellement les coordonnées de ces zones vides, le coder pour programmer, et les valeurs de sortie à ces coordonnées. Est-il possible de trouver par programmation des coordonnées (peut-être par une reconnaissance de modèle ou autre) de zones vides? Peut-être l'utilisation de certains outils Ruby (par exemple, Prawn)?Trouver les zones à éditer dans le fichier pdf

+0

Il serait plus simple si le fichier n'était pas une image capturée dans un fichier PDF, mais en fait le formulaire bloque dans un fichier PDF. – vgoff

+1

Il existe des outils qui tentent de reconnaître les zones de champ de forme papier dans les analyses, mais leurs résultats doivent être vérifiés manuellement avant utilisation. Je conseillerais plutôt que vous ajoutiez des champs de formulaire PDF au modèle PDF et plus tard les remplir par programme par nom. Cela étant dit, votre exemple de rapport texte est ** non ** numérisé (ou s'il est scanné, il a été très bien post-traité) ... – mkl

Répondre

0

Donc, il n'y a pas de solution automatique complète. J'ai résolu ce problème en recherchant des zones à entrer, stocker ses coordonnées et ensuite sortir à ces zones

Questions connexes