2017-08-09 4 views

Répondre

-1

Cela dépend de vos attentes.

  • Vous pouvez utiliser l'extraction de texte pour récupérer tout le texte sur une page donnée. La façon dont vous traitez ensuite le texte dépend de vous. (par exemple, expressions régulières)

  • Vous pouvez également utiliser pdf2Data, un module complémentaire iText7 qui vous permet de faire correspondre des documents à des modèles. pdf2Data semble être un bon choix, car il produit des fichiers XML en sortie.

Plus d'informations sur pdf2Data se trouve ici http://itextpdf.com/itext7/pdf2Data

+0

extraction de textes ne sont pas beaucoup plus utile que les valeurs ne peuvent pas être mises en correspondance – hrishi

+0

Cela dépend. Vous pouvez utiliser TextExtractionStrategies qui prend un emplacement spécifique (Rectangle) comme entrée. Cela vous permet une approche plus ciblée. Une fois que vous avez le texte à une certaine position (approximativement définie), vous pouvez utiliser des expressions régulières pour affiner le résultat. –

+0

ok. Merci, je vais vérifier. Je ne suis pas très familier avec les fichiers PDF. J'utilise le code Java iText pour lire les formulaires XFA. Pouvez-vous partager un exemple de lien de code où je peux avoir une idée sur la façon de l'utiliser par programme – hrishi