J'essaye de lire un document de pdf dans une application de j2ee.Lire le pdf uploadstream une page à la fois avec java
Pour une application Web, je dois stocker des documents PDF sur disque. Pour faciliter la recherche, je veux faire un index inverse du texte à l'intérieur du document; si c'est OCR.
Avec la bibliothèque PDFbox, il est possible de créer un objet pdfDocument contenant un fichier pdf complet. Cependant, pour préserver la mémoire et améliorer les performances globales, je préfère traiter le document comme un flux et lire une page à la fois dans un tampon.
Je me demande s'il est possible de lire un flux de fichiers contenant du pdf page par page ou même une ligne à la fois.
Copie possible de [PDFBox: travailler avec de très gros PDF.] (Https://stackoverflow.com/questions/11301818/pdfbox-working-with-very-large-pdfs) – lmanyange