2011-07-12 2 views
0

Nous utilisons la bibliothèque Java de Tesseract, appelée Tess4j pour convertir des fichiers PDF en texte. Cela fonctionne bien avec les fichiers Tiff ainsi qu'avec les fichiers PDF d'une page. Mais avec les fichiers PDF de plusieurs pages, il génère le fichier de sortie, quand il s'agit de la dernière page, le contrôle ne semble pas revenir à l'application d'origine qui a appelé l'appel doOCR. Il reste/reste là sans rien faire. Est-ce un problème avec l'appel natif ne pas revenir en arrière.Je n'ai aucune idée,tesseract ocr multipage pdf se bloque

S'il vous plaît laissez-moi savoir si il ya une solution à ce problème, dès que possible.

Cordialement
Vish

Répondre

0

Tess4J supporte PDF de plusieurs pages et TIFF de plusieurs pages. Substituez votre fichier PDF dans le test élémentaire et essayez-le.

Questions connexes