2012-03-12 5 views
0

Je développe une application mobile qui convertit pdf en HTML. J'ai trouvé PDFBox, qui fonctionne très bien. J'ai obtenu le texte PDF ou html d'un côté et les autres images. Mais je veux aller un peu plus loin, j'ai besoin que le html généré contienne les images en pdf. Peut-il être fait avec PDFBox? Comment? Si vous connaissez une autre fonction de bibliothèque gratuite pour ce faire, dites-le moi.PDFBOX: Convertir un pdf en texte ou html, y compris les images du pdf

Merci d'avance.

Répondre

1

Jetez un oeil à ExtractImages.java - cela vous guidera sur la façon d'extraire des images à partir d'un fichier PDF.

Ensuite, examinez l'exemple PrintImageLocations.java - vous aurez besoin de ces emplacements pour formater correctement le fichier HTML.

+1

Merci, j'ai eu cette idée mais c'est très complexe de travailler avec les coordonnées x et y. Maintenant j'essaye de trouver l'endroit qui analyse les images, puis essaye de les modifier. – Josechu

Questions connexes