Comment analyser un fichier PDF et écrire le contenu dans un fichier Word en utilisant Java?Parse Pdf Fichier et écrire le contenu dans un fichier texte en utilisant java
Répondre
Pour l'analyse d'un fichier PDF en Java, vous pouvez utiliser Apache PDFBox: http://incubator.apache.org/pdfbox/
Pour la lecture/mot écrit (ou tout autre bureau) formats de fichiers en Java, essayez POI: http://poi.apache.org/
Les deux sont gratuits.
Vous pourriez vouloir essayer un de ces:
Une fois que vous lisez le contenu du fichier PDF, vous pouvez aussi bien les stocker dans un ODT fichier ou un fichier texte. Pour le fichier ODT, essayez http://odftoolkit.openoffice.org.
Meilleur!
Essayez la bibliothèque iText java:
iText est une bibliothèque idéale pour les développeurs qui cherchent à améliorer les applications et autres avec web locaux génération de documents PDF dynamique et/ou manipulation.
Il peut être utilisé pour votre étape d'analyse. En ce qui concerne la génération de documents Word - le OpenOffice Java API pourrait être capable de générer des documents compatibles Word (aucune expérience personnelle avec cette API).
Vous pouvez utiliser iText si le PDF source est principalement du texte. Les images et autres sont assez difficiles à manipuler lors de l'analyse. Si c'est du texte seulement, c'est aussi simple que 10 lignes de code. Voir le manuel d'iText pour des exemples.
Pour l'écriture de fichiers Word, il n'y a que des points d'accès Apache. Il peut être un peu difficile à comprendre, mais pour une tâche aussi simple, il ne devrait pas y avoir de problème.
- 1. Comment lire un fichier et écrire dans un fichier texte?
- 2. écrire du texte dans le fichier texte et l'enregistrer en utilisant saveDialog
- 3. Parse texte cité dans le fichier de commandes
- 4. Convertir PDF en fichier texte en utilisant VB.net
- 5. Écrire un fichier GIF en Java
- 6. écrire un BitSet dans un fichier en Java
- 7. (java) Écrire dans le fichier little endian
- 8. écrire à un fichier texte dans php
- 9. Contenu du fichier de vidage (.ds) dans un fichier texte
- 10. Supprimer le contenu d'un fichier en Java
- 11. Parse un fichier txt
- 12. Parsing un fichier HTML en utilisant Java
- 13. Ouvrir un fichier et écrire le contenu dans un DIV, span, label, une sorte de conteneur
- 14. Comment écrire des données dans un fichier texte dans BlackBerry?
- 15. Analyse de fichier texte en Java
- 16. Extraire le contenu de cmd.exe IDE dans un fichier texte en utilisant des scripts autohotkey
- 17. Obtenir des champs dans un fichier PDF en utilisant PHP
- 18. écrire dans le fichier de commandes pour lire le texte dans un fichier et le copier dans un autre fichier texte
- 19. Comment créer un fichier zip en Java
- 20. Lire un fichier distant en utilisant Java
- 21. Écrire un fichier XML (en utilisant XStream) sur un système de fichiers en Java
- 22. Conversion Pdf en Swf en utilisant Java
- 23. Comment sauvegarder du texte en php en fichier pdf?
- 24. Extraction de texte d'un fichier PDF
- 25. Lire un fichier et l'éditer en Java
- 26. PHP écrire dans le fichier
- 27. Renommer un fichier/dossier dans un fichier zip en Java?
- 28. Applet Java signé écrit dans un fichier texte
- 29. Faxer un fichier PDF en utilisant l'application .Net
- 30. Ouverture de plusieurs documents PDF en utilisant le fichier batch
Vous pouvez également utiliser docx4j pour écrire le docx. Comme POI, c'est gratuit. – JasonPlutext