Y at-il une bibliothèque qui peut ouvrir et rechercher dans un fichier pdf? De préférence en C, python ou ruby ...Y at-il une bibliothèque qui peut ouvrir et rechercher dans un fichier pdf?
Répondre
Il existe différentes bibliothèques pour l'extraction de texte à partir de fichiers PDF. C'est un peu court de "chercher" mais cela devrait être facile à faire.
Pour Ruby, essayez PDF::Toolkit.
Pour Python il y a pyPdf:
pdf = pyPdf.PdfFileReader(file(path, "rb"))
content = pdf.getPage(1).extractText()
J'ai regardé en utilisant Apache PDFBox pour quelque chose de similaire mais je n'ai jamais fini par l'utiliser. C'est une bibliothèque Java, mais Java joue bien avec d'autres langages.
Cette bibliothèque Ruby gnome a une sous-bibliothèque appelée poppler pour le rendu pdfs. http://ruby-gnome2.sourceforge.jp/hiki.cgi?Ruby%2FPoppler
Il peut également extraire des parties du pdf sous forme de texte. Il peut également trouver des rectangles dans le document pdf qui contiennent le texte que vous recherchez. Ces méthodes sont dans la classe "Page".
http://ruby-gnome2.sourceforge.jp/hiki.cgi?Poppler%3A%3APage
Hope this helps
- 1. Ouvrir un fichier dans une fonction et y écrire
- 2. Comment ouvrir un fichier PDF?
- 3. Comment ouvrir un fichier pdf dans thickbox?
- 4. Ouvrir un fichier PDF dans une application externe sur iPad
- 5. Comment ouvrir un fichier et rechercher un mot?
- 6. ouvrir le fichier pdf dans l'application console
- 7. MVC ouvrir le fichier pdf
- 8. En utilisant itextsharp (ou une bibliothèque C# pdf), comment ouvrir un PDF, remplacer du texte et le sauvegarder à nouveau?
- 9. Comment rechercher un fichier dans la bibliothèque java swing?
- 10. iPhone: pouvons-nous ouvrir le fichier pdf en utilisant UIWebView? Peut-on ouvrir le fichier pdf à partir d'UIWebView?
- 11. Existe-t-il une bibliothèque qui peut générer une forme de pdf comme Adobe Acrobat?
- 12. Peut python ouvrir un fichier mp3
- 13. Comment rechercher et ouvrir un fichier dans un complément Visual Studio 2005?
- 14. Comment ouvrir un lien dans un fichier PDF dans une nouvelle fenêtre?
- 15. Y a-t-il une bibliothèque qui peut prendre une image et effectuer un traitement pour en déterminer les éléments?
- 16. Y at-il une bibliothèque qui peut faire une conversion raster en vecteur, pour l'iPhone?
- 17. Y at-il une bibliothèque qui colle un bouton de zoom avant/arrière sur une image et permet + et -
- 18. VB.NET shell ouvrir le fichier PDF à une page spécifique
- 19. Comment inviter un utilisateur à ouvrir ou enregistrer un fichier PDF renvoyé par un fichier .aspx?
- 20. Comment ouvrir un PDF dans Sitecore
- 21. Comment ouvrir les PDF et lire?
- 22. recherche PDF texte et d'une bibliothèque divisée
- 23. Ouvrir le fichier et enregistrer
- 24. Rechercher et remplacer une chaîne dans un fichier
- 25. Ouvrir un fichier PDF avec du texte PHP et dans ce
- 26. Rechercher par programme du texte dans un fichier PDF et indiquer le numéro de page?
- 27. iTextSharp peut-il ouvrir un document RTF, le manipuler et exporter le document au format PDF?
- 28. Ouvrir le fichier pdf à partir du serveur dans GWT
- 29. Y at-il une bibliothèque d'imagerie qui peut vous faire paraître plus mince?
- 30. Comment ouvrir un fichier PDF dans Google Chrome dans un nouvel onglet?
double: http://stackoverflow.com/questions/58730/open-source-pdf-library-for-c-c-application –
@Jurily. La question que vous liez à propos de la génération de fichiers PDF. Cette question concerne l'examen du contenu d'un PDF. Ils ne sont pas des doublons. –
Vous avez essayé google? 'lire le fichier pdf python c ruby' me donne des résultats – mrk