2009-11-11 3 views
4

Y at-il une bibliothèque qui peut ouvrir et rechercher dans un fichier pdf? De préférence en C, python ou ruby ​​...Y at-il une bibliothèque qui peut ouvrir et rechercher dans un fichier pdf?

+0

double: http://stackoverflow.com/questions/58730/open-source-pdf-library-for-c-c-application –

+0

@Jurily. La question que vous liez à propos de la génération de fichiers PDF. Cette question concerne l'examen du contenu d'un PDF. Ils ne sont pas des doublons. –

+0

Vous avez essayé google? 'lire le fichier pdf python c ruby' me donne des résultats – mrk

Répondre

5

Il existe différentes bibliothèques pour l'extraction de texte à partir de fichiers PDF. C'est un peu court de "chercher" mais cela devrait être facile à faire.

Pour Ruby, essayez PDF::Toolkit.

Pour Python il y a pyPdf:

pdf = pyPdf.PdfFileReader(file(path, "rb")) 
content = pdf.getPage(1).extractText() 
0

J'ai regardé en utilisant Apache PDFBox pour quelque chose de similaire mais je n'ai jamais fini par l'utiliser. C'est une bibliothèque Java, mais Java joue bien avec d'autres langages.

Questions connexes