2010-11-27 9 views
5

J'ai obtenu une aide précieuse ici (section de code) pour le déchargement d'un document Word en texte. Maintenant, je suis à la recherche d'aide pour le dumping d'un document PDF (* .pdf) en texte? J'utilise Delphi 2010. Je préférerais une solution non-composante, non-Active-X, car ce code sera incorporé dans mon propre composant.en train de déposer un document PDF (* .pdf) en texte?

Merci

Répondre

3

PDFtext peuvent le faire. Vous devrez payer 57 $ et déployer une DLL supplémentaire, cependant.

+0

Cela peut être une réponse acceptable, mais je vais attendre un peu plus longtemps pour voir si quelqu'un d'autre a une option gratuite. Je vous remercie. – IElite

+0

Je devrais peut-être ajouter que j'utilise PDFtext et fonctionne bien pour moi. – gabr

+0

Je suppose que c'est ma seule option! – IElite

4

Pour autant que je sache, vous avez deux options gratuites.

D'abord, il est un outil de ligne de commande dans le package xpf librement disponible à partir http://www.foolabs.com/xpdf

Puis, un autre outil de ligne de commande dans le projet http://mupdf.com

deux peuvent être appelés facilement de Delphi. J'ai utilisé le fichier pdftotext.exe de xpdf sans aucun problème.

+0

Merci, je vais vérifier cela et revenir à vous! – IElite

+0

J'ai téléchargé les deux. Le XPDF semble prometteur, mais je n'arrive pas à comprendre comment fonctionne le fichier de configuration. J'ai regardé le fichier Sample xpdfrc et je ne vois rien là-dedans qui montre la configuration pour le fichier d'entrée ou de sortie. L'outil mudpf me semble avoir été livré avec une application gui et quelques outils en ligne de commande (dont pdfshow, pdfextract, pdfinfo - que la page web décrit) - merci! – IElite

1

J'ai utilisé la bibliothèque QuickPDF pour trouver du texte dans des fichiers PDF. J'utilise la fonction

GetPageText(ExtractOptions: Integer): string; 

pour obtenir le texte de chaque page afin qu'il puisse être recherché. Si vous utilisez 0 pour ExtractOptions, le texte sera renvoyé dans un format lisible. Ce n'est pas gratuit, mais la bibliothèque et la documentation sont très bien. En outre, un blog communautaire très actif est hébergé sur leur site Web.

+0

Merci, j'ai oublié de mentionner dans ma question, mais j'espérais une solution gratuite ou opensource. Je vérifierai sûrement si je ne trouve pas une solution libre ou onesource. – IElite