2011-06-30 6 views
3

Je sais que cette question a été posée plusieurs fois. Et j'ai vérifié tout mais aucun donnait des réponses satisfaisantes.analyse pdf en utilisant php

Certains disent que TCPDF peut analyser mais j'ai cherché sur son site. rien n'est donné pour lire le pdf. thn xpdf-xpdf est un utilitaire qui doit être installé sur le serveur et exécuter des commandes pour extraire le texte.

J'ai même cherché FPDF mais dans ce site aussi rien n'est donné à propos de la lecture du pdf ou de toute fonction liée à readin en manuel.

Alors est-ce que je dois utiliser pdfbox et java bridge pour extraire le texte ..? ou est-ce que certaines personnes peuvent répondre qu'il est possible d'utiliser tcpdf.

quoi préférer maintenant ...?

+0

Un PDF est simplement un code Postscript. À moins que le texte ne soit incorporé dans une image, vous devriez être capable de regarder le code postscript brut et d'extraire le texte en utilisant les opérations d'entrée/sortie de fichier de base. –

Répondre

1

Je pense que le statut est en grande partie le même qu'il était: il n'y a pas d'implémentations natives PHP d'un analyseur PDF. Il y a command line alternatives et je sais qu'il y a des implémentations dans d'autres langages (j'utilise personnellement la librairie Python), mais pas de PHP natif.

Questions connexes