2010-03-08 11 views

Répondre

3

Google pdf2html, pdftohtml semble être le seul viable. et il est basé sur un programme en ligne de commande, pas PHP. cela ne vous sera peut-être pas utile. Google est capable de convertir, donc il peut y avoir un moyen de le faire avec GDocs aussi. mais je ne suis pas sûr de ça. En tout cas, j'espère que cela vous mènera au moins sur le bon chemin.

+0

Je ne sais pas php, mais probablement vous pouvez exécuter/appeler un script shell à partir de php (et capturer la sortie), donc cela fonctionnerait probablement –

+0

Absolument vous pouvez le faire, c'est pourquoi je l'ai soulevé, je ' Je ne suis pas sûr que google le laissera faire facilement ce qu'il veut. –

+0

excellente solution, merci! –

0

Vous ne pouvez pas. Les PDF sont des documents complexes contenant des polices incorporées, des graphiques vectoriels et des informations de mise en page qui ne peuvent pas être représentés en HTML de manière automatisée. Vous pourrez peut-être extraire le TEXTE du document, mais c'est à peu près tout.

1

J'ai essayé la commande pdftohtml de Poppler pour convertir des fichiers PDF en fichiers HTML. Check it out on La sortie du fichier HTML de Poppler est plus légère lorsqu'elle est utilisée mais la sortie n'est pas très précise.

Si vous voulez une sortie précise, vous devriez use pdf2htmlEX J'ai converti des fichiers PDF compliqués et j'ai obtenu la meilleure sortie HTML.

Questions connexes