2009-09-05 10 views
-4

dans mon script php je veux convertir un fichier PDF au format html et en faisant cela le contenu du fichier html générés ne devrait pas être dérangé ....pdf à la conversion html en php

j'ai trouvé http://sourceforge.net/projects/pdftohtml/ mais est un outil de ligne de commande et nécessite un accès shell. La deuxième chose est généré le contenu du fichier html être dérangé ..

+2

Vous avez déjà posé la même question: http://stackoverflow.com/questions/1383176/pdf-to-html-conversion -in-php – AAA

+0

Pas tout à fait la même question si vous regardez au-delà du titre, mais toujours très confuse. – pavium

+0

hey Jamie Lewis, s'il vous plaît lire à nouveau les deux questions, les deux sont différents. –

Répondre

1

La commande shell peut-elle être exécutée à partir de php?

$rtn = exec ('CLI Command to execute', $emptyVartoCaptureOutput); 

La commande est exécutée dans le shell, exécuter dans le contexte de l'utilisateur exécutant le script php (_WWW ou similaire pour exécuter des scripts de serveur web apache). Toute la sortie de la commande est capturée dans un tableau lorsque vous fournissez le second argument optionnel.

Cela ressemble à ceci pourrait résoudre votre problème.

En réponse à votre commentaire:

L'outil vous faites référence dans votre message original est l'outil de ligne de commande que vous exécutez - vous devez comprendre la commande exacte pour exécuter y compris et tous les arguments pour cette commande.

Je ne suis pas familier avec l'outil que vous référencez, mais je suppose qu'il a plusieurs options. Un couple d'options importantes à regarder sont où le HTML généré va. Je suppose que cela peut aller soit à un fichier (qui aurait besoin de _WWW pour avoir des permissions d'écriture sur un répertoire qui présente un énorme risque de sécurité) soit à sortir. Lorsque vous utilisez la commande exec de php, toute sortie envoyée vers std out est sauvegardée en tant que tableau, nouvel élément pour chaque nouvelle ligne, lorsque vous passez la fonction exec à un deuxième paramètre facultatif. Ainsi, vous devriez être capable de capturer et de manipuler et/ou d'afficher dynamiquement le HTML généré à partir de votre script.

Pour une simple page html qui affiche uniquement le code HTML d'un pdf, vous pourriez faire quelque chose comme ceci:

<std header stuff omitted for brevity> 
<?php 
$rtn = exec('CLI Command to Execute -a option1 -b option2', $ouputted_html); 
foreach ($ouputted_html as $val){ 
    echo $val . "\n"; 
} 
?> 
</body> 
</html> 

Vous pouvez utiliser imploser echo ("\ n", outputted_html de $); à la place de la boucle foreach pour accomplir la même chose, mais la boucle foreach vous permet un certain contrôle sur chaque ligne si vous choisissez d'en profiter.

Notez que le code HTML généré peut contenir ou non des informations d'en-tête, vous devrez expérimenter et voir. Évidemment, vous pouvez ajouter ce dont une page html standard a besoin ou soustraire si déjà fourni. Donc, vous avez maintenant la base pour afficher les fichiers pdf comme HTML, si vous avez besoin d'aide spécifique avec les subtilités de l'outil, je vous suggère de chercher un forum ou un serveur de liste dédié à cet outil ou demander de l'aide du développeur (s) après avoir lu les documents et les FAQ.

+0

Scott, peut suggérer n'importe quelle application de ligne de commande.Merci d'avance –

+0

Vous pourriez envisager de voter pour des réponses que vous trouvez utiles, même si elles ne répondent pas complètement à votre question. Je vais modifier ma réponse originale pour répondre à votre commentaire. – Scott

+0

+1 bonne réponse mate – jycr753

0

Votre meilleur pari peut être de trouver un convertisseur PDF au format HTML et d'étudier le code source.

Il y a beaucoup de convertisseurs en ligne autour, apparemment. Google propose de convertir n'importe quel fichier PDF trouvé dans une recherche et l'appelle 'voir en HTML'