2017-01-09 4 views
0

J'ai donc installé PDF Parser (http://www.pdfparser.org/). J'ai vérifié leur site Web et utilisé la démo. Cela m'a donné le résultat que je voulais. Après des heures de recherche sur comment utiliser un compositeur, j'ai finalement réussi à le faire fonctionner. Maintenant, je suis coincé avec le problème suivant comment obtenir le résultat de la démo. J'ai utilisé l'exemple de code donné sur la page de documentation. Il a extrait le texte mais tout le texte est sur la même ligne. Lorsque j'utilise la démo, chaque nouvelle page commence par un nouveau paragraphe et chaque morceau de texte est placé sur une ligne séparée. Code:Résultat 'Smalot PDF Parser': texte pas sur la même ligne

<?php 

// Include Composer autoloader if not already done. 
include 'vendor/autoload.php'; 

// Parse pdf file and build necessary objects. 
$parser = new \Smalot\PdfParser\Parser(); 
$pdf = $parser->parseFile('document.pdf'); 

// Retrieve all pages from the pdf file. 
$pages = $pdf->getPages(); 

// Loop over each page to extract text. 
foreach ($pages as $page) { 
    echo $page->getText(); 
} 

?> 

Comme je l'ai dit lorsque j'ai utilisé le code ci-dessus j'ai tout le texte sur une ligne. Ma question est comment puis-je obtenir le même résultat que le script sur la page de démonstration?

Répondre

0

J'ai eu le même problème. En boucle de cette façon avec nl2br

// Loop over each page to extract text. 
foreach ($pages as $page) { 
echo nl2br($page->getText()); 
}