J'essaye d'extraire quelques informations du pdf. J'essaie d'utiliser getpdftext.pl
à partir du module CAM::PDF
. Quand je viens de courir $~ getpdftext.pl sample.pdf
, il produit un texte du pdf à stdout.pdf d'analyse en perl
Mais je pense à écrire ceci dans un fichier texte et à analyser les champs obligatoires dans Perl. Quelqu'un peut-il me guider s'il vous plaît sur la façon de faire cela?
Mais quand j'essaie d'appeler pdftotext.pl
à l'intérieur de mon script perl, j'obtiens une erreur No such file
.
#program pour extraire le texte de pdf et l'enregistrer dans un fichier texte
use PDF;
use CAM::PDF;
use CAM::PDF::PageText;
use warnings;
use IPC::System::Simple qw(system capture);
$filein = 'sample.pdf';
$fileout = 'output1.txt';
open OUT, ">$fileout" or die "error: $!";
open IN, "getpdftext.pl $filein" or die "error :$!" ;
while(<IN>)
{
print OUT $fileout;
}
merci mob, - | option aidée – sandyutd