Je suis en train d'extraire le texte à partir du pdf (lien de fixation) avec le code (lib itext7) ci-dessous:Essaye Ouvrir un PDF, je reçois l'erreur « Impossible de trouver des données d'image ou d'assurance-emploi » avec lib iTextSharp 7
public static PageDescribe GetTextFromPage(PdfDocument fullDoc, int pageNum)
{
if (pageNum < 1)
return null;
else
{
PdfPage page = fullDoc.GetPage(pageNum);
if (page == null)
return null;
else
{
LocatedTextStrategy lStrat = new LocatedTextStrategy();
string s = PdfTextExtractor.GetTextFromPage(page, lStrat,);
DateTime _startPoint = DateTime.Now;
lStrat.Points.Defragmentation();
PageDescribe _res = new PageDescribe(pageNum, lStrat.Points);
return _res;
}
}
}
}
mais je reçois l'erreur ne peut pas trouver des données d'image ou d'assurance-emploi:
Si je supprime manuellement le logo initial du pdf cette erreur ne se produit pas. Mais je ne peux pas changer le système source qui fournit ces fichiers.
Quelqu'un a des suggestions?
Pourriez-vous montrer une partie/le code pertinent de 'LocatedTextStrategy'? –
Il semble également 'PdfTextExtractor.GetTextFromPage();' prend 3 arguments, [comme ici] (https://stackoverflow.com/a/5003230/6741868). –
Salut @Keyur, j'utilise itext7, il y a 3 surcharges. La première surcharge ne reçoit que Pdfpage, la deuxième surcharge reçoit PdfPage et ITextExtractionStrategy (mon code). La surcharge Thrid reçoit PdfPage, ITextExtractionStrategy et IDictionary. Le PdfReader, comme votre lien, n'est pas nécessaire –