Je vérifie si un document PDF est consultable si je peux obtenir du texte à partir de chaque page d'un fichier PDF.Validation des fichiers PDF (Image + Texte PDF) validation
Mais vérifier chaque page semble prendre une éternité quand j'essaye d'extraire le texte d'un PDF qui contient plus de 500 ~ 2000 pages.
Est-il possible qu'un PDF contienne du texte pour une page mais pas pour le reste? Ce que je suis en train de faire ici est que, si une première page de PDF contient du texte, il est un PDF interrogeable autre non ..
@Chris: "PDF interrogeable" est quelque chose que vous pouvez rechercher du texte sur * dans * PDF, pas à partir du système de fichiers. – Sung