Je reçois cette erreur "No/Root object! - Est-ce vraiment un PDF?" en utilisant mon ordinateur MAC avec Python 2.7 et PDFMiner version 20110515. Les fichiers pdf ne sont pas endommagés car le même programme avec les mêmes fichiers fonctionne sur mon ordinateur PC! J'ai aussi essayé beaucoup de fichiers PDF et cette erreur existe pour tous. Des idées de ce que je devrais changer dans mon MAC pour ne pas obtenir cette erreur?Erreur Python PDFMiner: "Objet No/Root - Est-ce vraiment un PDF?"
2
A
Répondre
2
J'ai trouvé la source du problème:
J'ai eu une méthode pour lire tous les fichiers dans un répertoire et les analyser. Il s'avère que j'avais un fichier caché dans ce répertoire qui n'était pas un fichier pdf!
Voici comment je fixe le problème:
for filename in os.listdir(INPUT_DIR_NAME):
if filename.endswith('.pdf'):
#do stuff!
Questions connexes
- 1. Pdfminer python 3.5
- 2. Conversion PDF en html avec PDFminer
- 3. séparée pdf à l'aide de pages pdfminer
- 4. Outil PDFMINER pdf2txt accoler l'ordre des données
- 5. Comment convertir plusieurs fichiers pdf d'un dossier au format txt en utilisant le code python pdfminer
- 6. python pdf ligne par ligne
- 7. getElementsByTagName objet requis? Vraiment coincé!
- 8. Python: erreur objet chargement JSON
- 9. Python BigQuery délai vraiment étrange
- 10. Mettez en surbrillance le texte dans un PDF avec Python
- 11. Générer un pdf avec python
- 12. Python: caractères spéciaux me causant des problèmes (à partir de PDFminer)
- 13. C3861 Erreur (j'ai vraiment essayé)
- 14. vraiment supprimer les nœuds XMLParser objet Groovy
- 15. vraiment, vraiment supprimer un élément d'une liste de bouclage en Python
- 16. est mupdf pdf bibliothèque vraiment open-source GPL?
- 17. problème vraiment bizarre avec shelve (python)
- 18. L'encodage Python ralentit vraiment mon application
- 19. Convertir pdf en jpg en utilisant python 2.7- une erreur
- 20. fichier pdf avec python
- 21. Chemin d'accès chemin vraiment donné à Python
- 22. Objet indirect PDF, ressource CFF
- 23. Comment s'assurer qu'un objet va vraiment être déplacé?
- 24. Vérification d'intégrité Python PDF
- 25. WxPython: Comment afficher un objet fichier pdf dans un wxPanel?
- 26. PdfSharp, erreur affichant un JPG en PDF
- 27. prévu un objet tampon de caractères erreur
- 28. Vraiment, vraiment grand UIScrollViews
- 29. vraiment un comportement étrange
- 30. Utilisation de PDFminer comme bibliothèque: "AttributeError: l'objet 'NoneType' n'a pas d'attribut 'getobj'"
version 20110515 de PDFMiner est une version bêta, donc il peut avoir des bugs. Heureusement, c'est du pur Python, qui peut faciliter le débogage. Le problème que vous décrivez peut être dû à la façon dont les fins de ligne sont traitées dans les fichiers en cours d'analyse. Assurez-vous qu'ils sont ouverts en mode binaire, c'est-à-dire 'fp = open ('mypdf.pdf', 'rb')'. Il peut également être utile d'exécuter l'utilitaire 'dumppdf.py' inclus dans les fichiers de problèmes. Enfin, l'erreur peut être due au fait que l'interpréteur Python varie d'une machine à l'autre. Le support de nouvelle ligne universel n'est pas intégré à toutes les versions de Python. – martineau