2017-09-15 11 views
1

J'essaie d'utiliser le module PyPDF2 dans Python 3 mais je ne peux pas afficher la propriété 'Taille de la page'. Je voudrais savoir quelles étaient les dimensions de la feuille de papier avant de numériser au format PDF.Comment obtenir des métadonnées de fichier PDF 'Taille de la page' en utilisant Python?

Quelque chose comme ceci:

import PyPDF2 
pdf=PdfFileReader("sample.pdf","rb") 
print(pdf.getNumPages()) 

Mais je suis à la recherche d'une autre fonction Python au lieu de par exemple getNumPages() ...

Cette commande affiche ci-dessous une sorte de méta-données, mais sans taille de la page :

pdf_info=pdf.getDocumentInfo() 
print(pdf_info) 

Répondre

1

Ce code devrait vous aider:

import PyPDF2 
pdf = PyPDF2.PdfFileReader("a.pdf","rb") 
p = pdf.getPage(1) 

w_in_user_space_units = p.mediaBox.getWidth() 
h_in_user_space_units = p.mediaBox.getHeight() 

# 1 user space unit is 1/72 inch 
# 1/72 inch ~ 0.352 millimeters 

w = float(p.mediaBox.getWidth()) * 0.352 
h = float(p.mediaBox.getHeight()) * 0.352