2009-09-07 5 views
1

Notre application Django a besoin de faire quelques choses avec uploadés fichiers PDF:Quelles sont les différentes options de traitement des fichiers PDF téléchargés dans une application Django?

  1. Vérifiez que le fichier est un fichier PDF et n'est pas corrompu
  2. Vérifiez que le fichier est pas crypté
  3. le comte nombre de pages

Nous rencontrons des problèmes avec une application malheureusement populaire qui est l'idée d'une exportation PDF non cryptée est en fait un fichier PDF crypté, juste avec un mot de passe vide. Nous avons travaillé avec PyPDF à ce jour, qui est incapable de lire ces fichiers parce que le cryptage est non standard. L'application qui exporte ces fichiers est très populaire parmi nos utilisateurs, ce qui est pénible.

Une autre application a exporté des fichiers avec un mauvais type MIME (quelque chose d'autre que application/pdf), donc tout ce que nous finissons à utiliser doit être capable de faire face à des points d'étouffement idiot comme ça.

Existe-t-il une bibliothèque PDF robuste et active, où que nous puissions utiliser? Même PDFtk, un utilitaire CLI que quelques personnes ont recommandé, a été mis à jour en 2006.

Toute aide est appréciée.

Mise à jour: Pour clarifier, cela peut être gratuit ou payant. Suggérez ce que vous pensez être la meilleure option.

Répondre

1

PDFlib est excellent, mais coûte de l'argent. Vous n'avez pas dit que ça devait être gratuit, bien qu'implicitement je suppose que vous le voulez! :)

Questions connexes