Existe-t-il une bibliothèque qui supprimera les mots de passe "propriétaires" des documents PDF afin que le texte puisse ensuite être extrait par programmation? Quelque chose comme PDF Technologies' Password Recovery tool, mais appelable de la ligne de commande ou de Python. Une interface graphique n'est pas vraiment utile pour moi, puisque le nombre de documents est si grand.Une bibliothèque existe-t-elle pour supprimer les mots de passe des fichiers PDF par programme?
S'il vous plaît, pas de commentaires sur la légalité du processus. Les fichiers PDF en question sont la propriété et le texte doit être extrait afin de former des nuages de mots-clés pour l'ensemble de documents.
C'est parfait, merci. L'utilitaire de ligne de commande fonctionnera le mieux pour moi. –