Je suis à la recherche d'un utilitaire ou d'une bibliothèque pour extraire du texte à partir de fichiers PDF et le mettre en forme en texte brut tout en conservant le plus possible la disposition d'origine (tables, colonnes, etc.).conversion PDF en format ASCII - quel est l'état de l'art?
Nous utilisons actuellement pdftotext mais je me demandais s'il y avait quelque chose de mieux. Il doit s'agir d'un outil de ligne de commande ou d'une bibliothèque que nous pouvons lier à notre application.
Est-ce que pdftotext est aussi bon que ça, ou y at-il quelque chose de mieux?
Il y a beaucoup de bibliothèque de pdf ... Juste google il. –