Tout dépend de la façon dont ils ont inclus les données dans le PDF. En général, il y a deux scénarios possibles ici:
Les données sont juste un objet texte dans un fichier PDF. Vous devrez utiliser un outil pour extraire le texte du fichier PDF, puis l'insérer dans votre base de données.
Les données sont contenues dans les champs de formulaire d'un fichier PDF. Vous devrez utiliser un outil pour extraire les données des champs de formulaire et l'insérer dans votre base de données.
Espérons que le scénario n ° 2 s'applique à vous parce que c'est précisément pour cela que les formulaires PDF sont conçus. Le scénario n ° 1 est vraiment un hack que vous utiliseriez uniquement si vous n'aviez pas d'autres options. L'extraction de texte en clair à partir d'un fichier PDF n'est pas aussi simple et précise que vous pourriez l'imaginer.
Si vous recevez un formulaire PDF, tout ce que vous devez faire est de faire correspondre les champs du formulaire PDF avec les champs correspondants dans votre base de données, puis aspirer les données. Ce processus pourrait être entièrement automatisé si vous avez écrit votre propre application.
Serait-ce besoin d'écrire une application ou est-il un moyen automatisé de faire cela?
Oui, ces deux options nécessitent l'écriture d'une application ou l'achat d'une application. Si vous écrivez votre propre application, vous devez trouver une bibliothèque PDF tierce qui prend en charge la récupération des données à partir des champs de formulaire ou l'extraction de texte à partir d'un fichier PDF.
Pas de réponse précise ici, Fermin, avez-vous eu les outils pour extraire? – CallMeLaNN
@CallMeLaNN - Mon entreprise a conclu un accord avec la 3ème partie qui fournit les données de sorte que je n'ai pas été obligé d'écrire quoi que ce soit pour le faire. – Fermin