Ma tâche consiste à utiliser IBM Watson pour convertir un fichier PDF en fichier texte ou toute sortie utile à ma tâche.Utilisation de IBM Watson Document Converter pour analyser les fichiers PDF
Le PDF est un ordre d'achat créé par un client et envoyé sous différents formats. Le client peut créer ces bons de commande comme il le souhaite, et je dois les analyser.
J'ai essayé d'utiliser le convertisseur de document avec les paramètres par défaut et la sortie est partout. Tout conseil pour aborder ce serait formidable ... peut-être quelque chose du genre de l'utilisation de l'intelligence d'IBM Watson pour mieux trouver les informations requises dans ces bons de commande même quand ils ne sont pas définis avec.
Merci pour toute aide.
Juste pour ajouter à cela. Ce que vous voyez dans un PDF n'est pas toujours ce qu'un ordinateur verra. Le texte peut être stocké hors séquence, ou un graphique (capture d'écran) peut être affiché, tandis que le texte sous-jacent n'est pas lié à ce qui est vu. Le moyen le plus rapide de tester est d'essayer de copier/coller du texte dans un éditeur de texte et de voir les résultats. Si ce n'est pas parfait, la conversion est peu susceptible de faire beaucoup mieux. –