J'essaye de convertir le pdf au dossier de csv. fichier pdf a des données au format tabulaire avec la première ligne comme en-tête. J'ai atteint le niveau où je peux extraire le texte d'une cellule, comparer la ligne de base du texte dans la table et détecter la nouvelle ligne mais j'ai besoin de comparer les bordures de table pour détecter le début de la table. Je ne sais pas comment détecter et comparer les lignes en PDF. Quelqu'un peut-il m'aider?Comment faire pour détecter le début de la table dans itextSharp?
Merci !!!
+1; Je suis d'accord sur la description générale. En ce qui concerne la manière d'inspecter le contenu de la page, je proposerais l'utilisation du paquet d'analyseur iText au lieu d'une inspection manuelle du contenu de la page. – mkl
Existe-t-il un analyseur pour les formes/lignes dans iText? –
Pas encore, mais les classes du paquet analyseur sont assez faciles à étendre pour fournir également des informations sur les chemins. Plus important, cependant, les classes de l'analyseur fournissent des informations assez précises sur les largeurs de texte et les positions aux RenderListeners. Pour récupérer manuellement les mêmes informations, il faudrait prendre en compte certains opérateurs possibles. – mkl