J'ai lu le guide sur le site web itext mais je sais s'il est possible d'écrire sur le fichier pdf et ensuite d'ajouter le toc.Comment puis-je créer un index (table des matières) après que j'ai écrit sur un pdf avec itext 7 en Java?
Répondre
Cela dépend, si votre document est étiqueté, il devrait être facile de générer une table des matières. Sinon, vous allez plonger dans le monde de la reconnaissance de structure.
Vous voyez, PDF n'est pas un format WYSIWYG. Pensez-y plus comme un conteneur d'instructions, qu'un document texte. Obtenir n'importe quel texte d'un document PDF est un problème complexe (iText le rend juste facile). Cela implique le traitement des instructions d'analyse, le suivi de ce qui est rendu à quelles coordonnées, puis le tri selon l'ordre de lecture logique.
Et c'est juste pour obtenir du texte. Ce que vous voulez nécessite encore plus d'étapes pour comprendre où sont les paragraphes, et quels sont les extraits de texte susceptibles d'être des titres de sections et de sous-sections.
Je pensais pouvoir garder la première ligne de chaque page et je peux créer le toc avec cette ligne, mais si un chapitre est dans la même page qu'un autre? – thenoobdeveloper
Si vous voulez le faire de cette façon, il suffit d'obtenir le texte de chaque page. Et puis diviser sur newline. –