Cela dépend en grande partie de la façon dont le document est "aplati". Vous pouvez facilement accéder aux liens, titres de pages, icônes, etc., mais pour autant que je sache, vous n'avez pas affaire à un document parallèle au DOM HTML, dans lequel tout peut être référencé en de façon.
Lorsqu'un document PDF est créé, même à partir d'une application en couches telle qu'Illustrator, des parties du document sont fusionnées (aplaties) pour réduire la taille du fichier. Chaque nouvelle couche de présentation peut contenir ce qui, pour le concepteur original, peut avoir été sans rapport et/ou des éléments discontinus. Quelque chose dans le coin supérieur droit d'une page peut être fusionné avec quelque chose qui n'a apparemment rien à voir en bas à gauche.
Tout dépend des paramètres utilisés par le créateur du document. Gardez à l'esprit que celui qui l'a créé peut même avoir choisi de ne pas convertir les éléments au format PDF - par exemple, il est permis d'importer des pages entières sous la forme de fichiers image uniques. Lorsque les éléments sont pouvant être adressés, vous devez souvent faire une boucle comme des éléments à la recherche d'un élément nommé (comme une page, un titre ou une icône).
Hm, intéressant. J'en connaissais un peu, mais pas tous. Puis-je demander, ce que sont les "icônes"? Est-ce la barre d'outils, ou sont-ce des entités nommées dans le fichier? – Boldewyn
@Boldewin; Les icônes sont les icônes associées aux boutons uniquement. (Je sais, assez boiteux ... Malheureusement, jusqu'à présent, je ne suis pas très impressionné par les API Adobe.) – Robusto