Selon ma compréhension,Est-ce que pdfbox peut extraire des images vectorielles?
1. .eps format images are vector images.
2. When we draw something in word (like a flowchart) that is stored
as a vector image.
Je suis presque sûr de la première, pas sûr de la seconde. S'il vous plait corrigez moi si je me trompe. En supposant ces deux choses, quand un fichier latex (où les images .eps sont insérées) ou un fichier Word (qui contient des images vectorielles) est converti en pdf, les images sont-elles converties en images raster?
En outre, je pense que PDFBox
/xpdf
ne peut extraire des images raster du pdf (car ils sont intégrés comme XObjects
), et non des images vectorielles. Cette compréhension est-elle correcte? This question dans stackoverflow est associé, mais n'a pas encore reçu de réponse.
Merci pour votre réponse. J'ai eu la réponse à ma première question, mais comme je n'ai pas eu la réponse à la deuxième question, je garde cela ouvert en ne l'acceptant pas encore. BTW, est-il un moyen de savoir si nous avons une image vectorielle dans un fichier pdf? Inkscape peut le faire, mais j'ai besoin d'un logiciel batch comme PDFBox/xpdf. – rivu
Nous commençons rapidement à avoir des problèmes de définition avec ce genre de questions. Si une page est vide, contient-elle des opérations de dessin vectoriel (pas des images, s'il vous plaît, celles-ci ont un sens tout à fait différent). Maintenant, que diriez-vous si je dessine un rectangle blanc dessus? Que faire si je dessine un rectangle de couleur, mais à l'extérieur de la boîte de média, ou à l'intérieur de la boîte de média mais à l'extérieur de la boîte de recadrage? Je n'accepterais pas ma réponse ci-dessus car elle ne traite que la moitié de votre problème. Vous devez penser à ce que vous voulez faire avec les opérations de dessin vectoriel, comment vous voulez les stocker après l'extraction. – KenS