2017-03-07 1 views
0

Existe-t-il un moyen d'obtenir du texte qui existe à l'intérieur de la frontière de couleur spécifique disons "rouge". est-il possible de tout le texte qui existe dans la boîte de bordure "rouge" côté de pdf en utilisant C#. Je l'avais googlé mais je n'ai pas trouvé de toute façon obtenir du texte avec le format de style de pdf.comment extraire le texte de pdf en utilisant C#

enter image description here

+2

Copie possible de [Extraction de texte à partir de PDF en C#] (http://stackoverflow.com/questions/2116440/extracting-text-from-pdfs-in-c-sharp) – tretom

+0

Malheureusement, vous ne pouvez pas analyser PDF comme vous le faites HTML. Je pense que @Joe Irby a la meilleure solution ... trouver une option de tierce partie. Mais ce ne sera pas facile. –

+0

L'OP a déjà tagué sa question [tag: pdfbox] qui concerne une bibliothèque tierce pour la gestion de PDF. Je pense qu'il demande effectivement comment implémenter sa tâche en utilisant PDF Box. – mkl

Répondre

0

La réponse est simple, malheureusement. Habituellement, lorsque les programmeurs ont besoin d'écrire du code qui peut analyser du texte à partir de fichiers PDF (ce que vous essayez de faire), ils utilisent des bibliothèques de code tierces que d'autres personnes ont écrites spécifiquement pour manipuler des fichiers PDF. Dans le monde C#, il existe quelques options pour les bibliothèques de manipulation PDF bien connues, mais celles qui sont les plus faciles à utiliser ne sont pas gratuites. J'ai personnellement eu de bons résultats en utilisant une bibliothèque appelée iTextSharp, mais ce n'est pas gratuit.

+0

L'OP a déjà tagué sa question [tag: pdfbox] qui concerne une bibliothèque tierce pour la gestion de PDF. Je pense qu'il demande effectivement comment mettre en œuvre sa tâche en utilisant PDF Box, pas comment le faire sans une bibliothèque. – mkl