Existe-t-il un moyen fiable d'extraire du texte à partir de PDF? La première idée qui vient à l'esprit est que PDF peut avoir plusieurs colonnes et le mécanisme d'extraction a besoin de connaître la structure logique en quelque sorte. Je comprends que certains documents PDF sont «taggés», mais je devrais prendre en charge à peu près n'importe quel document PDF.Extraction de texte d'un document PDF - C#
Des composants tiers à la rescousse ici?
duplication possible de [Extraction de texte à partir de PDF en C#] (http://stackoverflow.com/questions/2116440/extracting-text-from-pdfs-in-c-sharp) –