Quelqu'un sait-il d'une API/SDK ou IFilter dans .NET qui peut lire le sujet (métadonnées 'titre') et le texte des fichiers suivants:IFilter ou SDK pour de nombreux types de fichiers?
.PDF .DOC .XLS .PPT . CSV .TXT .DOCX .XLS .PPTX + les normes OpenOffice et Open Document. Open Source serait génial ... mais commercial est OK aussi.
Je ne trouve rien n'importe où!
Une autre alternative pour l'indexation de texte PDF est FoxIt Software. http://www.foxitsoftware.com J'ai trouvé leur PDF IFilter beaucoup plus fiable que Adobe. – dthrasher
Bien que ce ne soit pas un IFilter, je suis allé avec Aspose.NET pour lire des fichiers. Je suppose que l'on pourrait créer un wrapper IFilter pour Aspose.NET. – ben