2009-10-08 8 views
1

Quelqu'un sait-il d'une API/SDK ou IFilter dans .NET qui peut lire le sujet (métadonnées 'titre') et le texte des fichiers suivants:IFilter ou SDK pour de nombreux types de fichiers?

.PDF .DOC .XLS .PPT . CSV .TXT .DOCX .XLS .PPTX + les normes OpenOffice et Open Document. Open Source serait génial ... mais commercial est OK aussi.

Je ne trouve rien n'importe où!

Répondre

1

Je ne pense pas que vous serez en mesure de trouver un IFilter unique qui sera en mesure d'accéder au contenu de tous ces types. Typiquement, un IFilter sera pour une technologie spécifique.

Par exemple, Adobe have one for PDFs, Microsoft fournit un pour Office qui peut faire Word, Excel, Powerpoint, CSV (que je crois est livré pré-installé avec Windows).

+0

Une autre alternative pour l'indexation de texte PDF est FoxIt Software. http://www.foxitsoftware.com J'ai trouvé leur PDF IFilter beaucoup plus fiable que Adobe. – dthrasher

+0

Bien que ce ne soit pas un IFilter, je suis allé avec Aspose.NET pour lire des fichiers. Je suppose que l'on pourrait créer un wrapper IFilter pour Aspose.NET. – ben

Questions connexes