2009-04-22 10 views

Répondre

2

La plupart de ces types de fichiers ne sont pas pris en charge. HTML est un texte brut, vous pouvez donc utiliser System.IO/StreamReader pour le lire, mais vous devez l'analyser vous-même.

Il existe des composants tiers qui liront ces types de fichiers, mais je ne suis pas sûr qu'il existe un composant englobant tout.

Pour les PDF, je crois que vous permet de lire.

Pour RTF/Word, vous pouvez utiliser le Primary Interop Assemblies

0

Si vous allez à l'index texte intégral des données, regarder dans Lucene, il peut gérer ces types de fichiers.

1

J'ai utilisé Aspose avant que ce soit un produit très puissant, il est raisonnablement cher donc ne le recommande que si votre application a également besoin de créer de nouveaux documents word/pdf/rtf. Je suis d'accord avec les autres commentaires sur l'utilisation de System.IO pour lire les fichiers HTML.

Questions connexes