Je veux lire le contenu des types de fichiers suivants en utilisant C#:contenu du fichier de lecture à l'aide de C#
- RTF
- HTML
- MS Word
Y at-il API commune dans .Net pour lire tous les contenus de type de fichier?
Je veux lire le contenu des types de fichiers suivants en utilisant C#:contenu du fichier de lecture à l'aide de C#
Y at-il API commune dans .Net pour lire tous les contenus de type de fichier?
La plupart de ces types de fichiers ne sont pas pris en charge. HTML est un texte brut, vous pouvez donc utiliser System.IO/StreamReader pour le lire, mais vous devez l'analyser vous-même.
Il existe des composants tiers qui liront ces types de fichiers, mais je ne suis pas sûr qu'il existe un composant englobant tout.
Pour les PDF, je crois que vous permet de lire.
Pour RTF/Word, vous pouvez utiliser le Primary Interop Assemblies
Si vous allez à l'index texte intégral des données, regarder dans Lucene, il peut gérer ces types de fichiers.
J'ai utilisé Aspose avant que ce soit un produit très puissant, il est raisonnablement cher donc ne le recommande que si votre application a également besoin de créer de nouveaux documents word/pdf/rtf. Je suis d'accord avec les autres commentaires sur l'utilisation de System.IO pour lire les fichiers HTML.
Définir 'lecture' – jfclavette
ouvrir le fichier et lire son contenu –