J'aimerais pouvoir lire le contenu des documents Office (pour un moteur de balayage personnalisé).Documents de bureau d'analyse
La version de bureau qui doit être lisible est de 2000 à 2007. Je veux principalement explorer les documents Word, Excel et Powerpoint.
Je ne veux pas récupérer le formatage, seulement le texte qu'il contient.
Le moteur de balayage est basé sur lucene.NET si cela peut être utile et qu'il est en C#.
Je l'ai déjà utilisé iTextSharp pour l'analyse syntaxique PDF