2009-07-07 6 views
0

J'ai une application ASP.NET qui autorise le téléchargement de documents Word 2007. Une fois qu'ils sont téléchargés, je voudrais analyser le texte du document et aussi tous les commentaires faits par les critiques. J'aimerais pouvoir obtenir les commentaires et les initiales/nom du commentateur.Lire le fichier Word 2007 et extraire le texte, les commentaires et le nom du commentateur à l'aide d'ASP.NET/C#

Y a-t-il des librairies libres pour cela? Je préfère ne pas automatiser Word car ce processus doit être quelque peu évolutif.

Répondre

0

Si vous souhaitez que vos utilisateurs téléchargent des fichiers Word 2007 DOCX (par opposition aux fichiers .doc Word 2003), vous pouvez utiliser l'API System.IO.Packaging dans WindowsBase .dll pour lire le fichier XML dans le fichier Word 2007 (Voir here)

1

DocX (vérifiez codeplex) peut faire ce dont vous avez besoin. Je sais que vous cherchez gratuitement, mais si vous trouvez que vous avez besoin de plus de fonctionnalités (support 97-2003, par exemple) que vous pouvez trouver dans les offres gratuites, jetez un coup d'oeil aux produits d'Aspose. Je compte sur leur suite .NET pour un certain nombre d'applications commerciales et j'en suis globalement très satisfait.

Questions connexes