2012-04-05 6 views
0

Je souhaite accéder aux fichiers Office 2003 (.doc, .xls et .ppt) pour extraire du texte et des métadonnées (nombre de mots, nombre de feuilles, images, gabarit, etc.) . Je suis capable de le faire avec Open XML SDK pour les documents Office 2007. Cependant, cet extracton aura lieu sur un serveur, qui ne peut pas avoir des applications comme Microsoft Office installé (c'est la raison pour laquelle je ne peux pas utiliser Interop d'Office). J'ai essayé NPOI, mais en réalité il ne supporte que les fichiers .xls. Les autres bibliothèques que j'ai trouvées ne sont pas open-source, je ne peux pas l'utiliser sur mon travail ... J'ai téléchargé NPOI Scratchpad mais le code est très "brut", je ne peux pas l'utiliser sur mon travail. Avez-vous d'autres idées pour obtenir le texte et les métadonnées des documents Office 2003? Je ne suis pas un programmeur très expérimenté, et j'utilise C# (Cependant, s'il y a une solution à ce problème en C++ je pourrais envisager de l'utiliser). Merci.Accès aux fichiers office 2003

Répondre

1

Il y a beaucoup de bibliothèques comme:

  • ClosedXML (Office 2007)
  • EPPlus (Office 2007)
  • cellules Aspose (Office 97-2010, j'utiliser celui-ci)

Je ne connais aucune bibliothèque gratuite supportant le format Office 2003.

bonne chance