2009-11-12 4 views
5

Vous cherchez à développer une application côté serveur qui traitera les documents. Les documents sources sont principalement MS-Word 2003, 2007, c'est-à-dire la version MS de Docx. Vous voulez que l'application serveur puisse fonctionner sur Linux ou Windows. Vouloir savoir quel est le meilleur outil ou bibliothèque pour lire et écrire des fichiers MS-Word sous linux. La compatibilité est la considération la plus importante. Doit préserver la mise en forme du document source, y compris les tableaux.Création et édition de documents MS-Word sur un serveur Linux?

J'ai vu un type de poste similaire here mais il était spécifique à python. Je ne m'inquiète pas quelle langue ou bibliothèques sont utilisées tant qu'elles sont disponibles pour Windows et Linux.
Doit pas nécessite MS-Word pour lire les fichiers Word.
Je suis au courant de Open Office mais je recherche une solution qui a un haut degré de compatibilité avec les fichiers MS-Word. Aussi juste venu à travers cette solution qui semble prometteuse. aspose.com Quelqu'un a-t-il déjà utilisé Aspose.Words for Java ou des packages tiers similaires? Cela semble prometteur mais c'est cher à plus de 2K $ pour un abonnement OEM. Cela dit, si elle offre comme annoncé, il peut toujours être la meilleure solution là-bas.

merci Il y a eu quelques suggestions mais rien jusqu'ici qui conviendrait à la facture (ou au budget).

+0

Que voulez-vous dire par "processus"? –

+0

Ajouter des tags, reformater un autre style de modèle, exporter vers d'autres formats. Autoriser les utilisateurs à soumettre un document Word, importer le document, analyser le document pour les mots-clés qui sont stockés sur la base de données du serveur. Son fonctionnement sur l'intranet du client – 10ToedSloth

Répondre

5

Avez-vous envisagé d'utiliser b2xtranslator pour convertir .doc binaire en .docx. (Sous Linux, vous devez l'exécuter en Mono)

Vous pouvez alors utiliser POI ou docx4j pour manipuler le docx. Ce n'est pas une solution si vous avez besoin d'enregistrer au format .doc (sauf si vous utilisez OO pour ce bit)

+0

b2xtranslator dépend de la classe system.io.packaging .net, que le mono a récemment pris en charge, et je pense qu'il est encore un peu floconneux. –

+2

@CharlesStewart Je l'ai [porté sur .NET Core] (https://github.com/EvolutionJobs/b2xtranslator), ce qui devrait aider avec ça. – Keith

0

Ok, je vais faire une autre à une réponse ;-)

Qu'en est-il en utilisant unaconv

Il peut convertir tout document OpenOffice peut lire tout document OpenOffice peut écrire. Vous devriez être capable de l'utiliser pour convertir les deux documents MS-Word (à condition qu'ils ne soient pas trop compliqués, ce que j'ai trouvé ouvert ne peut pas très bien gérer). Le seul inconvénient est que vous devez avoir une instance d'OpenOffice en cours d'exécution sur le serveur Linux pour interagir avec unoconv.

+0

merci encore, je savais que OO pourrait être une solution. Bien que j'utilise régulièrement OO 3, il a les mêmes problèmes avec les anciens fichiers Word binaires i.e Word 97-2003. Vous cherchez à voir s'il existe d'autres solutions compatibles. Salutations – 10ToedSloth

-1

Mono a récemment pris en charge la classe system.io.packaging .net, ce qui permet un certain degré de manipulation des fichiers docx . Si le genre de chose que vous voulez faire est d'ajouter/supprimer des ressources et de recurse sur le texte, c'est probablement la bonne chose.

Questions connexes