2016-11-29 2 views
2

Essayez de convertir des fichiers MS Word au format HTML à l'aide de Python sur AWS Lambda. Pour .docx, je sais qu'il existe une bibliothèque appelée python-docx. Mais quand il s'agit de .doc, je n'arrive toujours pas à trouver une solution élégante et simple car la plupart des solutions possibles utilisent LibreOffice ou OpenOffice.Conversion de fichiers MS Word (.doc et .docx) en HTML à l'aide de Python sur AWS Lambda

Existe-t-il un moyen de créer une version portable de LibreOffice/OpenOffice pouvant être manipulée par des scripts Python sur AWS Lambda? Ou, existe-t-il une bibliothèque Python pour le fichier .doc que j'omets?

+0

Avez-vous trouvé une solution? Si c'est le cas, partagez votre expérience. Je veux aussi utiliser certaines fonctionnalités de LibreOffice/OpenOffice dans Lambda. Fondamentalement, je veux convertir le fichier .doc en .pdf. –

Répondre

1

Malheureusement, il ne semble pas y avoir de solutions élégantes pour résoudre ce problème en ce moment. J'avais essayé de faire une version portable de LibreOffice/OpenOffice, mais le plus gros problème est la taille, qui dépasse la limite d'AWS Lambda.

Peut-être que vous voulez donner Pandoc une tentative, mais il ne peut pas traiter le fichier. Mais je l'utilise avec succès sur AWS Lambda. Vous pouvez visiter here pour savoir comment créer une version portable pour AWS Lambda.