Un client me demande de créer un module pour son webapp en cours d'exécution qui peut charger des fichiers docx et extraire des données en fonction des titres trouvés dans le document. Je sais que docx est juste un fichier zip et la plupart de ce dont j'ai besoin se trouve dans word/document.xml, bien que je n'aime pas analyser les listes/styles/images/tables et tout ce qui doit être traduit OOXML en HTML.PHP OOXML Bibliothèques?
Existe-t-il des bibliothèques PHP pour ce format? J'ai besoin d'une certaine flexibilité cependant: juste un convertisseur OOXML vers HTML ne va pas le couper, j'ai besoin de décomposer le document en parties.
J'ai besoin de tout style approprié, juste besoin de décomposer le document en fonction des titres trouvés. J'ai seulement besoin de lire, d'écrire ... et phpdocx n'écrit que. –
Réponse à edit: Je sais que je vais devoir analyser le document;) Je cherche juste des bibliothèques qui me faciliteront la tâche. De préférence, je veux transmettre des PARTIES du document qui sont traduites en contenu html. –
Mis à part les deux que j'ai mentionnés, je ne connais pas d'autres bibliothèques PHP qui fonctionnent avec des fichiers au format docx. Si vous devez le développer vous-même, je peux vous indiquer la documentation sur le format: si vous trouvez des bibliothèques de lecteurs, merci de les partager. Il existe toujours l'option de secours d'un serveur Windows exécutant Word, et utilisant PHP COM –