2016-11-26 1 views
-1

Je suis en train de convertir le format de fichier .doc au format de fichier .html. J'ai déjà converti des fichiers .docx en .html en utilisant docx2html en Python mais j'ai un problème avec la conversion des fichiers au format .doc. J'ai essayé de convertir .doc en .docx en utilisant le sous-processus en Python mais je suis sur MAC OS X et le sous-processus ne fonctionne pas sur MAC. Mon problème est que je devrais faire ceci seulement en Python. Y'a-t'il un quelconque moyen d'y arriver? MerciConvert .doc en .html en utilisant Python

P.S. Je suis cette erreur lorsque j'utilise pour convertir doc subprocess à docx:

File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 522, in call 
return Popen(*popenargs, **kwargs).wait() 

File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 710, in __init__ 
    errread, errwrite) 

File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 1335, in _execute_child 
    raise child_exception 
OSError: [Errno 2] No such file or directory 
+1

Pourquoi "subprocess" ne fonctionne-t-il pas? c'est bien sur mon MAC OS X, que se passe-t-il? Vous pouvez utiliser l'ancien 'os.system()' à la place, mais 'subprocess' est préféré. – cdarke

+0

Antiword semble être le paquetage Python qui lit les fichiers .doc. – cco

+0

@cdarke J'ai édité ma question et ajouté l'erreur que j'ai eue quand j'utilise le sous-processus – Minerva

Répondre

0

convertir simplement vos fichiers doc à docx.You peuvent utiliser html bibliothèque Python analyse syntaxique, Belle soupe.

ou this Il convertit un fichier texte/mot formaté en un simple balisage HTML, en préservant gras, italique, liens et paragraphes, mais sans ajouter de balises pour les tailles de police et les faces. Exactement ce dont j'avais besoin pour gagner du temps.

+0

Merci, mais n'avez-vous pas lu ma question complètement? Je pourrais convertir .docx en .html mais je ne pourrais pas convertir .doc en .docx. J'ai tout essayé mais rien ne marche! – Minerva

+0

Oh je vois.Vous pourriez essayer les solutions de rechange que je vous ai donné. Belle soupe est très pratique aussi. – Inconnu

+0

Cela fonctionne aussi pour les fichiers doc? – Minerva