2016-03-03 2 views
0

J'essaie d'ouvrir un tas de fichiers .doc (pas docx) dans un dossier en utilisant python.Python: Ouvrir le fichier .doc avec antiword sur windows

J'ai téléchargé un "antiword" modifié qui était un fichier d'exécution précompilé pour windows car l'antiword d'origine n'est disponible que pour linux.

http://www-stud.rbi.informatik.uni-frankfurt.de/~markus/antiword/

Après avoir téléchargé je l'insère dans mon dossier python27 et j'exécutez le fichier antiword.exe. Honnêtement, mon problème est que je ne comprends pas ce qui se passe quand je lance l'exécution. J'avais espéré qu'il ajouterait une bibliothèque à mon répertoire de python et je pourrais importer "antiword". Quelqu'un peut-il m'aider?

Merci beaucoup.

BR Jonas

Répondre

2

Si je comprends bien, antiword est pas un module python que vous pouvez importer. C'est un exécutable qui peut être exécuté directement à partir de l'invite de commande (cmd). J'ai installé antiword comme expliqué dans 00README.WIN document et je pourrais l'exécuter en cmd après avoir ajouté son dossier à la variable d'environnement PATH et créé une variable d'environnement HOME exactement comme indiqué dans README. Je pouvais courir avec succès l'exemple suivant à l'aide Testdoc.doc trouvés dans antiword \ Doc \

antiword -m cp852.txt filename.doc > filename.txt 

Je pense que si vous devez le faire en Python, vous pouvez exécuter antiword semblable à toute commande cmd comme précédemment explained. La même chose était précédemment suggested. Vous pouvez également essayer IronPython comme précédemment recommended.

J'espère que cela aide!