J'essaie actuellement d'extraire les images d'un document que l'utilisateur est en train de télécharger dans le référentiel multimédia de mon application Django. Le code qui travaille actuellement pour moi:Comment extraire des images d'un document en utilisant pypandoc dans un dossier différent du référentiel multimédia d'un projet dans Django?
html = pypandoc.convert(
tmp_loc,
'html5',
extra_args=['--extract-media=']
)
Ceci extrait correctement les images dans le répertoire médias image01.jpg
En HTML le img src est:
<img src="/media/image01.jpg" />
Maintenant, le problème est que Lorsque l'utilisateur télécharge un autre docx qui a aussi une image, il remplace l'image précédente quand il est téléchargé car il est également enregistré sous le nom image01.jpg.
Pour résoudre ce problème, je pensais que nous pouvions simplement créer un nouveau dossier dans le référentiel de médias et le nom du nouveau dossier serait le nom de doc. Alors maintenant, le code ressemble à ceci:
html = pypandoc.convert(
tmp_loc,
'html5',
extra_args=['--extract-media=/media/<some_doc_name>']
)
Mais le moment je lance ce que j'obtiens l'erreur suivante:
Pandoc died with exitcode "1" during conversion: b'pandoc: /media/docs: createDirectory: permission denied (Permission denied)\n'
Quelqu'un pourrait-il me guider ce qui ne va pas? Comment régler ceci? Toute autre méthode de résolution de ce problème serait également appréciée !! J'utilise le module Pypandoc en python.
Au lieu de cela, pourquoi ne pas simplement renommer le fichier image s'il existe. – RA123
La chose est pypandoc génère automatiquement le code HTML et définit le imr src pour pointer vers image01.jpg. Comment modifier le HTML généré par pandoc pour pointer vers l'image renommée? –
Vous devriez lire ce https://github.com/bebraw/pypandoc/blob/master/README.md vous pouvez spécifier le nom de fichier de sortie – RA123