J'essaie de convertir des fichiers docx en texte mais je continue à recevoir une erreur. J'utilise python 2-7Conversion de Docx en texte pur
import docx
def getText(filename):
doc = docx.Document(filename)
fullText = []
for para in doc.paragraphs:
fullText.append(para.text)
return '\n'.join(fullText)
Traceback:
return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character u'\u2019' in position 764: character maps to <undefined>