J'ai un fichier xml, que j'ai besoin de convertir en utf8. Malheureusement, les entités contiennent du texte comme celui-ci:Python convertir html texte encodé ascii en utf8
/mytext,
J'utilise la bibliothèque codec pour convertir les fichiers en UTF8, mais des entités html ne fonctionneront pas avec elle.
Existe-t-il un moyen facile de se débarrasser de l'encodage html?
Merci
http://stackoverflow.com/questions/37486/filter-out-html-tags-and-resolve-entities-in-python – kechapito
Pouvez-vous simplement passer le fichier brut en premier? – jterrace