browser = mechanize.Browser()
page = browser.open(url)
html = page.get_data()
print html
Il montre des caractères étranges. Je suppose que c'est une chaîne UTF-8 mais Python ne le sait pas et ne peut pas le montrer correctement.Problème de codage lors du téléchargement du code HTML en utilisant mechanize et Python 2.6
Comment puis-je convertir cette chaîne en chaîne unicode comme
u = u'test'
Dites-nous l'URL ou quelques-uns des personnages étranges qui apparaissent sur la page. À partir de votre 'UnicodeDecodeError', le document n'est certainement pas correct UTF-8. – AndiDog