Je programmation en Python et j'obtenir des informations à partir d'une page Web dans la bibliothèque urllib2
. Le problème est que cette page peut me fournir des caractères non-ASCII, comme 'ñ'
, 'á'
, etc. Dans le moment urllib2
obtient ce personnage, il provoque une exception, comme ceci:Comment gérer les caractères Unicode (non-ASCII) en Python?
File "c:\Python25\lib\httplib.py", line 711, in send
self.sock.sendall(str)
File "<string>", line 1, in sendall:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf1' in position 74: ordinal not in range(128)
J'ai besoin de gérer ces caractères. Je veux dire, je ne veux pas gérer l'exception mais continuer le programme. Y at-il un moyen de, par exemple (je ne sais pas si c'est quelque chose de stupide), utiliser un autre codec plutôt que l'ASCII? Parce que je dois travailler avec ces personnages, les insérer dans une base de données, etc.
Il serait utile que vous pourriez dire, aussi, si vous utilisez Python 3+, ou quelque chose plus tôt. –
n'a pas pu être Py3K depuis le module urllib2 a été supprimé (enveloppé dans urllib) ... –
double: http://stackoverflow.com/questions/1020892/python-urllib2-read-to-unicode –