J'utilise actuellement mécaniser lire page Web gzip comme ci-dessous:Convertir des données récupérées par gzip urllib2 en HTML
br = mechanize.Browser()
br.set_handle_gzip(True)
response = br.open(url)
data = response.read()
Je me demande comment décompresser les données récupérées par gzip urllib2 au texte HTML?
req = urllib2.Request(url)
opener = urllib2.build_opener()
response = opener.open(req)
data = response.read()
if response.info()['content-encoding'] == 'gzip':
HOW TO DECOMPRESS DATA TO HTML
Vous pouvez également faire 'gzip.decompress (data)'. –
Cela ne fonctionne pas réellement dans ce cas comme expliqué dans cet article: http://rationalpie.wordpress.com/2010/06/02/python-streaming-gzip-decompression/ donc vous devez utiliser zlib au lieu de gzip – gabuzo
@ gabuzo En fait, cet article concerne la décompression _streaming_ gzip, qui est en effet très différente du sujet de cette question, puisque celle-ci mentionne spécifiquement que les données ont déjà été récupérées, alors que dans une situation de streaming, vous voulez les décompresser. –