urllib.urlretrieve
retourne en mode silencieux même si le fichier n'existe pas sur le serveur http distant, il enregistre simplement une page HTML dans le fichier nommé. Par exemple:Comment savoir si urllib.urlretrieve réussit?
urllib.urlretrieve('http://google.com/abc.jpg', 'abc.jpg')
retourne juste en silence, même si abc.jpg n'existe pas sur le serveur google.com, généré abc.jpg
n'est pas un fichier jpg valide, il est en fait une page html. Je suppose que les en-têtes retournés (une instance de httplib.HTTPMessage) peuvent être utilisés pour dire réellement si les réussites de récupération ou non, mais je ne trouve pas de doc pour httplib.HTTPMessage
.
Quelqu'un peut-il fournir des informations sur ce problème?
Est-ce que urllib2 peut fournir le comportement de cache de urlretrieve? Ou devrions-nous le réimplémenter? – Kiv
Voir cet effroyable recipie d'ActiveState: http://code.activestate.com/recipes/491261/ Nous l'utilisons dans notre projet actuel, fonctionne parfaitement –
urlopen ne fournit pas une fonction de crochet (pour montrer la barre de progression pour exemple) comme urlretrieve. –