J'ai donc écrit ce court script (mot correct?) Pour télécharger les images comiques des bandes dessinées explosm.net parce que je l'ai découvert récemment et je veux ... mets-le sur mon iPhone ... 3G.Télécharger à partir de EXPLOSM.net Comics Script [Python]
Cela fonctionne très bien et tout. urllib2 pour obtenir la page Web html et urllib pour image.retrieve()
Pourquoi j'ai posté ceci sur SO: comment optimiser ce code? REGEX (expressions régulières) le rendrait-il plus rapide? Est-ce une limitation d'Internet? Mauvais algorithme ...?
Toute amélioration de la vitesse ou esthétique code général seraient grandement appréciés « réponses ».
Merci.
-------------------------------- CODE ----------- -----------------------
import urllib, urllib2
def LinkConvert(string_link):
for eachLetter in string_link:
if eachLetter == " ":
string_link = string_link[:string_link.find(eachLetter)] + "%20" + string_link[string_link.find(eachLetter)+1:]
return string_link
start = 82
end = 1506
matchingStart = """<img alt="Cyanide and Happiness, a daily webcomic" src="http://www.explosm.net/db/files/Comics/"""
matchingEnd = """></"""
link = "http://www.explosm.net/comics/"
for pageNum in range(start,start+7):
req = urllib2.Request(link+`pageNum`)
response = urllib2.urlopen(req)
page = response.read()
istart1 = page.find(matchingStart)
iend1 = page.find(matchingEnd, istart1)
newString1 = page[istart1 : iend1]
istart2 = newString1.find("src=")+4
iend2 = len(newString1)
final = newString1[istart2 +1 : iend2 -1]
final = LinkConvert(final)
try:
image = urllib.URLopener()
image.retrieve(final, `pageNum` + ".jpg")
except:
print "Uh-oh! " + `pageNum` + " was not downloaded!"
print `pageNum` + " completed..."
Soit dit en passant, ce code est en Python 2.5, 3.0, mais je parie que vous tous les caractéristiques de PYTHON 3.0 grandement étudié et joué avec avant ou juste après le Nouvel an (après College Apps - YAY^- ^)
Pas vraiment une question, puisque rien n'est cassé. S'il vous plaît poster ceci à votre propre page de blog au lieu d'ici. –
Je suis surpris qu'il n'y ait pas d'outil pré-existant pour le téléchargement par lots webcomic. – biozinc