J'utilise le module urllib2 en Python 2.7 en utilisant Spyder 3.0 fichiers texte de téléchargement par lots en lisant un fichier texte qui contient une liste d'entre eux (?):Python ValueError: type url inconnue: l'espace
reload(sys)
sys.setdefaultencoding('utf-8')
with open('ocean_not_templated_url.txt', 'r') as text:
lines = text.readlines()
for line in lines:
url = urllib2.urlopen(line.strip('ï \xa0\t\n\r\v'))
with open(line.strip('\n\r\t ').replace('/', '!').replace(':', '~'), 'wb') as out:
for d in url:
out.write(d)
Je l'ai déjà découvert un tas de personnages étranges dans les urls que je l'ai depuis dépouillé, cependant, le script échoue lorsque près de 90% complet, ce qui donne l'erreur suivante:
Je pensais que ce soit un espace insécable (noté \ xa0 dans le code), mais il échoue toujours. Des idées?
Hmm .. où dois-je spécifier le protocole? Merci pour la suggestion, au fait. – snl330
@Samuel J'ai mis à jour la réponse. Vérifiez-le! – varun
Je vois. Merci pour la réponse détaillée !! Le préfixe 'http: //' existe déjà dans la liste des URL du fichier texte, par exemple 'http://www1.ncdc.noaa.gov/pub/data/paleo/paleocean/sediment_files/complete/e49-23 -tab.txt'. (Ils sont sur un serveur ftp.) Est-il possible que _if_ certaines de ces URL ne soient plus utilisées que cela cause le problème? Je sais qu'ils ont été déplacés par nos gestionnaires de données, et certains sont assez vieux. Merci encore. – snl330