2017-08-07 10 views
2

je besoin de télécharger tous les fichiers sous ce lien où seul le nom du quartier ne cessent de changer dans chaque lienTélécharger tous les fichiers sur le site

Juste une référence https://www.data.vic.gov.au/data/dataset/2014-town-and-community-profile-for-thornbury-suburb

Tous les fichiers sous ce lien de recherche : https://www.data.vic.gov.au/data/dataset?q=2014+town+and+community+profile

Des possibilités?

Merci :)

+3

Je suggère d'écrire un code qui fera que –

Répondre

2

Vous pouvez télécharger le fichier comme celui-ci

import urllib2 
response = urllib2.urlopen('http://www.example.com/file_to_download') 
html = response.read() 

Pour obtenir tous les liens dans une page

from bs4 import BeautifulSoup 

import requests 
r = requests.get("http://site-to.crawl") 
data = r.text 
soup = BeautifulSoup(data) 

for link in soup.find_all('a'): 
    print(link.get('href')) 
+0

Merci @naren. Cela a fonctionné parfaitement :) – Bharath

0

vous pouvez le faire de deux façons 1.Par Code 2.by logiciel

1.by code

en utilisant des bibliothèques Web Scrapper comme BeautifulSoup, JSoup

si cela ne fonctionne pas ou si vous devez effectuer des clics sur les boutons pour pouvoir utiliser Selenium.

logiciel 2.by

utilisation Internet Download Grabber du gestionnaire Feature pour ce faire

+0

Merci pour votre réponse – Bharath