2017-10-13 17 views
0

Je suis en train de gratter les données de ABS.gov.au en utilisant r, mais chacun des liens, au lieu de pointer vers un fichier a ce format:liens html pour cibler en r

http://abs.gov.au/ausstats/meisubs.NSF/log?openagent&640101.xls&6401.0&Time Series Spreadsheet&401EDAE91BAF3EB6CA2581680012D506&0&Jun 2017&26.07.2017&Latest 

est-il de toute façon pour télécharger le fichier assis derrière le lien ci-dessus en utilisant r (potentiellement curl)?

Répondre

0

Si votre objectif est de simplement télécharger le fichier, voici comment le faire.

url = "http://abs.gov.au/ausstats/meisubs.NSF/log?openagent&640101.xls&6401.0&Time Series Spreadsheet&401EDAE91BAF3EB6CA2581680012D506&0&Jun 2017&26.07.2017&Latest" 
dest = 'downloaded_file.xls' 

download.file(url,dest) 
+0

Merci pour la suggestion. J'ai essayé de lire le fichier via readxl et ma session s'est arrêtée. Puis j'ai essayé de l'ouvrir dans l'explorateur et il est revenu comme corrompu. Des idées? – Dom

+0

Le problème peut être dû au format de fichier. Êtes-vous sûr que c'est un fichier Excel? J'ai réussi à télécharger le même fichier que dans la pièce jointe et l'ouvrir avec succès. – amrrs