2017-10-19 31 views
0

Tentative de téléchargement de plusieurs fichiers zip à l'aide d'un lien Web. Avec cette approche, les fichiers de téléchargement ont été écrasés depuis les noms de fichiers sont identiques pour plusieurs années -R - Scrapbooking et téléchargement de plusieurs fichiers zip et sauvegarde des fichiers sans écrasement

library(rvest) 

url <- "https://download.open.fda.gov/" 
page <- read_html(url) 

zips <- grep("\\/drug-event",html_nodes(page,"key"), value=TRUE) 
zips_i<-gsub(".*\\/drug\\/","drug/",zips) 
zips_ii<-gsub("</key>","",zips_i) 
zips_iii<-paste0(url, zips_ii) 

lapply(zips_iii, function(x) download.file(x, basename(x))) 

Est-il possible de ne pas écraser les fichiers téléchargés?

Répondre

0

Voici ce que je suis arrivé à ce jour -

#load the library 
library(rvest) 

#link to get the data from 
url <- "https://download.open.fda.gov/" 
page <- read_html(url) 

#clean the URL 
zips <- grep("\\/drug-event",html_nodes(page,"key"), value=TRUE) 
zips_i<-gsub(".*\\/drug\\/","drug/",zips) 
zips_ii<-gsub("</key>","",zips_i) 
zips_iii<-paste0(url, zips_ii) 

#destination vectors 
id=1:length(zips_iii) 
destination<-paste0("~/Projects/Projects/fad_ade/",id) 

#file extraction 
mapply(function(x, y) download.file(x,y, mode="wb"),x = zips_iii, y = destination)