2017-10-20 3 views
0

Supposons que je l'adresse suivante:Comment puis-je suivre les redirections d'une URL dans R?

http://linkinghub.elsevier.com/retrieve/pii/S1755534516300379

Lorsque vous entrez ceci dans mon navigateur de bureau standard, je redirigés vers:

http://www.sciencedirect.com/science/article/pii/S1755534516300379?via%3Dihub

Cependant, je ne suis pas en mesure de mettre en œuvre cette dans R. J'ai essayé les paquets httr et RCurl. Dans la documentation de HTTR, il dit la fonction Habituez comme suit:

library(httr) 
GET("http://linkinghub.elsevier.com/retrieve/pii/S1755534516300379") 

est censé conduire à l'URL utilisée (après toute redirection). Mais lors de l'appel de l'URL:

GET("http://linkinghub.elsevier.com/retrieve/pii/S1755534516300379")$url 

Je n'obtiens pas la redirection finale. J'apprécierais beaucoup votre aide!

Répondre

2

La redirection sur ce site fonctionne avec javascript, pas http. La redirection ne fonctionnera donc pas si vous n'interprétez pas le contenu du document téléchargé.

Si vous souhaitez analyser de nombreux documents à partir du même site, vous pouvez analyser l'URL de redirection directement à partir du document.

Si vous souhaitez analyser de nombreux sites différents avec des mécanismes de redirection différents, vous aurez besoin d'une bibliothèque qui charge réellement le site et exécute le javascript, par exemple RSelenium.

+0

@ sanaut. Merci beaucoup pour votre réponse rapide. J'espérais une réponse différente mais c'est tout à fait logique. Merci également pour l'indication de RSelenium. –