2017-05-18 2 views
1

Je suis en train d'extraire des données dehtmlParse n'a pas réussi à charger entité externe

url <- ("http://angel.co/companies?locations[]=1647-India") 

code:

library(XML) 
my <- htmlParse(url) 

Error: failed to load external entity from url

Essayez 2:

library(XML) 
library(httr) 
qw <- GET(url) 
my <- readHTMLTable(rawToChar(qw$content)) 

Error in qw$content : $ operator is invalid for atomic vectors

Essayez 3:

qw <- getURL(url) 
my <- readHTMLTable(url, stringsAsFactors = F) 

Error: could not find function "getURL"

Error: failed to load external entity from url

Répondre

0

L'URL donne un statut 301, et la cause de c'est le site ne permet que la connexion SSL. Essayez avec ceci (essentiellement la différence utilise https au lieu de http).

library(XML) 
library(RCurl) 
url <- ("https://angel.co/companies?locations[]=1647-India") 
htmlContent <- getURL(url) 
htmlTree <- htmlTreeParse(htmlContent)