2017-10-10 1 views
0

Je souhaite extraire tous les NPI et les détails du site Web ci-dessous. "https://www.pverify.com/npi-lookup-find-npi-number-of-doctors-physicians/"Mise au rebut du résultat de recherche (iframe) sur le Web r

code:

library("rvest") 
library("xml2") 
url="https://www.pverify.com/npi-lookup-find-npi-number-of-doctors-physicians/" 
webpage<-read_html(url) 
data_html <- html_nodes(webpage,'iframe') 
data_html <-html_table(data_html) 

Lorsque je tente le code ci-dessus, un message d'erreur est "Erreur: html_name (x) == "table" est pas vrai" bien vouloir me aider à obtenir les numéros NPI et leurs détails.

Répondre

1

Vous pouvez essayer Rselenium.

le code ressemble plus ou moins à ceci.

library(Rselenium) 
library(XML)  

remDr <- remoteDriver(port = 4445L) 
remDr$open() 
remDr$navigate("https://www.pverify.com/npi-lookup-find-npi-number-of-doctors-physicians/") 
h <- htmlParse(remDr$getPageSource()[[1]], encoding = "UTF-8") 
h_table <- html_table(h) 

Pour créer un serveur docker vous pouvez voir here

+0

remDr <- RSelenium :: remoteDriver (port = 4445L) remDr $ open() remDr navigate de $ ("https: //www.pverify .com/npi-lookup-trouver-npi-nombre-de-médecins-médecins/") h <- htmlParse (remDr $ getPageSource() [[1]], encoding =" UTF-8 ") h_table <- html_table (h) Léger changement dans la première ligne du code et j'obtiens une erreur dans la deuxième ligne que "Erreur dans checkError (res): Impossible de se connecter à l'hôte sur http: // localhost: 4445/wd/hub S'il vous plaît e un serveur Selenium est en cours d'exécution. " –

+0

Utilisez-vous Linux? Si oui, ouvrez le terminal et le digit: statut de docker de service. Et voyez si votre serveur fonctionne. Si vous n'avez pas besoin de voir [ceci] (https://cran.r-project.org/web/packages/RSelenium/vignettes/RSelenium-docker.html) –

+0

utilisez Windows 10 –