2017-07-27 2 views
0

J'utilise rvest pour gratter les données Web. Je le code CSS suivant à partir d'un site Web:Scrape title attribut de CSS avec rvest

<abbr class="intabbr" title="2.856.890">2,9M</abbr> 

Je racler ces données avec

library(rvest) 
library(dplyr) 
n <- read_html("https://www.last.fm/de/music/Fang+Island") 
n %>% 
html_node("abbr") %>% 
html_text() 

Cela me donne « 2M », mais ce que je voudrais faire est le « 2.856.890 ".

Je ne connais pas très bien CSS: Est-il possible d'obtenir l'information que je veux en changeant l'expression dans html_node()?

This post suggère que ce n'est pas possible, cependant this one suggère que ce pourrait être possible car il apparaît comme une info-bulle sur la page?

Répondre

1

Utilisez html_attr pour obtenir l'attribut d'un tag:

n %>% 
    html_node("abbr") %>% 
    html_attr("title")