J'essaie de gratter Hockey Reference pour un projet Data Science 101. Je rencontre des problèmes avec une table particulière. La page Web est: https://www.hockey-reference.com/boxscores/201611090BUF.html. La table désirée est sous le "rapport de statistiques avancé (toutes les situations)". J'ai essayé le code suivant:Utilisation de rvest pour gratter les données HTML
url="https://www.hockey-reference.com/boxscores/201611090BUF.html"
ret <- url %>%
read_html()%>%
html_nodes(xpath='//*[contains(concat(" ", @class, " "), concat(" ", "right", " "))]') %>%
html_text()
Ce code racler toutes les données des tableaux ci-dessus, mais arrête avant la table avancée. J'ai aussi essayé d'obtenir plus granulaire avec:
url="https://www.hockey-reference.com/boxscores/201611090BUF.html"
ret <- url %>%
read_html()%>%
html_nodes(xpath='//*[(@id = "OTT_adv")]//*[contains(concat(" ", @class, " "), concat(" ", "right", " "))]') %>%
html_text()
qui produit un « caractère (0) » messsage. Toute aide serait appréciée ... si ce n'est pas déjà clair, je suis assez nouveau à R. Merci!