2017-08-01 8 views
-1

Je suis en train d'explorer l'URL dans le code.Avez-vous saisi le mauvais élément et les résultats ne correspondent pas?

Tous les éléments doivent être les mêmes,

et j'ai 33 commentaires, 135 étoiles, et 41 dates.

Qu'est-ce que j'ai fait de mal?

Je pense que 33 d'entre eux devraient être normaux.

Comment le réparer?

#install.packages(c("rvest","httr")) 
library(rvest) 
library(httr) 

all.reviews <- c() 
all.stars <-c() 
all.dates <-c() 

for (page in 1:4){ 
    url='https://www.amazon.com/ggplot2-Elegant-Graphics-Data-Analysis/product-reviews/0387981403/ref=cm_cr_arp_d_paging_btm_2?ie=UTF8&showViewpoints=1&sortBy=helpful&pageNumber=' 
    url_page <- paste0(url,page) 
    reading_html <- read_html(url_page) 
    text_nodes <- html_nodes(reading_html, 'span.review-text') 
    review <- html_text(text_nodes) 
    all.reviews<-c(all.reviews, review) 

    text_date <- html_nodes(reading_html, 'span.review-date') 
    date <- html_text(text_date) 
    all.dates<-c(all.dates, date) 

    #span.a-icon-alt 

    text_star <- html_nodes(reading_html, 'span.a-icon-alt') 
    star <- html_text(text_star) 
    all.stars<-c(all.stars, star) 

    print(page) 
} 
+0

Scraping Amazon est une violation de leurs T & C. Agir ainsi et encourager les autres à se joindre à vous dans cette violation pourrait entraîner des sanctions civiles et/ou pénales. – hrbrmstr

Répondre

0

La réponse originale a été supprimée en réponse aux préoccupations soulevées par @hrbrmstr à propos du raclage d'Amazon.

+0

FYI: Scraping Amazon est une violation de leurs T & Cs. Agir ainsi et encourager les autres à se joindre à vous dans cette violation pourrait entraîner des sanctions civiles et/ou pénales. – hrbrmstr