J'essaie d'utiliser Scrubyt pour obtenir les détails de cette page http://www.nuffieldtheatre.co.uk/cn/events/event_listings.php?section=events. J'ai réussi à obtenir les titres et les URL de détail de la liste, mais je ne peux pas utiliser next_page pour que le scraper passe à la page suivante. Je suppose que c'est parce que je n'utilise pas le modèle correct pour le lien de la page suivante. J'ai essayé la chaîne "Next Page", et j'ai aussi essayé le XPath. D'autres idées?Comment obtenir le lien 'Page suivante' avec Scrubyt
Le code est ci-dessous:
require 'rubygems'
require 'scrubyt'
nuffield_data = Scrubyt::Extractor.define do
fetch 'http://www.nuffieldtheatre.co.uk/cn/events/event_listings.php?section=events'
event do
title 'The Coast of Mayo'
#url "href", :type => :attribute
link_url
end
next_page "Next Page", :limit => 2
end
nuffield_data.to_xml.write($stdout,1)