Y a-t-il un bon racleur pour les rails? Je me souviens d'avoir lu récemment un billet sur un blog mais je n'arrive pas à le trouver.Rails 3 gem: Scraper simple
Remerciements
Y a-t-il un bon racleur pour les rails? Je me souviens d'avoir lu récemment un billet sur un blog mais je n'arrive pas à le trouver.Rails 3 gem: Scraper simple
Remerciements
Nokogiri, également checkout SelectorGadget - génère des sélecteurs CSS pour vous
Beaucoup existent. Essayez ScrAPI (voir http://railscasts.com/episodes/173-screen-scraping-with-scrapi) ou Nokogiri (voir http://railscasts.com/episodes/190-screen-scraping-with-nokogiri).
Mechanize, hpricot sont également très utiles. Reportez-vous aux liens ci-dessous pour savoir comment démarrer avec ces outils -
http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-using.html (Scraper écran simple Ruby en utilisant Mechanize, hpricot et XPath)
http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-in-just-5.html (Scraper écran simple Ruby en 5 lignes sans utiliser XPath)
Essayé à la fois ScrAPI et Nokogiri pour une application de la mienne.
Nokogiri est beaucoup plus robuste aux différents encodages (utf, windows-XXXX, etc.). Cela fonctionne juste. Avec ScrAPI, j'ai dû détecter le codage en premier comme décrit in this article. Pas de soucis avec Nokogiri, car il gère l'encodage avec élégance.