2009-02-14 5 views
4

Comment rechercher un code source de sites Web avec Ruby, difficile à expliquer, mais Heres le code pour le faire en pythonsites de recherche de contenu

import urllib2, re 
word = "How to ask" 
source = urllib2.urlopen("http://stackoverflow.com").read() 
if re.search(word,source): 
    print "Found it "+word 
+0

Cette question est une copie de ; le code est exactement le même. Le nom de cet utilisateur était "PHP", le nom de cet utilisateur est "python". Que se passe t-il ici? – Bkkbrad

Répondre

3

est ici une façon:

require 'open-uri' 
word = "How to ask" 
open('http://stackoverflow.com') do |f| 
    puts "Found it #{word}" if f.read =~ /#{word}/ 
end 
2

Si vous tous vouloir faire est la recherche jcrossley3 vous a donné votre réponse. Si vous voulez faire quelque chose de plus compliqué, vous devriez regarder un analyseur HTML qui peut vous permettre de traiter le site comme un arbre DOM. Jetez un coup d'œil à pourquoi c'est génial hpricot gem pour faire exactement cela.

require 'hpricot' 
require 'open-uri' 
doc = open("http://qwantz.com/") { |f| Hpricot(f) } 
doc.search("//p[@class='posted']") 
(doc/"p/a/img").each do |img| 
    puts img.attributes['class'] 
end 
Questions connexes