2011-07-08 2 views
5

J'ai besoin d'extraire des données d'un site, mais cela nécessite d'abord ma connexion. J'ai utilisé hpricot pour réussir à gratter d'autres sites, mais je suis novice dans l'utilisation de la mécanisation, et je suis vraiment déconcerté par la façon de travailler.Utilisation de Ruby avec Mechanize pour se connecter à un site Web

Je vois cet exemple souvent cité:

require 'rubygems' 
require 'mechanize' 

a = Mechanize.new 
a.get('http://rubyforge.org/') do |page| 
    # Click the login link 
    login_page = a.click(page.link_with(:text => /Log In/)) 

    # Submit the login form 
    my_page = login_page.form_with(:action => '/account/login.php') do |f| 
    f.form_loginname = ARGV[0] 
    f.form_pw   = ARGV[1] 
    end.click_button 

    my_page.links.each do |link| 
    text = link.text.strip 
    next unless text.length > 0 
    puts text 
    end 
end 

Mais je l'ai trouvé très cryptique. La partie que je ne comprends pas en particulier est ce qui se passe ici:

f.form_loginname = ARGV[0] 
f.form_pw   = ARGV[1] 

Comment ces balises d'entrée de la page deviennent soudainement des méthodes? Est-ce que j'ai râté quelque chose? Lorsque je tente de recréer, pour se connecter à AppDataPro (http://www.appdata.com/login) je rencontre le problème que le nom d'entrée contient des crochets, comme ceci:

<Table> 
<tr><td width="150"> 
    <label for="user_session_username">Username</label><br /> 
</td><td > 
    <input id="user_session_username" name="user_session[username]" size="30" type="text" /> 
</td></tr> 
<tr><td> 
    <label for="user_session_password">Password</label><br /> 
</td><td> 
    <input id="user_session_password" name="user_session[password]" size="30" type="password" /> 
</td></tr> 
</table> 

C'est ma tentative utiliser mécaniser:

a = Mechanize.new 
    a.get('http://www.appdata.com/login') do |page| 
     # Click the login link 
     login_page = a.click(page.link_with(:text => /Login/)) #login_page is basically a doc of appdata/login 

     my_page = login_page.form_with(:action => '/login') do |f| 
      f.user_session[username] = '****username here?****' 
      f.user_session[password] = '****password here?****' 
     end 

    end 

mais il provoque l'erreur,

logintest01.rb:21:in `block (2 levels) in <main>': undefined method `user_session' for nil:NilClass (NoMethodError) 

Quel est le problème avec ce que je fais?

Répondre

13

Cette approche est généralement je prends. Il ne m'a pas manqué:

username_field = form.field_with(:name => "user_session[username]") 
username_field.value = "whatever_user" 
password_field = form.field_with(:name => "user_session[password]") 
password_field.value = "whatever_pwd" 
form.submit 
+0

Merci beaucoup! Cela fonctionne parfaitement! – Spacew00t

+0

Vous êtes les bienvenus. – Senthess

0

Essayez sans cette

login_page = a.click(page.link_with(:text => /Login/)) 

Ou

a.get('http://www.appdata.com/') do |page| 
Questions connexes