J'ai besoin d'extraire des données d'un site, mais cela nécessite d'abord ma connexion. J'ai utilisé hpricot pour réussir à gratter d'autres sites, mais je suis novice dans l'utilisation de la mécanisation, et je suis vraiment déconcerté par la façon de travailler.Utilisation de Ruby avec Mechanize pour se connecter à un site Web
Je vois cet exemple souvent cité:
require 'rubygems'
require 'mechanize'
a = Mechanize.new
a.get('http://rubyforge.org/') do |page|
# Click the login link
login_page = a.click(page.link_with(:text => /Log In/))
# Submit the login form
my_page = login_page.form_with(:action => '/account/login.php') do |f|
f.form_loginname = ARGV[0]
f.form_pw = ARGV[1]
end.click_button
my_page.links.each do |link|
text = link.text.strip
next unless text.length > 0
puts text
end
end
Mais je l'ai trouvé très cryptique. La partie que je ne comprends pas en particulier est ce qui se passe ici:
f.form_loginname = ARGV[0]
f.form_pw = ARGV[1]
Comment ces balises d'entrée de la page deviennent soudainement des méthodes? Est-ce que j'ai râté quelque chose? Lorsque je tente de recréer, pour se connecter à AppDataPro (http://www.appdata.com/login) je rencontre le problème que le nom d'entrée contient des crochets, comme ceci:
<Table>
<tr><td width="150">
<label for="user_session_username">Username</label><br />
</td><td >
<input id="user_session_username" name="user_session[username]" size="30" type="text" />
</td></tr>
<tr><td>
<label for="user_session_password">Password</label><br />
</td><td>
<input id="user_session_password" name="user_session[password]" size="30" type="password" />
</td></tr>
</table>
C'est ma tentative utiliser mécaniser:
a = Mechanize.new
a.get('http://www.appdata.com/login') do |page|
# Click the login link
login_page = a.click(page.link_with(:text => /Login/)) #login_page is basically a doc of appdata/login
my_page = login_page.form_with(:action => '/login') do |f|
f.user_session[username] = '****username here?****'
f.user_session[password] = '****password here?****'
end
end
mais il provoque l'erreur,
logintest01.rb:21:in `block (2 levels) in <main>': undefined method `user_session' for nil:NilClass (NoMethodError)
Quel est le problème avec ce que je fais?
Merci beaucoup! Cela fonctionne parfaitement! – Spacew00t
Vous êtes les bienvenus. – Senthess