J'ai joué avec HPricot, mais après une bonne partie de la recherche, je n'ai pas réussi à résoudre ce problème. J'essaie d'analyser une page HTML et de trouver toutes les balises avec un href dans un fichier mp3. Jusqu'à présent, j'aiRecherche de fichiers liés avec HPricot
<ul>
<% @page.search('//a[@href*=mp3]').each do |link| %>
<li>
<%= link.inner_text %>
</li>
<% end %>
</ul>
qui fonctionne très bien, et une expression régulière, /href\s*=\s*\"([^\"]+)(.mp3)/
qui fonctionne aussi. Je ne suis pas sûr de savoir comment combiner les deux.
Y a-t-il un bon exemple, ou une documentation que quelqu'un pourrait me désigner afin de déterminer ce que je peux faire avec la fonction .search.
Remerciements
J'ai été capable de classer tous les liens vers des fichiers mp3 avec <% @ page.search ('// a [@href * =. Mp3]'). Each do | link | %>, mais je ne sais toujours pas comment isoler le href dans ce lien. –