J'utilise ce code pour lister les adresses électroniques d'une page HTML.Comment supprimer des caractères dans une chaîne après un courrier électronique
require 'nokogiri'
selector = "//a[starts-with(@href, \"mailto:\")]/@href"
doc = Nokogiri::HTML.parse File.read 'in.rb'
nodes = doc.xpath selector
addresses = nodes.collect {|n| n.value[7..-1]}
puts addresses
C'est un exemple de code que je suis l'analyse syntaxique:
<a href="mailto:[email protected]?subject=My Business Is Dying">
Mais je reçois plus que l'adresse e-mail. Je reçois dans mes résultats:
[email protected]?subject=My Business Is Dying
Comment puis-je déposer tout ce qui suit le point d'interrogation il est donc que l'adresse e-mail?
'in.rb' est un fichier HTML? – tadman