Quand je gratter plusieurs nœuds associés de HTML ou XML pour extraire le texte, tout le texte est entré dans une longue chaîne, ce qui rend impossible de récupérer les chaînes de texte individuels.Comment éviter de rejoindre tout le texte à partir de nœuds quand le grattage
Par exemple:
require 'nokogiri'
doc = Nokogiri::HTML(<<EOT)
<html>
<body>
<p>foo</p>
<p>bar</p>
<p>baz</p>
</body>
</html>
EOT
doc.search('p').text # => "foobarbaz"
Mais ce que je veux est:
["foo", "bar", "baz"]
La même chose se produit lorsque XML grattage:
doc = Nokogiri::XML(<<EOT)
<root>
<block>
<entries>foo</entries>
<entries>bar</entries>
<entries>baz</entries>
</block>
</root>
EOT
doc.search('entries').text # => "foobarbaz"
Pourquoi cela se produit et comment puis-je éviter il?