J'essaie d'extraire des données à partir du document html avec le paquet XML. je vais comme suit:R-extraire des données de XMLNodeSet
library(XML)
sink("parse.txt")
parse<-htmlParse(file = "jdwaz.html",encoding = "GBK")
a=getNodeSet(parse,'//div[@class="amount"]')
print(a)
puis classe (a) retourne "XMLNodeSet", son contenu ressemble à ceci dans le fichier txt
[[1]]
<div class="amount">
<span>总额 ¥113.80</span> <br /><span class="ftx-13">在线支付</span>
</div>
[[2]]
<div class="amount">
<span>总额 ¥99.00</span> <br /><span class="ftx-13">在线支付</span>
</div>
Je ne montrent que 2 de 20 "a"
class (a [1]) renvoie "list" Je souhaite obtenir le contenu "总额 ¥ 99.00". J'ai trouvé une méthode dans r - xpathApply on XMLNodeSet (with XML package) Il XMLValue utilise pour obtenir un texte comme:
x <- xpathApply(y, "//table/tr")
sapply(x,xmlValue) ## it a list of nodes..
" Test1.1 Test1.2 " " Test1.3 Test1.4 "
mais il ne correspond pas à ma situation. Quand je rentre XMLValue (a), il retourne:
Error in UseMethod("xmlValue") : no applicable method for 'xmlValue' applied to an object of class "XMLNodeSet"
Je ne trouve pas la méthode appropriée pour traiter XMLNodeSet classe. AIDE!
@Zelbinian Je vous ai trouvé demandé question qui est pertinente à ma question, je me demande si vous pouvez me aider – listen