2017-06-22 11 views
0

Comme brièvement expliqué dans le titre im essayant d'attraper chaque InnerText de chaque occurrence d'étiquette et l'ajoute à une liste. Voici mon code aswell comme mon html:C# HtmlAgilityPack, Comment saisir InnerText de toutes les occurrences d'un tag spécifique?

HTML-corps:

<body cz-shortcut-listen="true"> 
{"draw":1,"recordsTotal":9437,"recordsFiltered":9437,"data":[[" 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115739257\&quot;">AK-47 | Aquamarine Revenge (Factory New)&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;"href="\&quot;\/id\/115739257\&quot;">33.87&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115739257\&quot;">34.53&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;https:\/\/track.steamanalyst.com\/730\/115739257\/all\&quot;">25.9&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115739257\&quot;">164&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115739257\&quot;">-0.16&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115739257\&quot;">2.10945&lt;\/a&gt;"],["</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115734122\&quot;">AK-47 | Aquamarine Revenge (Minimal Wear)&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115734122\&quot;">23.44&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115734122\&quot;">21.85&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;https:\/\/track.steamanalyst.com\/730\/115734122\/all\&quot;">17.61&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115734122\&quot;">533&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115734122\&quot;">-2.65&lt;\/a&gt;","</a> 
<a target="\&quot;_blank\&quot;" href="\&quot;\/id\/115734122\&quot;">0.94387&lt;\/a&gt;"],["</a> 
</body> 

Mon code:

List<string> Data = new List<string>(); 
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//a[@target]")) 
{ 
    if(j <= 6) 
    { 
     Data.Add(node.InnerText); 
     if (j == 6) 
     { 
      JsonDB.Add(Data[0], Data[1]); 
      Data.Clear(); 
      j = 0; 
     } 
     else 
     { 
      j++; 
     } 
    } 
} 

problème avec ce code: node.InnerText montre une chaîne de tous rejoint InnerTexts de toutes les balises dans le corps! Fondamentalement, il montre ce que le premier noeud doc.DocumentNode.SelectNodes("//a[@target]"):

AK-47 | Aquamarine Revenge (Factory New)","33.8","34.34","25.89","170", 
"-1.27","2.03181"],[... 

Répondre

0

Tous les tags dans le corps:

doc.DocumentNode.SelectNodes("//a[@target]")) 

Tags dans le doc:

doc.DocumentNode.SelectNodes(".//a[@target]")) 
+0

@Pang Eh bien, ce n'était pas vraiment le problème, mais plutôt que cela montre une chaîne jointe de tous les contextes intérieurs comme un seul nœud. Fondamentalement comme ceci: AK-47 | Aquamarine Revenge (Factory New) "," 33,8 "," 34,34 "," 25,89 ".... – Nikolas

0

SOLUTION: Il doit être traité comme un objet JSON avant d'entrer dans le code HTML

JObject jresponse = JObject.Parse(response); 
foreach (JArray row in jresponse["data"]) 
{ 
    List<string> Data = new List<string>(); 
    foreach (JToken entry in row) 
    { 
     doc.LoadHtml(entry.ToString()); 
     HtmlNode node = doc.DocumentNode.SelectSingleNode("//a[@target]"); 
     Data.Add(node.InnerText); 
    } 
}