2012-12-07 4 views
-1

J'écris une petite application vb pour extraire du texte en utilisant Html Agility Pack.Comment extraire les tags en gras avec XPATH?

J'ai besoin d'extraire certains sur les balises du HTML et non les nœuds de texte.

iParagraph est une collection de nœuds contenant des tags tels que: strike, u, strong, b, etc. Il contient également des nœuds de texte. J'avais juste besoin d'ignorer le premier noeud de texte car je sais toujours qu'il sera vide. C'est parce que j'utilise CKEditor.

Si vous avez besoin de plus amples explications s'il vous plaît demander. Je vais clarifier.

est Ci-dessous un échantillon de ce que je suis en train:

Dim paragraph = iParagraphNode.SelectNodes("//body/p and not([contains(text()]))") 
+0

Si vous avez besoin de plus d'explications, s'il vous plaît demander. J'ai regardé autour d'ici: http://xpath.alephzarro.com/content/cheatsheet.html et ici: http://stackoverflow.com/questions/651783/how-do-i-select-only-visible-elements -using-xpath mais je n'arrive pas à trouver un bon moyen de sélectionner les nœuds que je veux. – Vyache

Répondre

0

La solution est assez bon pour l'instant:

Je viens décidé de faire ce qui suit pour sauter le nœud suivant:

Dim test = iParagraphNode.SelectNodes.FirstChild.NextSibling.Name = "tag" 
Questions connexes