J'utilise XQuery pour extraire le contenu des pages html. La structure du corps html est de ce genre:Xquery analyse le texte avec <a> tags
<td>
<a href ="hw1">xyz </a>
Hello world 1
<a href="hw2">Helloworld 2</a>
Helloworld 3
</td>
Mon expression XQuery pour extraire le texte comme suit:
//a[starts-with(@href,'hw1')]/following-sibling::text()
Cette expression me donne:
Helloworld 1 Helloworld 2 Helloworld 3
Je voudrais l'avoir de cette façon: Helloworld 1 Helloworld 2 Helloworld 3 ou Helloworld 1 Helloworld 3
Comment puis-je spécifier pour analyser le texte ci-joint par tags
Je n'ai pas beaucoup travaillé avec XQuery, donc quelqu'un de plus expérimenté devra m'aider. Cependant, vous avez un tag 'a' imbriqué, ce qui n'est pas autorisé en HTML. Cela peut faire partie du problème. – Mike
Est-il également possible d'obtenir la sortie en tant que Helloworld 1 Helloworld 2 Helloworld 3 – Technocrat
Oups J'ai égaré l'étiquette. Désolé.