J'utilise hxt pour analyser certains fichiers html. Il a été déplacé html à l'intérieur <textarea>
. hxt donne des résultats invalides (il tombe sur un tag avec du contenu dans ce cas c'est <a>
). testcase minimale (pour GHCi) estEst-il possible d'analyser par hxt <textarea> avec <a> dedans?
let doc = parseHtml "<textarea>before<a>link</a>after</textarea>"
runX . xshow $ doc //> hasName "textarea"
qui donne [<textarea>before</textarea><textarea/>]
en conséquence.
Il semble que les balises sans contenu (par exemple, <tag/>
) ne perturbent pas l'analyse.
Existe-t-il un moyen d'analyser un tel code html avec hxt?
L'autre option que j'ai regardée est html-conduit avec [dom-selector] (http://hackage.haskell.org/package/dom-selector) elle utilise du texte donc ça devrait être plus efficace mais pour mon l'efficacité de la tâche n'est pas un gros problème et l'interface flèche hxt semble un peu plus intuitive, donc je vais avec votre solution, merci – Qrilka