Supposons que j'ai un extrait de HTML comme ceci:En Python, comment supprimer la balise "root" dans un extrait de code HTML?
<div>
Hello <strong>There</strong>
<div>I think <em>I am</em> feeing better!</div>
<div>Don't you?</div>
Yup!
</div>
Quelle est la meilleure/façon la plus robuste pour éliminer l'élément racine environnant, il ressemble à ceci:
Hello <strong>There</strong>
<div>I think <em>I am</em> feeing better!</div>
<div>Don't you?</div>
Yup!
J'ai essayé d'utiliser lxml.html comme ceci:
lxml.html.fromstring (fragment_string) .drop_tag()
Mais cela ne me donne "Bonjour", que je suppose mak es sens. De meilleures idées?
Cela fonctionne très bien; Merci! Juste pour compléter ceci: def remove_root (html): analysé = lxml.html.fromstring (html) return (parsed.text ou '') + '' .join ([lxml.html.tostring (enfant) pour enfant dans analysé]) –