Je suis novice dans XPath et je ne parviens pas à analyser une page Web de style wiki avec lxml.Analyse d'une page Web de type wiki, erreur XPath
J'ai une expression suivante:
"".join(tree.xpath('//*[@id="mw-content-text"]/div[1]/p//text()'))
Il fonctionne très bien, mais je dois exclure les enfants dont la classe est « référence » et obtenir un lxml.etree.XPathEvalError avec une expression suivante:
"".join(tree.xpath('//*[@id="mw-content-text"]/div[1]/p//*[not(@class="reference")].text()'))
Quelle est la bonne expression XPath? Merci d'avance :)
Quelle est la page? –