J'utilise Python 2.4/2.5, avec libxm2dom
. Je peux importer un document HTML et construire le DOM. Existe-t-il un moyen de "rechercher" par programme pour un terme donné, et être capable d'élaborer la fonction XPath pour extraire le href
pour le terme? Par exemple, étant donné ce morceau de code HTML du document:Trouvez un élément et renvoyez le XPath en utilisant Python
...
<a href="dog">bigdog</a>
...
Je voudrais avoir une fonction XPath qui trouverait bigdog
, et retourner le XPath pour obtenir le lien href
.
Si vous souhaitez utiliser libxml2 à partir de Python, vous devriez vraiment utiliser lxml. Il fournit une API beaucoup plus puissante et plus pratique que le DOM classique. – lunaryorn
Veuillez travailler sur des questions claires et concises ... voir mes modifications de cette question. –