2010-02-11 2 views
8

A partir de l'extrait de code HTML suivant:Obtenir certaine valeur d'attribut à l'aide XPath

<link rel="index" href="/index.php" /> 
<link rel="contents" href="/getdata.php" /> 
<link rel="copyright" href="/blabla.php" /> 
<link rel="shortcut icon" href="/img/all/favicon.ico" /> 

J'essaie d'obtenir la valeur href de la balise link avec la valeur rel = "shortcut icon", je suis en train de réaliser que l'utilisation de XPath .

Comment faire cela en Python?

Répondre

15

Comme ceci:

data = """<link rel="index" href="/index.php" /> 
<link rel="contents" href="/getdata.php" /> 
<link rel="copyright" href="/blabla.php" /> 
<link rel="shortcut icon" href="/img/all/favicon.ico" /> 
""" 

from lxml import etree 

d = etree.HTML(data) 

d.xpath('//link[@rel="shortcut icon"]/@href') 
['/img/all/favicon.ico'] 
Questions connexes