2011-03-29 6 views
0

Hey, J'ai une page html qui contient par exemple les balises suivantes:Formulation d'une requête xpath?

<p foruri="http://doc.scrapy.org/getting-help:solving-specific-problems" rec="lang.en" id="solving-specific-problems">Hello world!!! From my authoring tool.</p> 

<p foruri="http://doc.scrapy.org/getting-help:getting help" rec="lang.en" id="getting help">Hello world!!! From my authoring tool.</p> 

Maintenant, j'ai écrit un robot en utilisant le framework scrapy en python, dans lequel je l'ai utilisé la requête cxxpath pour trouver la balise foruri comme //@foruri qui devrait me donner l'étiquette foruri où jamais il est présent, mais le problème est qu'il ne cède pas http:

Alors aidez-moi à l'obtenir?

Répondre

0

En supposant que vous souhaitez extraire le foruri attribut de tous les <p> tags:

hxs.select('//p/@foruri').extract()