2017-10-21 72 views
0

Je veux obtenir les données sur les actifs totaux, mais retourner toutes les données qui contiennent des actifs totaux. Comment puis-je obtenir les données pour les actifs totaux SEULEMENT?Python: xpath trouve le qui contient le mot exact seulement

from lxml import html 
import requests 

page_inv_n = requests.get('http://quotes.wsj.com/MY/XKLS/HEIM/financials/annual/balance-sheet') 
inv_n = html.fromstring(page_inv_n.content) 
Assets = inv_n.xpath(''//td[contains(.,"Total Assets")]/following-sibling::td/text()')[0] 

La sortie correcte est que 813,655.0 au lieu de 0.50% qui est de trésorerie & ST/Investments Actifs totaux qui contient également actif total aussi.

S'il vous plaît conseiller

Répondre

0

Vous pouvez correspondre à nœud par le contenu du texte exact comme ci-dessous:

//td[text()="Total Assets"]/following-sibling::td/text() 

ou

//td[.="Total Assets"]/following-sibling::td/text() 

dans ce cas, les deux doivent travailler de la même manière