Je souhaite extraire divers éléments de tables et de textes de paragraphes de ce site Web.Extraction d'éléments Web à partir de sites Web utilisant Python
https://www.instituteforsupplymanagement.org/about/MediaRoom/newsreleasedetail.cfm?ItemNumber=30655
Ce code J'utilise:
import lxml
from lxml import html
from lxml import etree
import urllib2
source = urllib2.urlopen('https://www.instituteforsupplymanagement.org/about/MediaRoom/newsreleasedetail.cfm?ItemNumber=30656&SSO=1').read()
x = etree.HTML(source)
growth = x.xpath("//*[@id="home_feature_container"]/div/div[2]/div/table[2]/tbody/tr[3]/td[2]/p)")
growth
Quelle est la meilleure façon d'extraire les éléments que je veux d'un site Web sans avoir à changer le XPath dans le code à chaque fois? Ils publient de nouvelles données sur le même site tous les mois, mais le XPath semble parfois changer un peu.
Quels sont les éléments que vous voulez? votre XPath n'est pas valide et ne peut pas être testé sur cette page. –
J'ai changé le xpath. J'ai besoin d'éléments de la table «Fabrication en un coup d'œil». Et aussi le texte du paragraphe. –