J'essaye de gratter des données de "http://www.landwatch.com/Philippines_land_for_sale/Land"; ce dont j'ai besoin, c'est l'adresse et les prix. Ma méthodologie utilise le module de belle soupe en python. Je me suis coincé quand j'ai inspecté la page html, également avec le codage. Que certains d'entre vous me donnent un indice pour que je puisse passer à autre chose. Fondamentalement, l'inspection Web a indiqué que l'information nécessaire est de div class = propriété claire à gauche, et voici le code:Python: AttributeError et défis sur le Web scraping
from lxml import html
import requests
import bs4 as bs
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
my_url = 'http://www.landwatch.com/Philippines_land_for_sale/Land'
#Openning up connection, grabbing the page
uClient = uReq(my_url)
page_html = uClient.read()
soup = bs.BeautifulSoup(page_html,'lxml')
g_data = soup.find_all("div",{"class": "clear property left"})
for item in g_data:
print(item).contents[0]
grâce,
Merci beaucoup Tiny.D !!! Une question plus rapide comment avez-vous trouvé l'information de prix et d'adresse est dans de propName ?? Je ne pouvais même pas voir ça. –
@ M.C vérifier la mise à jour. –