Un site Web a HTML intérieur rebâtiecomment obtenir des propriétés html internes d'une balise div dans beautifulsoup
Belle soupe n'est pas extrayait codes HTML embeded.
J'ai besoin d'extraire div élément avec class = qwjRop
pour exemple pas en mesure d'extraire "A ce prix bien" forme balise div
import requests
from bs4 import BeautifulSoup
url="https://www.flipkart.com/hp-pentium-quad-core-4-gb-1-tb-hdd-dos-15-be010tu-notebook/product-reviews/itmeprzhy4hs4akv?page1&pid=COMEPRZBAPXN2SNF"
def clawler(in_url):
source_code = requests.get(in_url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, "html.parser")
for name in soup.findAll('div',{'class':'qwjRop'}):
print(name.prettify())
Pouvez-vous nous donner un échantillon du HTML que vous rencontrez des problèmes d'analyse syntaxique? Et que voulez-vous dire exactement par "codes HTML incorporés"? Voulez-vous dire un iframe? – geekonaut
édité le code complet aimablement regarder dans ... –