je le code HTML suivant:Obtenir la première instance de texte pour l'élément parent dans BeautifulSoup
<div>
<h5>Item1</h5>
$14.00<br>
<br>
<h5>Item2</h5>
$16.29 (Shop Rite)<br>
$15.49 (Costco)<br>
<br>
<h5>Item3</h5>
...
</div>
Je suis en train d'organiser cette information dans une liste en fonction du nombre d'éléments, comme par exemple:
+--------+--------------------+
| Item1 | $14.00 (BJs) |
| Item2 | $16.29 (Shop Rite) |
| Item2 | $15.49 (Costco) |
+--------+--------------------+
Je voudrais quelque chose de similaire à ce qui suit:
Items = []
if (BS.find('h5', text="Item1")):
for content in BS.find('h5', text="Item1").parent:
Price = BS.find('h5', text="Item1").parent.content[0]
Items.append("Item1", Price)
Mon objectif principal est d'être en mesure d'obtenir le texte de Eparés individuellement par les balises <br>
, puis stockés dans une liste appelée Items
mais je ne suis pas sûr de savoir comment parcourir chaque balise <br>
de la balise en fonction de la balise <h5>
.