J'essaie d'extraire le texte dans la colonne 1 et la colonne 3 dans la ligne suivante après les premier et deuxième en gras dans une table html utilisant BeautifulSoup. Les textes en gras n'ont pas de classes ou d'identifiants, et sont au même niveau que les lignes au-dessus et en dessous d'eux. Je suppose que je devrais utiliser next_sibling, mais je ne sais pas exactement comment s'y prendre.Extraire des colonnes spécifiques dans la rangée après chaque rubrique en gras dans la table HTML utiliser BeautifulSoup
Vous pouvez trouver HTML de la table ici: https://github.com/Tokaalmighty/topmover_table_html/blob/master/html
Voilà ma logique:
soup=bs(f1,'html.parser')
topmovers=soup.find('table',{'class':'topmovers'})
bold=topmovers.find_all('b')
gainer=bold[0]
gainer_name=bold.find('tr').next_sibling
gcol1=gainer_name[0]
gcol3=gainer_name[2]
loser=bold[1]
loser_name=bold.find('tr').next_sibling
lcol1=loser_name[0]
lcol3=loser_name[2]
print(gcol1,gcol3,lcol1,lcol3)
pouvez-vous partager la structure html? – eLRuLL