J'essaie d'analyser HTML avec BeautifulSoup.parse html tags, basé sur une classe et href tag utilisant belle soupe
Le contenu que je veux est comme ceci:
<a class="yil-biz-ttl" id="yil_biz_ttl-2" href="http://some-web-url/" title="some title">Title</a>
j'ai essayé et obtenu l'erreur suivante:
maxx = soup.findAll("href", {"class: "yil-biz-ttl"})
------------------------------------------------------------
File "<ipython console>", line 1
maxx = soup.findAll("href", {"class: "yil-biz-ttl"})
^
SyntaxError: invalid syntax
ce que je veux est la chaîne: http://some-web-url/
et s'il y avait plus de 10 liens de ce type, vos récupérations seulement la première à droite? – whatf
J'ai modifié ma réponse pour montrer comment vous pouvez trouver tous ces liens dans la page. – infrared
Il peut y avoir des éléments '' sans l'attribut 'href', comme des flèches upvote sur cette page. – jfs