J'essaye de gratter un site Web. Ceci est une continuation de cela soup.findAll is not working for tableComment puis-je gratter un site avec plusieurs pages en utilisant beautifulsoup et python?
J'ai été en mesure d'obtenir les données nécessaires, mais le site a plusieurs pages qui varient selon le jour. Certains jours, il peut y avoir 20 pages et 33 pages sur un autre. Je suis en train de mettre en œuvre cette solution en obtenant le dernier élément Page How to scrape the next pages in python using Beautifulsoup mais quand je suis arrivé à la div téléavertisseurs sur le site que je veux gratter je trouve ce format
<a class="ctl00_cph1_mnuPager_1" href="javascript:__doPostBack('ctl00$cph1$mnuPager','32')">32</a>
<a class="ctl00_cph1_mnuPager_1">33</a>
comment puis-je gratter toutes les pages le site étant donné que le nombre de pages change tous les jours? par la façon dont l'URL de la page ne change pas avec les changements de page.
Est-il possible de révéler le lien de ce site pour obtenir une réponse rapide probablement avec une solution de contournement? – SIM