J'essaie d'utiliser BeautifulSoup et des expressions régulières pour obtenir l'adresse IP du site Web (http://www.gatherproxy.com/).comment utiliser beautifulsoup et l'expression régulière pour obtenir l'adresse IP d'un site Web proxy
En inspectant le site, j'ai vu que l'adresse IP existante dans le format suivant:
<tr class="proxy 149-56-34-94-225F" prx="149.56.34.94:8799" time="2017-03-29T15:42:33Z" type="Transparent" country="United States" port="8799" tmres="797"><td>2m 54s ago</td><td>149.56.34.94</td><td><a>
<tr class="proxy 138-68-180-44-1FB6" prx="138.68.180.44:8118" time="2017-03-29T15:42:32Z" type="Elite" country="United States" port="8118" tmres="47"><td>3m 25s ago</td><td>138.68.180.44</td><td><a>
Je me sers le code suivant pour obtenir chaque balise
soup.find_all(name='tr',attrs={'class':re.compile(r"proxy [0-9a-zA-Z]+-[0-9a-zA-Z]+-[0-9a-zA-Z]+-[0-9a-zA-Z]+-[0-9a-zA-Z]+")})
Mais la sortie est rien.
Merci Zroq! Votre code fonctionne parfaitement. Avez-vous une idée de pourquoi mon code précédent ne fonctionne pas? – shawn123
Le 'tr' que vous essayiez de trouver est généré via javascript, que BeautifulSoup ne peut pas analyser. Vous pouvez utiliser du sélénium pour ce genre de choses. – Zroq