2017-08-24 2 views
-1

Ceci est mon code en python. Je peux extraire les tags href juste pas ce qui est à l'intérieur du corps. Est-ce que je devrais "body" avec get() ou "content" ou autre chose?Je ne peux pas extraire le corps d'un tag en utilisant le robot d'indexation en python

import requests 
from bs4 import BeautifulSoup 

def web(): 
    url='https://www.phoenixmarketcity.com/mumbai/brands' 
    source = requests.get(url) 
    plain=source.text 
    soup = BeautifulSoup(plain,"html.parser") 
    for link in soup.findAll('a'): 
     href = link.get('body') 
     print(href)  

web() 
+0

'link.getText()' – eLRuLL

Répondre

0

Je pense ici est ce que vous voulez faire: -

from bs4 import BeautifulSoup 
import requests 
def web(): 
    url='https://www.phoenixmarketcity.com/mumbai/brands' 
    source = requests.get(url) 
    plain=source.text 
    soup = BeautifulSoup(plain,"html.parser") 
    tags = soup('a') 
    for link in tags: 
     href = link.get('href') 
     print(href) 

    web()