Je voudrais saisir tout lien nom commercial sur (http://mokorea.com/yp_business_list_major.php?cat=4)crawler Python ne fonctionne pas
Voici mon code Python:
from __future__ import unicode_literals
import requests
from scrapy.selector import Selector
def fetch_page(url):
'''1. 웹페이지 다운로드'''
r = requests.get(url)
return r.text
def upso_list_from_listpage(url):
'''2.목록 페이`enter code here`지에서 강의 링크등 추출'''
html = fetch_page(url)
sel = Selector(text=html)
upso_list = sel.xpath('//*[@id="List_0"]/div[4]').extract()
#upso_list = sel.css('.container results .talk-link .media__message a::attr(herf)').extract()
return upso_list
from pprint import pprint
pprint(upso_list_from_listpage('http://mokorea.com/yp_business_list_major.php?cat=4'))
et je tente de lancer py sur rapide, rien montrant en haut
Tout commentaire serait utile.
Pouvez-vous copier la structure HTML de ce site afin que nous puissions le voir? –
vous pouvez tester votre modèle xpath contre votre HTML en utilisant des outils en ligne comme celui-ci: http://videlibri.sourceforge.net/cgi-bin/xidelcgi –
Il est AJAX page générée, vous devez utiliser [Sélénium] (http: // selenium-python.readthedocs.io/) ou quelque chose comme ça. –