J'ai essayé d'obtenir une araignée simple à courir avec scrapy, mais l'erreur persiste:Scrapy Impossible de trouver araignée erreur
Could not find spider for domain:stackexchange.com
quand je lance le code avec l'expression scrapy-ctl.py crawl stackexchange.com
. L'araignée est la suivante:
from scrapy.spider import BaseSpider
from __future__ import absolute_import
class StackExchangeSpider(BaseSpider):
domain_name = "stackexchange.com"
start_urls = [
"http://www.stackexchange.com/",
]
def parse(self, response):
filename = response.url.split("/")[-2]
open(filename, 'wb').write(response.body)
SPIDER = StackExchangeSpider()`
Une autre personne a posté presque les il y a même mois de problème exact, mais n'a pas dit comment ils interviennent, Scrapy spider is not working Je suis les turtorial exactement à http://doc.scrapy.org/intro/tutorial.html, et ne peut pas comprendre pourquoi il ne fonctionne pas.
Quand je lance ce code dans Eclipse je reçois l'erreur
Traceback (most recent call last): File "D:\Python Documents\dmoz\stackexchange\stackexchange\spiders\stackexchange_spider.py", line 1, in <module> from scrapy.spider import BaseSpider ImportError: No module named scrapy.spider
Je ne peux pas comprendre pourquoi il ne trouve pas le module Spider de base. Mon araignée doit-elle être sauvegardée dans le répertoire des scripts?
Mon araignée n'a aucune instruction de règle, donc je ne pense pas que cela s'applique. Je pourrais toutefois avoir tord. – Kristin
Avez-vous la même erreur lors de l'utilisation du DmozSpider défini dans le tutoriel? – unutbu
Je ne l'ai pas essayé avec dmoz comme domaine. tout ce que j'ai vraiment fait était de changer le site qu'il rampe. – Kristin