2010-05-22 7 views
4

J'ai essayé d'obtenir une araignée simple à courir avec scrapy, mais l'erreur persiste:Scrapy Impossible de trouver araignée erreur

Could not find spider for domain:stackexchange.com

quand je lance le code avec l'expression scrapy-ctl.py crawl stackexchange.com. L'araignée est la suivante:

from scrapy.spider import BaseSpider 
from __future__ import absolute_import 


class StackExchangeSpider(BaseSpider): 
    domain_name = "stackexchange.com" 
    start_urls = [ 
     "http://www.stackexchange.com/", 
    ] 

    def parse(self, response): 
     filename = response.url.split("/")[-2] 
     open(filename, 'wb').write(response.body) 

SPIDER = StackExchangeSpider()` 

Une autre personne a posté presque les il y a même mois de problème exact, mais n'a pas dit comment ils interviennent, Scrapy spider is not working Je suis les turtorial exactement à http://doc.scrapy.org/intro/tutorial.html, et ne peut pas comprendre pourquoi il ne fonctionne pas.

Quand je lance ce code dans Eclipse je reçois l'erreur

Traceback (most recent call last): File "D:\Python Documents\dmoz\stackexchange\stackexchange\spiders\stackexchange_spider.py", line 1, in <module> from scrapy.spider import BaseSpider ImportError: No module named scrapy.spider

Je ne peux pas comprendre pourquoi il ne trouve pas le module Spider de base. Mon araignée doit-elle être sauvegardée dans le répertoire des scripts?

+0

Mon araignée n'a aucune instruction de règle, donc je ne pense pas que cela s'applique. Je pourrais toutefois avoir tord. – Kristin

+0

Avez-vous la même erreur lors de l'utilisation du DmozSpider défini dans le tutoriel? – unutbu

+0

Je ne l'ai pas essayé avec dmoz comme domaine. tout ce que j'ai vraiment fait était de changer le site qu'il rampe. – Kristin

Répondre

2

essayez d'exécuter python yourproject/spiders/domain.py pour voir s'il y a une erreur de syntaxe. Je ne pense pas que vous devriez permettre l'importation absolue car scrapy repose sur les importations de la famille.

+1

Il dit qu'il ne peut pas trouver le module scrapy.spider – Kristin

+0

ya, le premier numéro dit «Impossible de trouver spider pour le domaine: stackexchange.com» qui est un message scrapy, donc le module scrapy se charge correctement. Et ce dernier problème est lié à eclipse et pythonpath. – Rolando

+1

Problème résolu. Réinstallé sur un autre ordinateur. Doit avoir eu des fichiers mal placés ou mal installés. – Kristin

Questions connexes