2011-04-15 2 views
7

Comment je peux définir cela? J'ai écrit handle_httpstatus_list = [301, 302, 303], mais scrapy ne suit pas les nouveaux liens, il a juste commencé à enregistrer des fichiers vides de pages.Suivez les liens de redirection dans scrapy

P.S. L'anglais n'est pas ma langue maternelle. Exile-moi pour ça.

Répondre

5

Vous devrez également mentionner dont_redirect = true dans votre demande:

meta = {'dont_redirect': True, "handle_httpstatus_list" : [301, 302, 303]} 

Cordialement

+0

Merci beaucoup, c'était exactement ce que je cherchais. Ajout du "handle_httpstatus_list" aux demandes individuelles était ce qui a fait l'affaire. –

5

Scrapy ne gère réoriente par défaut, ce qui signifie que le RedirectMiddleware est activé dans le cadre DOWNLOADER_MIDDLEWARES et le réglage REDIRECT_ENABLED est mis à True.

Questions connexes