2015-10-30 1 views
1

J'essaie d'utiliser Shell Scrapy pour explorer les pages Web avant d'écrire le crawlé lui-même. Une chose que je trouve qu'il est très difficile de lire la sortie shell Scrappy. Y at-il de toute façon pour rendre la sortie jolie impression?Jolie sortie d'impression avec Scrapy Shell

Par exemple, l'exécution du shell avec la commande

scrapy shell http://www.dmoz.org/Computers/Programming/Languages/Python 

puis la commande avec le shell:

response.css("ul.directory.dir-col > li > a::attr('href')") 

Vous pouvez voir la sortie est tout doté en ligne, difficile à lire. Le format de sortie du shell Scrapy est-il JSON? Comment le rendre lisible?

+0

pouvez-vous coller votre sortie shell? qu'attendez-vous à la place? '.css()' produira un 'SelectorList' qui peut être un peu obscur, mais vous pouvez utiliser' .extract() 'dans la liste des sélecteurs et obtenir des données réelles –

+0

peut-être avec ipython (' pip install ipython') – eLRuLL

+0

avec '.extract()', la sortie est meilleure (toutes les URL sont toujours dans une ligne mais plus lisibles que la liste de sélection. – hanaZ

Répondre

0

Vous pouvez également utiliser firefox avec l'extension firebug pour trouver les xpaths appropriés dans votre code source, puis reformater et essayer dans shell scrapy.