2017-04-25 2 views
0

Set-upScrapy: commande pour écraser précédent fichier d'exportation

exporter mes données vers un fichier .csv par la commande standard dans le Terminal (Mac OS), par exemple

scrapy crawl spider -o spider_ouput.csv 

Problème

Lors de l'exportation d'une nouvelle spider_output.csv Scrapy au joint spider_output.csv existant.

Je peux penser à deux solutions,

  1. Commande Scrapy Ecrasement au lieu de append
  2. Terminal
  3. commande pour supprimer l'existant spider_output.csv avant ramper

J'ai lu que (à ma surprise) Scrapy actuellement isn't able à faire 1. Certaines personnes ont proposé workarounds, mais je ne peux pas sembler obtenir it au travail.

J'ai trouvé un answer à la solution 2, mais je ne peux pas le faire fonctionner non plus.

Quelqu'un peut-il m'aider? Peut-être y a-t-il une troisième solution à laquelle je n'ai pas pensé?

Répondre

3

Il y a un problème ouvert avec scrapy pour cette fonction: https://github.com/scrapy/scrapy/issues/547

Il y a quelques solutions proposées dans le fil d'émission:

scrapy runspider spider.py -t json --nolog -o - > out.json 

Ou tout simplement supprimer la sortie avant de lancer araignée scrapy:

rm data.jl; scrapy crawl myspider -o data.jl 
+0

merci pour la réponse. J'ai essayé votre ligne de suppression, et cela fonctionne! :) – LucSpan

+0

@LucSpan grand, si elle a répondu à votre question, n'oubliez pas de cliquer sur "accepter la réponse" bouton à la gauche de la réponse. – Granitosaurus

+0

Vous étiez si rapide: ne pouvait pas encore accepter. – LucSpan