Je crée un agrégateur et j'ai commencé avec scrapy comme ensemble d'outils initial. D'abord je n'avais que quelques araignées, mais au fur et à mesure que le projet grandit, il me semble que je pourrais avoir des centaines ou même un millier d'araignées différentes alors que je gratte de plus en plus de sites. Quelle est la meilleure façon de gérer ces araignées, car certains sites ne doivent être explorés qu'une seule fois, d'autres sur une base plus régulière? Scrapy est toujours un bon outil lorsqu'il s'agit de nombreux sites ou recommandez-vous une autre technologie.Gestion de plusieurs araignées avec scrapy
2
A
Répondre
0
Vous pouvez consulter le projet scrapely, qui est des créateurs de scrapy. Mais, pour autant que je sache, il n'est pas adapté à l'analyse de sites contenant du javascript (plus précisément, si les données analysées ne sont pas générées par javascript).
Questions connexes
- 1. Scrapy gestion des araignées dynamiques
- 2. Utiliser plusieurs araignées dans le projet dans Scrapy
- 3. Lier différentes adresses IP à des araignées scrapy
- 4. Exécution de plusieurs araignées en utilisant scrapyd
- 5. Comment puis-je mettre tous les résultats de 2 araignées dans un XML avec scrapy?
- 6. Scraping forums avec scrapy
- 7. Scrapy CrawlSpider règles avec plusieurs callbacks
- 8. Gestion des exceptions utilisant mysql avec adbapi tordu et scrapy
- 9. La façon d'importer des modules dans des araignées scrapy une fois?
- 10. À partir du script scrapy
- 11. Architecture des araignées et grattoirs
- 12. Analyse de plusieurs domaines avec Scrapy sans entrecroisement
- 13. scrapy email Statistiques ou erreurs
- 14. Scrapy nom_domaine pour araignée
- 15. Gestion de plusieurs ViewConrollers
- 16. empêcher les araignées de dessous correspond URL
- 17. Web araignées et authentification HTTP
- 18. Gestion de plusieurs formulaires avec ajax
- 19. Gestion de plusieurs fichiers avec HTML5
- 20. Gestion de plusieurs sélections avec MVVM
- 21. Android: Gestion de droite avec plusieurs notifications
- 22. Gestion de xml complexe avec plusieurs délégués
- 23. Bltoolkit - Gestion de l'identité avec plusieurs db
- 24. Gestion de plusieurs solutions avec NDepend
- 25. Gestion de plusieurs XML avec quelques similitudes
- 26. Gestion de l'authentification avec plusieurs fournisseurs d'appartenance
- 27. Gestion de plusieurs AVAudioPlayers
- 28. Comment utiliser Scrapy
- 29. Comment gérez-vous plusieurs formulaires déroulants grisés avec Scrapy FormRequest
- 30. Téléchargement de photos avec scrapy
Jetez un coup d'œil à [Scrapyd] (http://doc.scrapy.org/fr/latest/topics/scrapyd.html) – reclosedev