Je cours en utilisant scrapy leur API interne et tout est bien et bien jusqu'à présent. Mais j'ai remarqué que ce n'est pas complètement en utilisant la concurrence de 16 comme mentionné dans les paramètres. J'ai changé le délai à 0 et tout ce que je peux faire d'autre. Mais ensuite, en regardant les requêtes HTTP envoyées, il est clair que ce scrapy ne télécharge pas exactement 16 sites à tout moment. A un certain moment, il ne télécharge que 3 à 4 liens. Et la file d'attente n'est pas vide à ce moment-là. Quand j'ai vérifié l'utilisation de base, ce que j'ai trouvé était que sur le noyau 2, l'un est 100% et l'autre est la plupart du temps inactif.Scrapy Utiliser à la fois le CORE dans le système
C'est à ce moment-là que je me suis rendu compte que la bibliothèque tordue au-dessus de laquelle scrapy est construit est à simple filetage et c'est pourquoi elle n'utilise qu'un seul noyau.
Y at-il une solution de contournement pour convaincre scrapy d'utiliser tout le noyau?