Je mène une opération d'extraction en tweepy, mais j'ai remarqué qu'il faut un certain temps pour obtenir un nombre important de tweets. Une estimation approximative serait 3000 tweets dans environ 3-4 heures - je vise 1 million en deux jours. Des requêtes similaires suggèrent que cela pourrait être "juste votre machine", mais j'espérais une réponse plus spécifique. Est-ce que je serais capable d'accélérer les choses si j'utilisais un service de remplacement de serveur avancé? Désolé, je n'ai pas d'expérience en informatique. Voici mon code:Quoi qu'il en soit pour augmenter la vitesse d'extraction de Twitter?
from tweepy import Stream
from tweepy.streaming import StreamListener
class MyListener(StreamListener):
def on_data(self, data):
try:
with open('python2.json', 'a') as f:
f.write(data)
return True
except BaseException as e:
print(Error)
return True
def on_error(self, status):
print(status)
return True
twitter_stream = Stream(auth, MyListener())
twitter_stream.filter(track=['#happy'])
Merci!
Avez-vous besoin seulement des "nouveaux" tweets ou aussi les anciens sont bons? – Giordano
L'avez-vous résolu? – Giordano
Oui, j'avais vraiment besoin des anciens tweets, mais je ne me rendais pas compte que ma fonction stream ne recevait qu'un flux en direct. J'ai implémenté une variante de votre solution ci-dessous et j'obtiens d'excellents résultats. Merci beaucoup! – Michael