Je veux extraire du texte de tweet japonais en utilisant l'API tweet. Y a-t-il un exemple de code sur ce problème? Je veux juste extraire les tweets japonais qui n'utilisent pas un mot-clé.Python tweepy: comment extraire un tweet japonais sans utiliser de mots-clés
0
A
Répondre
0
Vous pouvez ajouter la touche 'lang' lorsque vous faites une requête pour restreindre la langue.
Selon le document, il est dit "Restreint les tweets à la langue donnée, donnée par un code ISO 639-1." La détection de la langue est le meilleur effort. "
Il conduit à quelque chose comme ceci:
import json
from requests_oauthlib import OAuth1Session
tw = OAuth1Session("CONSUMER_KEY", "CONSUMER_SECRET", "ACCESS_TOKEN", "ACCESS_TOKEN_SECRET")
url = "https://api.twitter.com/1.1/search/tweets.json"
params = {'q' : "keyword", 'count' : 100, 'lang' : 'ja'}
while True:
req = tw.get(url, params=params)
if req.status_code == 200:
tweets = json.loads(req.text)
for tweet in tweets['statuses']:
print(tweet['text'])
print("<<<<<<<<<<<<<<<<<<<")
Merci pour votre réponse. Pourriez-vous me dire ce que c'est? – tktktk0711
hi @ shogo2022 comment obtenir plus de tweets tels que 10000. Après avoir mis le compte: 10000, mais je ne peux obtenir environ 100 tweets. Comment résoudre ce problème – tktktk0711
@ tktktk0711 il pourrait être [limite de taux] (https://dev.twitter.com/rest/public/rate-limiting) sur Twitter API de recherche, vous pouvez vérifier comment la limite de taux est calculée dans [Comment fonctionne la limite de taux dans twitter dans l'API de recherche] (https://stackoverflow.com/questions/21305547/how-rate-limit-works-in-twitter-in-search-api). L'API de recherche ne renvoie que les tweets des 7 derniers jours, mais je crois qu'il y a beaucoup plus de 10K tweets en japonais. – shogo2022