2009-05-11 11 views
0

J'essaie de trouver un moyen de tirer tous les tweets d'un terme de recherche spécifique via PHP et l'API de recherche Twitter.Tirer plusieurs pages de termes de recherche de Twitter

La fonctionnalité inclut donc 1. Inclure un terme de recherche 2. Tirer des termes de chaque page. 3. Ne tirez que les nouveaux termes de la dernière recherche 4. Exportez vers un fichier DB ou un fichier plat.

Je suis assez clair sur tous ces sauf pour traverser sur plusieurs pages

Répondre

5

L'API twitter prend un paramètre de numéro de page. Dans les résultats de l'atome, il y a des éléments de lien, avec des attributs rel pour next et previous. Ce sera votre meilleur indicateur quant à savoir si vous devriez aller chercher une deuxième page et ainsi de suite. L'attribut href de cette balise vous indiquera même l'URL que vous devriez demander.

La requête que vous créez prend également un paramètre since_id. Vous souhaiterez stocker le plus grand numéro d'identifiant que vous voyez dans vos réponses et l'utiliser dans les demandes suivantes afin de ne pas avoir à filtrer les doublons. En ce qui concerne le stockage de données, votre choix est probablement guidé par ce que vous envisagez de faire avec les résultats ... si vous faites des requêtes, vous devriez probablement les classer dans une base de données, c'est-à-dire MySQL . Si vous êtes en train de vous connecter, un fichier plat devrait vous suffire.

+0

Assurez-vous de ne pas utiliser le paramètre obsolète depuis, cela renverra des données vraiment indésirables :) –

0

Le twitter search api prend un paramètre de page:

# page:. en option Le numéro de page (à partir de 1) pour revenir, jusqu'à un maximum d'environ 1500 résultats (basé surrpp* page. Remarque: il existe des limites de pagination.

* Example: http://search.twitter.com/search.atom?q=devo&rpp=15&page=2 
Questions connexes