2009-04-24 5 views
3

Quels algorithmes prêts disponibles puis-je utiliser pour les données mine Twitter pour connaître les degrés de séparation entre 2 personnes sur Twitter. Comment ça change quand le graphique social continue de changer et de se mettre à jour constamment.Twitter Data Mining: Degrés de séparation

Et puis, y a-t-il un vidage des données de graphe social Twitter que je pourrais utiliser plutôt que de faire autant d'appels d'API pour recommencer.

Répondre

0

Il y avait une entreprise qui offre une décharge du graphe social, mais il a été pris vers le bas et ne sont plus disponibles. Comme vous l'avez déjà compris, c'est un peu dur, car il change tout le temps.

Je vous recommande de vérifier leurs méthodes api social_graph car elles donnent le plus d'informations avec le moins d'appels d'API.

5

De l'Twitter API

What's the Data Mining Feed and can I have access to it?

The Data Mining Feed est une version étendue de notre/statuts/public_timeline méthode API REST. Il renvoie 600 états publics récents, mis en cache une minute à la fois. Vous pouvez le demander jusqu'à une fois par minute pour obtenir un échantillon représentatif des statuts publics sur Twitter. Nous offrons ceci gratuitement (et sans garantie de qualité de service) aux chercheurs et aux amateurs. Tout ce que nous demandons, c'est que vous fournissiez une brève description de votre recherche ou projet et l'adresse IP (s) que vous allez demander le flux; il suffit de remplir ce formulaire. Notez que le flux d'exploration de données n'a pas pour but de fournir un flux contigu de toutes les mises à jour publiques sur Twitter; veuillez voir ci-dessus pour plus d'informations sur la solution "firehose" à venir.

et voir aussi: Streaming API Documentation

+0

Droit .. mais .. l'algorithme? – Bluu

0

Il pourrait y avoir d'autres façons de le faire, mais je viens de passer les 10 dernières minutes regardant faire quelque chose de similaire et sommes tombés sur ce Q.

j'utiliser un non-orienté (& pondéré - comme je veux graphique) - utiliser JgraphT ou similaire dans py; JGraphT est basé sur Java mais inclut différents algos pré-écrits.

Vous pouvez ensuite utiliser un algorithme appelé BellmanFord; prend une entrée entière et recherche dans le graphique le chemin le plus court avec l'entrée entière, et seulement l'entrée entière, contrairement à Dijkstras.

http://en.wikipedia.org/wiki/Bellman%E2%80%93Ford_algorithm

Je l'ai utilisé récemment dans un projet pour le routage de vol, itérer jusqu'à trouver le plus court chemin le plus court avec « bonds » (bords).