2010-04-16 5 views
4

Je construis un outil de base de données + qui scourt les flux de nouvelles pour un certain terme. Par exemple "intoxication alimentaire à partir de noix". Je veux parcourir les sites de médias sociaux, les sites d'information, les principaux agrégateurs de nouvelles, etc ... pour ce terme.Nouvelles flux API pour les nouvelles générales

  • Question 1: Quelles sont les nouveautés des API d'agrégation?
  • Question 2: Comment procéderiez-vous au codage et recevant seulement les dernières nouvelles de l'API?

Modifier Ajouté schématique: alt text http://koopics.com/news_parser.jpg

Répondre

4

Connaissez-vous Yahoo! Pipes? C'est un agrégateur de flux très flexible, et vous pouvez le manipuler en utilisant YQL, qui est assez puissant et a une librairie Python, python-yql :). YQL a également des "tables" spécifiques pour Twitter et d'autres services et sources d'informations, donc, selon ce que vous voulez, vous n'aurez peut-être même pas besoin de Pipes.

Il y a un exemple rapide de tuyaux + d'utilisation YQL à http://blog.ouseful.info/2009/04/27/using-yql-with-yahoo-pipes/, mais vous pouvez jouer avec eux au YQL Console.

Donc, c'est votre "Question 1". Mais, en utilisant YQL, « Question 2 » (si je comprends correctement) vient naturellement, comme vous l'utilisez presque comme SQL régulière, imposer des limites, la commande etc.

+0

+1 Je cherchais quelque chose comme ça :) Voici un intéressant [diapo] (http://www.slideshare.net/ConSanFrancisco123/yahoo-pipes-middleware-in-the-cloud) – CoderHawk

+0

@ Sandy: sympa, bonne référence :) – rbp

0

Si vous avez un soutien financier soutenant votre projet , Reuters a des flux de données de nouvelles que vous pouvez vous abonner sur une base mensuelle.

1

Avez-vous essayé Universtal Feed Parser ??

+0

Un rapide coup d'oeil sur le site dit qu'ils n'ont pas été mis à jour depuis 2007 – dassouki

+0

Mais ça ne fait pas ce que vous voulez? –

Questions connexes