2010-03-08 4 views
1

J'essaye de construire un script pour récupérer toutes les entrées de flux d'une page donnée, mais je peux obtenir seulement le plus récent. Comment Google Reader le fait-il?Comment puis-je obtenir toutes les entrées de flux depuis une page comme Google Reader? (Puisque RSS est transitoire)

+0

Veuillez préciser: voulez-vous récupérer les entrées de flux qui ne sont plus disponibles? –

+0

Oui, comme google reader. J'ai trouvé ceci comme exemple: http://googlesystem.blogspot.com/2007/06/reconstruct-feeds-history-using-google.html Je pense que je devrais suivre chaque flux et stocker l'information chaque fois il est mis à jour –

Répondre

3

Je suis presque sûr qu'ils le stockent simplement. Une fois que quelqu'un l'ajoute à sa liste, Google Reader commence à archiver et enregistrer chaque entrée.

Si vous trouvez un flux obscur, vous constaterez qu'il ne peut pas revenir en arrière avant de l'avoir utilisé.

+0

C'est en effet exactement ce qu'ils ont fait. Cependant, Google Reader s'est arrêté le 1er juillet 2013. Les remplacements incluent des services comme [Superfeedr] (https://superfeedr.com) –

1

La plupart des scripts générateurs de flux sont programmés pour n'inclure qu'un nombre spécifié d'entrées, par exemple les dix publications les plus récentes sur un blog. Comme nous l'avons déjà dit, Google Reader télécharge et archive tous les nouveaux messages de chaque flux unique des lecteurs de ses utilisateurs. C'est pourquoi vous pouvez voir des matériaux plus anciens dessus.

Si la page est la vôtre, vous pouvez essayer d'augmenter le nombre d'entrées incluses dans le flux RSS. Sinon, il n'y a aucun moyen de récupérer des entrées d'une page via RSS si ces entrées ne sont plus disponibles dans le flux.

+0

En fait, il existe un moyen de le faire via google reader: http://googlesystem.blogspot.com /2007/06/reconstruct-feeds-history-using-google.html –

+0

C'est très pratique, et je ne savais pas que vous pouviez le faire, mais cela ne résout toujours pas le problème de la récupération de données qui ne sont pas alimentées au script RSS plus longtemps, et qui n'a pas été mis en cache par Google (dans les flux obscurs, comme suggéré plus tôt). Ce n'est probablement pas le cas pour la plupart des sites auxquels beaucoup de gens s'abonnent, car ils auront probablement eu au moins un abonné aussi loin que n'importe qui se soucie de regarder. Pour les sites moins populaires, cependant, il peut y avoir un problème. Par exemple, mon propre blog n'a que 106 messages archivés, sur 197 au total. –

Questions connexes