2010-03-02 5 views

Répondre

3

En dépit d'être facultatifs, la plupart des flux RSS fournissent un élément 'guid' pour chaque élément, qui est une chaîne qui l'identifie de manière unique. Si le flux que vous analysez fournit un tel élément, vous pouvez enregistrer les éléments déjà traités en stockant le GUID quelque part, puis, lorsque vous récupérez le flux, vous pouvez vérifier chaque élément si vous avez déjà stocké ce GUID. Mais n'oubliez pas de sauvegarder également la date de publication, car un article peut avoir été mis à jour entre temps.

Malheureusement, l'élément GUID n'est pas obligatoire, donc si le flux ne le fournit pas, vous devrez peut-être recourir à une combinaison du titre et de la description pour les vérifier. Ma suggestion serait de hacher la description en utilisant SHA-1 ou MD5, puis en vérifiant la description du nouvel élément par rapport aux hachages sauvegardés.