2008-10-22 6 views
8

J'essaie d'obtenir les dates des entrées dans deux flux RSS différents à travers feedparser.Analyser différents formats de date de feedparser en python?

Voici ce que je fais:

import feedparser as fp 
reddit = fp.parse("http://www.reddit.com/.rss") 
cc = fp.parse("http://contentconsumer.com/feed") 
print reddit.entries[0].date 
print cc.entries[0].date 

Et voici comment ils sortent:

2008-10-21T22:23:28.033841+00:00 

Wed, 15 Oct 2008 10:06:10 +0000 

Je veux arriver au point où je peux trouver qui est plus récente facilement.

J'ai essayé d'utiliser le module datetime de Python et de chercher dans la documentation de feedparser, mais je ne peux pas résoudre ce problème. Toute aide serait très appréciée.

Répondre

14

L'analyse de dates est pénible avec les flux RSS dans la nature, et c'est là que feedparser peut être d'une grande aide.

Si vous utilisez les propriétés *_parsed (comme updated_parsed), feedparser aura effectué le travail et retournera une date Python 9-uplets en UTC.

Voir http://packages.python.org/feedparser/date-parsing.html pour plus de détails sanglants.

Questions connexes