2010-10-18 2 views

Répondre

2

Vous pouvez utiliser ROME (je le suggère d'abord) pour analyser les flux RSS et Atom. Sinon, vous devrez utiliser un analyseur SAX ou créer un arbre DOM et procédez comme suit:

Pour RSS:
En RSS, vous devrez vérifier qu'il ya un élément rss, et il est enfant doit contenir un élément channel. Il peut y avoir 0 ou plus item en RSS (j'ai peut-être tort).

Exemple:

<?xml version="1.0" encoding="UTF-8" ?> 
<rss version="2.0"> 
<channel> 
    <title>RSS Title</title> 
    <description>This is an example of an RSS feed</description> 
    <link>http://www.someexamplerssdomain.com/main.html</link> 
    <lastBuildDate>Mon, 06 Sep 2010 00:01:00 +0000 </lastBuildDate> 
    <pubDate>Mon, 06 Sep 2009 16:45:00 +0000 </pubDate> 

    <item> 
     <title>Example entry</title> 
     <description>Here is some text containing an interesting description of the thing to be described.</description> 
     <link>http://www.wikipedia.org/</link> 
     <guid>unique string per item</guid> 
     <pubDate>Mon, 06 Sep 2009 16:45:00 +0000 </pubDate> 
    </item> 

</channel> 
</rss> 

Pour Atom:
Dans Atom, vous devez vérifier qu'il ya un élément feed. Il peut y avoir 0 ou plus entry dans Atom. (J'ai peut être tort).

Exemple:

<?xml version="1.0" encoding="utf-8"?> 
<feed xmlns="http://www.w3.org/2005/Atom"> 

    <title>Example Feed</title> 
    <subtitle>A subtitle.</subtitle> 
    <link href="http://example.org/feed/" rel="self" /> 
    <link href="http://example.org/" /> 
    <id>urn:uuid:60a76c80-d399-11d9-b91C-0003939e0af6</id> 
    <updated>2003-12-13T18:30:02Z</updated> 
    <author> 
     <name>John Doe</name> 
     <email>[email protected]</email> 
    </author> 

    <entry> 
     <title>Atom-Powered Robots Run Amok</title> 
     <link href="http://example.org/2003/12/13/atom03" /> 
     <link rel="alternate" type="text/html" href="http://example.org/2003/12/13/atom03.html"/> 
     <link rel="edit" href="http://example.org/2003/12/13/atom03/edit"/> 
     <id>urn:uuid:1225c695-cfb8-4ebb-aaaa-80da344efa6a</id> 
     <updated>2003-12-13T18:30:02Z</updated> 
     <summary>Some text.</summary> 
    </entry> 

</feed> 

PS: Je ne sais pas quelle version RSS ou une version Atom que vous voulez mettre en œuvre, mais suivre leurs directives.