2009-11-30 5 views
0

nous savons que tout le blog montrer parl'application analyse syntaxique/atom + xml en page html

<link rel="alternate" type="application/rss+xml" title="MyBlog RSS Feed" href="http://feeds.feedburner.com/MyBlog" /> 

flux rss de son blog, mais êtes-vous en connaissez regex pour obtenir feedurl de cette

<link rel="alternate" type="application/rss+xml" title="MyBlog RSS Feed" href="http://feeds.feedburner.com/MyBlog" /> 
+1

HTML. Agilité. Pack. – bobince

Répondre

6

Utilisez une requête XPath comme celui-ci:

//link[@type='application/rss+xml']/@href 

Il va retirer une URL de flux RSS pour vous. Ne jamais analyser XML ou HTML avec des expressions régulières, jamais.XPath est spécialement conçu pour interroger XML et HTML facile pour vous. Il est disponible dans presque toutes les piles de technologie, including .NET.

XML n'est pas régulier, et donc regex is the incorrect tool to parse it.

+0

+1 pour XPath ... – alex

+0

que faire si le code HTML n'est pas valide xml? – deerchao