2011-05-02 1 views
2

J'ai écrit quelques programmes au cours des derniers mois qui chargent des pages HTML dans une chaîne et font diverses choses comme l'extraction de morceaux. J'écrivais essentiellement ma propre interface graphique pour certains sites qui n'ont pas d'API.C# Recherche dans le code HTML

Je l'ai fait en enchaînant plusieurs String.Substring(), String.IndexOf() et String.LastIndexOf() instructions. Je réalise que ce n'est probablement pas la meilleure façon de le faire - j'étais juste en train d'écrire quelques essais "rapides et sales" pour commencer.

Quelle est la bonne façon d'extraire des jetons d'une page Web? Merci :)

+1

Coin supérieur droit. Une boîte blanche avec le mot "recherche" comme un espace réservé. @Ozzah C'est la chose que tu veux. :) – bzlm

+0

@bzlm Je ne pense pas que ce soit exactement ce que je veux, mais merci quand même. – Ozzah

Répondre

3

Pour XHTML, les charger dans XmlDocument ou XDoxument. Pour le (non-X) HTML, chargez-le dans le HtmlDocument de HTML Agility Pack - l'API est presque identique à XmlDocument, donc il devrait être familier.

+0

XDocument - Linq to XML – VikciaR