2009-12-08 5 views
0

Je travaille sur un projet pour le plaisir mais je veux récupérer le code html d'un site web que je devrai extraire juste les liens.Saisir du code HTML depuis le web

J'ai été googling pendant quelques minutes et je n'ai rien trouvé qui fasse ce que je veux spécifiquement (juste le texte).

+1

... Je ne peux pas résister .... ... "spécifiquement"! – joshcomley

Répondre

4
WebClient client = new WebClient(); 
String htmlCode = client.DownloadString("http://born2code.net"); 
6

Ce que vous voulez est le HTML Agility Pack

+0

J'ai entendu que cela ne fonctionnera que si la page que j'utilise comme ma cible valide comme html. Est-ce vrai? – Crash893

+0

HTML Agility Pack est plutôt indulgent pour le code HTML malformé - s'il s'affiche dans un navigateur, la bibliothèque peut probablement l'analyser. –

2

Avez-vous regardé un outil standard comme Httrack, ou si vous voulez voulez réellement le code html si vous programmez pour un look amusant à WebClient ou HttpWebRequest si vous veux en savoir plus.

Questions connexes