2009-10-21 11 views

Répondre

0

Avez-vous essayé d'utiliser le HTML Agility Pack pour l'analyse syntaxique html au lieu d'un élément ui?

+0

Merci, il ne retourne le flux HTML de l'URL que je vais lui passer? –

+0

Je ne sais pas quel type de flux vous recherchez. HTML Agility Pack vous fournira une structure DOM analysée pour html, comme le fait System.Xml pour xml. C'est un excellent outil pour analyser le HTML, mais si vous voulez juste lire le contenu html d'une page en tant que chaîne, utilisez la classe WebClient comme mentionné précédemment. – sisve

2

Vous pouvez également utiliser WebClient:

String url = "http://www.ms.com"; 
    WebClient client = new WebClient(); 

    // Add a user agent header in case the 
    // requested URI contains a query. 

    client.Headers.Add ("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705;)"); 

    Stream data = client.OpenRead (url); 
    //Do stuff here 
    //StreamReader reader = new StreamReader (data); 
    //string s = reader.ReadToEnd(); 
    //Console.WriteLine (s); 
    data.Close(); 
    reader.Close(); 
+0

Merci, c'est du très bon code, ça marche. Savez-vous s'il est possible de retirer la page comme si j'utilisais IE? Il semble que cela n'utilise pas les cookies IE, ce qui est logique, mais le lien que je visite est un forum et ce serait génial si je pouvais le visiter comme si j'étais connecté. Est-ce possible? –

+0

Vous devez créer votre propre HttpRequest et configurer le conteneur de cookies associé pour cela. – sisve

+0

Oui, Simon a raison, vous devez utiliser HttpRequest pour installer les cookies. – jerjer

Questions connexes