2009-07-27 9 views
0

Je suis à la recherche d'une bibliothèque http (pour C# programme) qui me permettra de télécharger des documents html sur le web. Je suis conscient de l'objet HttpWebRequest et les autres options fournies par la bibliothèque .NET, cependant, j'ai besoin d'une solution plus complète qui serait capable de gérer différents encodages de documents (parfois l'encodage est spécifié dans le document lui-même plutôt que dans le Http en-têtes).Bibliothèque Http complète

Merci.

Répondre

3

Le WCF Rest Starter Kit contient une classe HttpClient qui est très utile - elle est disponible aujourd'hui pour .NET 3.5 SP1 et peut être utilisée immédiatement. Comme il semble être considéré comme une classe utile, il pourrait finir par apparaître dans la future version de .NET 4.0 dans la bibliothèque de classes de base.

Certainement vérifier aussi un tutorial screencast par Aaron Skonnard avec le HttpClient et autres goodies de la WCF repos kit de démarrage et d'autres WCF repos ressources Kit de démarrage:

http://msdn.microsoft.com/en-us/netframework/cc950529.aspx

Marc

+0

Réduit pour .NET 4.0 n'étant pas encore RTM, de sorte que le demandeur ne peut probablement pas l'utiliser dans l'environnement de production pendant quelques mois. –

+0

Je n'étais pas au courant de cela. Downvote défait. –

+1

Merci, sztomi! –

1

Le Webclient La classe fournit tout ce dont vous avez besoin. Pour gérer les cas d'encodage spéciaux, téléchargez le document en tant que flux d'octets, puis faites ce qui est nécessaire.

0

sztomi a raison, la classe Webclient peut probablement faire ce dont vous avez besoin.

Si vous avez besoin d'analyser et de travailler avec le code HTML, consultez le HTML Agility pack (http://www.codeplex.com/htmlagilitypack)

« Ceci est un analyseur HTML agile qui construit une lecture/écriture DOM et prend en charge XPATH ordinaire ou XSLT (vous en fait ne pas avoir à comprendre XPATH ni XSLT pour l'utiliser, ne vous inquiétez pas ...). Il s'agit d'une bibliothèque de code .NET qui vous permet d'analyser les fichiers HTML "hors du web" L'analyseur est très tolérant avec "real world" HTML malformé Le modèle d'objet est très similaire à ce qui est proposé par System.Xml, mais pour les documents HTML (ou les flux). "

Questions connexes