Je viens de télécharger HTMLAgilityPack et la documentation ne contient aucun exemple.Comment puis-je utiliser HTML Agility Pack pour récupérer toutes les images d'un site Web?
Je suis à la recherche d'un moyen de télécharger toutes les images d'un site Web. Les chaînes d'adresse, pas l'image physique.
<img src="blabalbalbal.jpeg" />
J'ai besoin de tirer la source de chaque étiquette img. Je veux juste avoir une idée de la bibliothèque et de ce qu'elle peut offrir. Tout le monde a dit que c'était le meilleur outil pour le travail.
Modifier
public void GetAllImages()
{
WebClient x = new WebClient();
string source = x.DownloadString(@"http://www.google.com");
HtmlAgilityPack.HtmlDocument document = new HtmlAgilityPack.HtmlDocument();
document.Load(source);
//I can't use the Descendants method. It doesn't appear.
var ImageURLS = document.desc
.Select(e => e.GetAttributeValue("src", null))
.Where(s => !String.IsNullOrEmpty(s));
}
Quel type objet est document dans votre exemple? Je ne peux pas utiliser la méthode .Descendants. S'il vous plaît vérifier ma modification. –
J'ai oublié d'inclure '.DocumentNode'. – SLaks
vérifiez également que vous utilisez la dernière version bêta car la fonctionnalité linq est nouvelle – rtpHarry