J'essaie d'extraire tous les liens qui contiennent/thumb/dans les "". En fait, j'ai seulement besoin d'utiliser les images src. Je ne sais pas si les images se termineront avec jpg ou s'il y aura des problèmes de sensibilité à la casse, etc. Je me soucie vraiment du lien complet.Pourquoi cette regex est-elle gourmande?
m = Regex.Match(page, @"""(.+?/thumbs/.+?)""");
//...
var thumbUrl = m.Groups[1].Value;
Mon code complet
var page = DownloadWebPage(url);
var reg = new Regex(@"Elements\s+\((.*)\)", RegexOptions.Multiline);
var m = reg.Match(page);
var szEleCount= m.Groups[1].Value;
int eleCount = int.Parse(szEleCount);
m = Regex.Match(page, @"""(.+?/thumbs/.+?)""");
while (m.Success)
{
var thumbUrl = m.Groups[1].Value;
//i break here to see a problem
m = m.NextMatch();
}
thumbUrl ressemble
centre \ "> ... beaucoup de texte, pas/pouces/... src = \" http://images.fdhkdhfkd.com/thumbs/dfljdkl/22350.jpg
Pour votre information, l'option 'Multiline' ISN » t faire quelque chose pour vous. Si vous voulez que le point corresponde aux séparateurs de ligne, vous devez utiliser 'Singleline' à la place. –