J'ai été en mesure d'extraire la valeur href des ancres dans une chaîne html. Maintenant, ce que je veux réaliser est d'extraire la valeur href et de remplacer cette valeur par un nouveau GUID. J'ai besoin de renvoyer à la fois la chaîne html remplacée et la liste de la valeur href extraite et son GUID correspondant.Extrait et remplace groupe regex
Merci d'avance.
Mon code existant est comme:
Dim sPattern As String = "<a[^>]*href\s*=\s*((\""(?<URL>[^\""]*)\"")|(\'(?<URL>[^\']*)\')|(?<URL>[^\s]*))"
Dim matches As MatchCollection = Regex.Matches(html, sPattern, RegexOptions.IgnoreCase Or RegexOptions.IgnorePatternWhitespace)
If Not IsNothing(matches) AndAlso matches.Count > 0 Then
Dim urls As List(Of String) = New List(Of String)
For Each m As Match In matches
urls.Add(m.Groups("URL").Value)
Next
End If
Exemple chaîne HTML:
<html><body><a title="http://www.google.com" href="http://www.google.com">http://www.google.com</a><br /><a href="http://www.yahoo.com">http://www.yahoo.com</a><br /><a title="http://www.apple.com" href="http://www.apple.com">Apple</a></body></html>
Merde. Seulement remarqué que j'avais dupliqué votre réponse après le fait. +1 :) –