2010-01-18 4 views

Répondre

1

Les expressions régulières ne peuvent pas être utilisées pour analyser le code HTML; Le HTML n'est pas régulier. Utilisez une bibliothèque de parseurs HTML appropriée.

+0

Vous avez des suggestions à formuler? j'utilise asp.net C# –

+0

Non. http://stackoverflow.com/questions/100358/looking-for-c-html-parser –

1

Cela dépend de la régularité du texte HTML. Par exemple, étant donné ce tableau:

<table> 
    <tr><td>1</td><td>Apple</td></tr> 
    <tr><td>2</td><td>Ball</td></tr> 
    <tr><td>3</td><td>Cookie</td></tr> 
<table> 

L'expression regex suivante trouve les ID dans la première colonne:

(?<=<tr><td>).*?(?=</td>) 
0

Si vous exécutez la page par un html-parser comme BeautifulSoup, vous pouvez enjoliver si ce genre de regex a une chance. Mais si vous analysez le code html de toute façon ...

0

Essayez cette

Dim HTML As String = contentText 
Dim options As RegexOptions = RegexOptions.IgnoreCase Or RegexOptions.Singleline 
Dim regex As Regex = New Regex("<table[^>]*>(.*)</table>", options) 
Dim match As MatchCollection = regex.Matches(HTML) 
Dim sb As StringBuilder = New StringBuilder 
For Each items As Match In match 
    sb.Append(items.ToString & vbLf) 
Next 
TextBox.Text = sb.ToString 
Questions connexes