2010-06-12 4 views
1

Je voudrais comprendre ce que fait le code suivant. Cette logique fait partie d'une routine pour supprimer le code HTML du corps d'un message électronique.Que fait l'expression Regex suivante?

mBBSREgEx.IgnoreCase = True 
mBBSREgEx.Global = True 
mBBSREgEx.Pattern = "<[^>]*>" 
sResult = mBBSREgEx.Replace(sResult, "") 

Merci, Jim

Ok, si je voulais changer la routine pour dépouiller les balises construites comme [b] Bonjour [/ b] au lieu de celui existant qui strils sur "<" et ">" tags, comment changer le motif?

Est-ce que cela fonctionnerait?

mBBSREgEx.Pattern = "\[[^\]]*\]" 

Merci, Jim

Répondre

4

Il remplace tous les tags avec des chaînes vides.

Il recherche une ouverture <, puis prend autant de caractères que possible qui ne sont pas >, puis il trouve une fermeture >. Enfin, il remplace tout cela (tout de < à >) avec une chaîne vide, en supprimant efficacement les balises HTML.

+0

+1 pour l'explication plutôt que juste une réponse. – richsage

0

Le schéma suivant dépouillerait des balises construites comme [b] Bonjour [/ b] au lieu de celui existant qui exclut les balises « < » et « > »:

mBBSREgEx.Pattern = r"\[[^\]]*\]" 
+0

Merci, parfait. – Jim