Salutations!Regex pour extraire les éléments par nom de classe
J'ai du code HTML valide ou non. Si le code HTML est invalide, une meilleure tentative peut être faite, et toutes les erreurs qui surviennent sont acceptables (c'est-à-dire, regrouper trop parce qu'une étiquette n'est pas fermée correctement).
Dans ce code HTML, il existe une variété d'éléments, dont certains peuvent avoir une classe (appelez-le "findme"). Ces éléments sont de type variable; certains img, un objet , certains un, etc.
je besoin d'un regex qui va tirer tous les éléments et le contenu qu'ils contiennent si elles contiennent du contenu.
Par exemple:
<div>
<span><img class="findme" src="something" /></span>
<object class="findme" classid="clsid:F08DF954-8592-11D1-B16A-00C0F0283628" id="Slider1" width="100" height="50">
<param name="BorderStyle" value="1" />
<param name="MousePointer" value="0" />
<param name="Enabled" value="1" />
<param name="Min" value="0" />
<param name="Max" value="10" />
</object>
</div>
Exécution du regex sur ce morceau de HTML devrait revenir 2 éléments:
<img class="findme" src="something" />
et
<object class="findme" classid="clsid:F08DF954-8592-11D1-B16A-00C0F0283628" id="Slider1" width="100" height="50">
<param name="BorderStyle" value="1" />
<param name="MousePointer" value="0" />
<param name="Enabled" value="1" />
<param name="Min" value="0" />
<param name="Max" value="10" />
</object>
Tout vous gourous regex là-bas ont une idée sur celui-ci?
Édition: La langue est C#.
Pourriez-vous préciser le langage de programmation que vous utilisez pour ce travail? –