Je chaîne suivante:Comment puis-je trouver un div HTML contient du texte spécifique après un préfixe de texte?
<div> text0 </div> prefix <div> text1 <strong>text2</strong> text3 </div> text4
et que vous voulez savoir qu'il contient text3
wether l'intérieur divs qui vont après le préfixe:
prefix<div>...text3...</div>
mais je ne sais pas comment ta faire regex pour cela, puisque je ne peux pas utiliser [^<]+
parce que div peut contenir strong
tag à l'intérieur.
S'il vous plaît aider
EDIT:
- balises Div après préfixe sont guaranted à ne pas imbriquées
- Le langage est C#
- Texte4 est très longue, donc regex ne doit pas regarder après la fermeture div
EDIT2: Je ne veux pas utiliser l'analyseur html, il peut être facilement (et BEAUCOUP plus rapide) éd avec Regex. HTML il est simple: pas d'attributs dans les balises; pas de div de nidification. Et même quelques% de mauvaises réponses sont acceptables dans mon cas.
Vous ne pouvez pas utiliser (de manière fiable) regex pour cela, car comme vous l'avez noté, les expressions régulières ne traitent pas des fonctionnalités non régulières du langage, telles que l'imbrication de HTML/etc. ** Vous devez utiliser un parseur DOM HTML - quelle langue essayez-vous de faire? ** –
Vous voulez probablement apprendre à connaître jquery – naugtur
Quelle langue? Différentes langues prennent en charge différentes fonctionnalités RegEx et elles ne sont pas identiques. Même si RegEx est la mauvaise solution, les recommandations d'une bonne solution exigent la connaissance de la langue que vous utilisez. – Oded