J'essaye d'enlever les étiquettes de fermeture excessives dans javascript et tout ce qui suit après cela.Expression JavaScript pour supprimer les balises HTML de fermeture inégalées?
Voici un exemple possible:
<div class="dummy">
<div class="main">
<div></div>
<img src="a.jpg">
<br>
<img src="b.jpg />
<strong>
<span>text</span>
</strong>
</div>
</div>
***excessive tags below***
</div>
</div>
<div class="footer">
text
</div>
</body>
</html>
Toutes les idées sur la façon de le faire efficacement? La partie que je veux extraire est toujours un div, mais le problème est qu'il peut y avoir autant de divs imbriqués, et je ne suis pas sûr de savoir comment gérer ce scénario.
Si cela peut être fait en plusieurs étapes ou avec des rappels, c'est aussi bien, tant que cela fonctionne.
Modifier Ma question est en fait plus facile qu'il n'y paraît. L'exemple commence toujours par la div que je veux extraire. Tout ce dont j'ai besoin est de trouver la balise de fermeture correspondante et de filtrer tout ce qui suit. Ne pas se soucier des autres balises ...
Voici une réponse terrible: http://stackoverflow.com/a/1732454/135078 –
Regex est pas un outil d'analyse syntaxique. – Vallentin
Quels sont précisément les tags que vous voulez supprimer? Tout en dessous des balises excessives ci-dessous commentaire? Le remorquage des étiquettes inégalées gardant le div pied de page? –