Je n'ai pas testé la logique utilisée dans cette page - http://www.phpro.org/examples/Get-Text-Between-Tags.html Mais je peux confirmer le point logique fait en haut de la page en gros caractères gras que vous dit shouldn » t faites ce que vous essayez de faire avec regex.
Html n'est pas uniforme et les cas de bords vous mordre toujours à l'arrière si vous utilisez des expressions régulières pour gérer le contenu de ces balises dans n'importe quelle situation du monde réel. Donc, sauf si votre balisage est extrêmement simpliste, uniforme, 100% précis, ne contient que html (pas css, javascript ou garbage) alors votre meilleur pari est une bibliothèque dom parser.
Et vraiment beaucoup de bibliothèques dom parser ont aussi des problèmes mais vous serez en avance sur les homologues de la regex. La meilleure façon d'obtenir le contet de texte des balises est de rendre le code HTML dans un navigateur et d'accéder à la propriété innerText du nœud dom donné (ou d'avoir une copie humaine et de coller le contenu manuellement) - mais ce n'est pas toujours une option : D
Pensez à utiliser le bouton {} lorsque vous écrivez votre question – Calum
Désolé, vient de rejoindre ce site. Va l'utiliser dans le futur. :) –
C'est bon :) c'est juste que si vous essayez d'utiliser des balises, cela pourrait ne pas fonctionner sans l'encapsuleur de code. – Calum