2010-03-04 3 views
1

Salut, je me demandais si quelqu'un sait comment supprimer à la fois l'URL et le texte du lien de toutes les balises d'ancrage dans un grand paragraphe de texte. Une fois retiré, si je pouvais les stocker dans un tableau pour une utilisation ultérieure.PHP Regex - Trouver l'URL et le texte dans les balises d'ancrage html

Je suis sûr que c'est possible mais j'ai vraiment du mal avec regex.

Espérons qu'il y a quelqu'un là-bas qui a déjà rencontré ça ou qui a de bonnes connaissances à ce sujet.

Merci

+0

Pouvez-vous montrer un exemple de ce que vous essayez d'accomplir? Que voulez-vous dire par "texte de lien"? Le texte à l'intérieur de étiquettes? – thetaiko

+0

Mis à part le fait qu'il a dit qu'il voulait "enlever" l'URL et le texte du lien (il veut probablement juste le copier), il semble qu'il va reconstruire le lien ailleurs. Aussi, je ne suis pas sûr que je puisse penser à une autre façon d'interpréter le "texte du lien" à part peut-être, le texte alt, ou le titre, mais je doute que c'est ce qu'il voulait dire. –

Répondre

1

Regex n'a pas été vraiment conçu pour être un analyseur HTML parfait. Avez-vous essayé de faire une chaîne de chargement simpleXML?

http://php.net/manual/en/function.simplexml-load-string.php

Mais pour regex, consultez ces:

What's the best way to remove <br> tags from the end of a string?

How to convert multiple <br/> tag to a single <br/> tag in php

+0

Cela semble être l'une de ces choses où l'utilisation de regex serait habituellement bien tant que le HTML était bien formé (c'est-à-dire qu'il n'y a pas de lien-dans-un-lien). S'il y a des balises de formatage à l'intérieur du lien, vous pouvez les supprimer après avoir récupéré le texte du lien. –

Questions connexes