2009-12-29 6 views
0

Je suis un peu coincé et j'ai besoin d'aide. Donc ça va comme ça. J'ai un site où le nombre de commentaires sur un article particulier vient du module de commentaire. la balise HTML sur elle est affichée qui ressemble à ceci: (<em>1</em>). J'ai récemment mis à jour mon site 5 à 6. Tout le reste fonctionne bien à part ça. S'il vous plaît, aidez.Comment se débarrasser des balises HTML

Merci !!!

+0

Pouvez-vous s'il vous plaît mettre un peu plus de lumière sur votre question, il semble son pas clair. –

+0

votre référence (1) ne semble pas fonctionner ... – rdmueller

+0

Clarifier la question un peu .. Il est difficile de supposer .. Pièce du code est le bienvenu .. –

Répondre

0

En supposant que vous voulez vous débarrasser de <em>1</em>: \<em([^>]*)\>(\d[^>]*)\</(em[^>]*)\> -> supprime tout texte entre crochets, contenant des nombres.

Et si c'est maladroit, chut, j'ai seulement appris les regex hier.

+1

Parsing html avec regexes ... c'est du folklore maintenant: ne le fais pas! L'inondation Whatif arrive. Que faire si les parenthèses contiennent une étiquette ouverte et pas l'étiquette de fermeture? Que faire s'il y a une parenthèse sans rapport contenant un nombre? * correspond à 0 ou plus, de sorte que vous correspondiez également à n'importe quoi entre parenthèses sans chiffre. La correspondance est également gourmande, de sorte qu'une parenthèse ouverte proche du début du document et une fin près de la fin correspondent, et tout le doc va. Etc etc. Rechercher 'regex html' sur SO pour voir l'horreur. –

+0

J'ai vu le cri de Bobince à l'aide. J'utilise lxml pour analyser mes arbres. Cependant, je vais continuer à regexes au contenu de mon coeur. Peut-être à mon propre détriment, mais au moins je vais apprendre quelque chose XD XD. – torger

1

Vous pouvez utiliser la fonction strip_tags() pour supprimer HTML de chaîne

Questions connexes