Je tente de nettoyer certaines données que nous recevons des flux rss à l'aide de XSLT. Je souhaite supprimer toutes les balises sauf la balise p.Supprimer toutes les balises html sauf les balises autorisées à l'aide de la fonction XSLT
Cows are kool.<p>The <i>milk</i> <b>costs</b> $1.99.</p>
J'ai quelques doutes ici sur la façon de résoudre ce problème en utilisant XSLT dans 1.0 ou 2.0.
1) Je l'ai vu cet exemple https://maulikdhorajia.blogspot.in/2011/06/removing-html-tags-using-xslt.html
Mais je dois les balises p pour être présent et pour lesquels je dois utiliser un regex.Can que nous utilisons la fonction string-avant-match et à faire de la même manière Cette fonction n'est pas présente dans xpath. 2) Je comprends que la fonction de remplacement ne peut pas être utilisée car elle attend une chaîne et si nous passons un nœud quelconque, il extrait le contenu et le passe ensuite à la fonction et, dans ce cas, annule le but de suppression des étiquettes.
J'étais un peu confus car dans cette réponse, un remplacement a été utilisé https://stackoverflow.com/a/18528749/745018.
3) Je fais cela sur le serveur nginx en utilisant xslt.
Veuillez trouver ci-dessous des exemples d'entrées que nous obtenons dans la balise body du flux rss.
<p>The Supreme Court issued on Friday a bailable warrant against sitting Calcutta high court justice CS Karnan, an unprecedented order in a bitter confrontation between the judge and the top court.</p><p>A seven-judge bench headed by Chief Justice of India JS Khehar issued the order directing Karnan’s presence on <h2>March 31</h2> because the judge ignored an earlier court order summoning him.<i>Justice Karnan</i> had to appear</p>
Mise à jour: Aussi je suis à la recherche d'une fonction xslt pour cette
Please échantillons minimaux mais complets d'entrée XML et le résultat correspondant que vous voulez. Nous devons voir si ce code HTML contenu dans le flux RSS est inclus en tant que balisage ou texte (à l'intérieur d'une section CDATA). Nous avons également besoin de savoir si vous vous attendez à ce que HTML soit analysable en XML ou seulement en HTML. –
@MartinHonnen Mise à jour d'un exemple d'entrée. J'ai besoin que le contenu de cdata soit renvoyé sans les balises html à l'exception de p tag. – crackerplace