2016-07-13 3 views
1

J'ai un document HTML volumineux produit après la conversion de Word en HTML. Le code HTML contient un grand nombre de balises supplémentaires. Je veux nettoyer les balises supplémentaires avec une expression régulière. J'utilise l'éditeur UltraEdit (v11.20). J'ai essayé une expression régulière pour trouver les endroits nécessaires en html, mais fonctionne pas pour moi (par exemple « * »)Nettoyer des balises supplémentaires dans un document HTML converti à partir de Word

Voici exemple de code:.

<P LANG="en-US" CLASS="western" ALIGN=JUSTIFY STYLE="margin-left: -0.49in; margin-right: -0.59in; text-indent: 0.3in; margin-bottom: 0in"> 
<FONT COLOR="#943634">  </FONT><FONT COLOR="#943634"><FONT FACE="Arial, sans-serif"><FONT SIZE=5 STYLE="font-size: 20pt"><B> TEXT TEXT</B></FONT></FONT></FONT></P> 

Je veux utiliser l'expression régulière remplacer par

<h1> TEXT TEXT TEXT</h1> 

Remarque, il y a un espace intérieur

<font color="#943634"> </font> balises

En outre, le texte à l'intérieur des balises <B> </B> peut être long et peut être déplacé vers une nouvelle ligne.

+2

Comme nous avons des problèmes de support alors que nous ne sommes pas en mesure de le réparer ou de faire un essai, et cela ne ressemble même pas à un effort externe. – vignesh

+0

voter pour fermer cette questions, parce que ce n'est pas lié à la programmation – fehrlich

+0

N'essayez pas de le faire dans un éditeur, utilisez un [outil dédié] (https://www.google.com/search?q=clean+up+html + de + mot & ie = utf-8 & oe = utf-8). Word est célèbre pour vomir des étiquettes et l'appeler HTML. –

Répondre

-1

Eh bien,

supprimer tag p ajouter autour img tag, essayez:

function wp_bootstrap_filter_ptags_on_images($content){ 
    return preg_replace('/<p>\s*(<a .*>)?\s*(<img .* \/>)\s*(<\/a>)?\s*<\/p>/iU', '\1\2\3', $content); 
} 
add_filter('the_content', 'wp_bootstrap_filter_ptags_on_images'); 

... ce n'est pas tout, mais c'est une chose et non est rien ...! :-)

2

J'ai résolu le problème en nettoyant les balises avec les commandes Rechercher et Remplacer, il suffit de le relancer plusieurs fois.