Je prévois de travailler sur chaque img d'un fichier html. Ces images ne doivent pas contenir le mot "noresize". J'ai construit la regex pour obtenir img:regex, obtenir img sans balise "noresize" dans un fichier html
#<img(\s[^>]*)>#ie
Cela fonctionne très bien, mais je ne peux pas trouver comment spécifier « sans noresize ».
J'ai essayé quelque chose comme ça:
#<img(\s[^>]*)((?!noresize).)>#ie
Mais de toute évidence, ce n'est pas ce que je dois ...
Toute idée? Julien
Vous ne devez pas analyser HTML en utilisant des expressions régulières. –
Vous utiliserez un [parseur DOM] (http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662) pour parcourir le code HTML et extraire proprement les éléments que vous voulez. –
Sérieusement, bienvenue à SO. Parsing HTML avec des expressions régulières est une sorte de bâillon courant ici, donc la réponse. Pourtant, l'utilisation d'un analyseur DOM est vraiment la meilleure idée pour cela. –