une question sur l'expression régulière python.Python expression régulière pour analyser les balises div
Je voudrais correspondre à un bloc div comme
<div class="leftTail"><ul class="hotnews">any news stuff</ul></div>
Je pensais un modèle comme
p = re.compile(r'<div\s+class=\"leftTail\">[^(div)]+</div>')
mais il semble ne fonctionne pas correctement
un autre motif
p = re.compile(r'<div\s+class=\"leftTail\">[\W|\w]+</div>')
J'ai beaucoup plus que ce que je pense, il obtient tous les trucs jusqu'à la dernière balise dans le fichier.
Merci pour toute aide
'' correspond [^ (div)] tout caractère sauf 5 figurant entre parenthèses. Ainsi, cela ne fonctionnera pas si l'un d'eux pourrait se produire dans le contenu div. '\ W' est l'opposé de' \ w', donc '[\ W | \ w]' n'a pas de sens. Le plus simple est d'utiliser des expressions rationnelles non gourmandes comme '. +?'. Pensez à utiliser un vrai analyseur HTML si ce n'est pas la seule tâche que vous allez faire avec. –
essayé. +? , semblait pas de chance ... Merci! – icn