Avis de non-responsabilité: Je ne suis pas un expert en regex. J'utilise Python re module pour effectuer une correspondance regex sur de nombreux fichiers htm. L'un des modèles est quelque chose comme ceci:Est-il possible de faire re trouver le plus petit match tout en utilisant des caractères avides
<bla><blabla>87765.*</blabla><bla>
Le problème que je l'ai rencontré est que, au lieu de trouver tous les (disons) cinq occurrences du motif, il trouvera qu'un seul. Parce qu'il fusionne toutes les occurrences en une, en utilisant la partie <bla><blabla>87765
de la première occurrence et la partie </blabla><bla>
de la dernière occurrence dans la page.
Existe-t-il un moyen de dire à re de trouver la plus petite correspondance?
exclure '<' du modèle – SilentGhost
Si seulement il y avait des centaines de bibliothèques pour analyser HTML, ce serait tellement plus facile ... oh, attendez. –
^^ quelle façon ennuyeuse d'approcher la vie. Peut-être qu'il fera le meilleur pour le moment. –