À partir de the documentation, les méthodes de massage ne sont que des paires de (regular expression, replacement function)
donc je ne pense pas que ce soit vraiment un cas d'utilisation de massages ou d'expressions rationnelles.
par exemple. pour ranger les commentaires malformés:
(re.compile('<!-([^-])'), lambda match: '<!--' + match.group(1))
Si vous regardez la source de la méthode dans BeautifulSoup.py vous verrez que ceux-ci sont lancées juste en séquence contre le balisage:
for fix, m in self.markupMassage:
markup = fix.sub(m, markup)
Ainsi, alors que vous pourriez faire un certain traitement de regexp de votre propre avant que BeautifulSoup arrive à voir le balisage, vous êtes probablement mieux combiner tout rangement supplémentaire nécessaire avec le MARKUP_MASSAGE
intégré par défaut comme indiqué dans Oli's réponse.