2010-09-03 4 views
0

Comment puis-je vérifier la validité du code html avec python? J'ai besoin de vérifier les balises fermées, et les accolades dans les balises params. Tels que | a href = "xxx '| et autres validations possibles, que les libs je peux utiliser pour cela?python check html valide

Répondre

3

Eh bien, ce n'est pas exactement ce que vous cherchez, mais pour valider le code HTML d'un site Web Je travaille sur, je demande au Validateur du W3C de le vérifier pour moi, et j'écrase juste la sortie pour obtenir le résultat de base oui/non Notez qu'il y a plusieurs services de validation sur le web comme alternatives, mais le W3C fonctionne assez bien

#!/usr/bin/python2.6 
import re 
import urllib 
import urllib2 

def validate(URL): 
    validatorURL = "http://validator.w3.org/check?uri=" + \ 
     urllib.quote_plus(URL) 
    opener = urllib2.urlopen(validatorURL) 
    output = opener.read() 
    opener.close() 
    if re.search("This document was successfully checked as".replace(
      " ", r"\s+"), output): 
     print " VALID: ", URL 
    else: 
     print "INVALID: ", URL