Python: HTML regex ne correspond pas à

J'ai ce code:Python: HTML regex ne correspond pas à

reg = re.search('<div class="col result_name">(.*)</div>', html) 
print 'Value is', reg.group()

Où 'html' contient quelque chose comme ceci:

 <div class="col result_name"> 
      <h4>Blah</h4> 
      <p> 
       blah 
      </p> 
     </div>

Mais il ne rien retourner.

Value is 
Traceback (most recent call last): 
    File "run.py", line 37, in <module> 
    print 'Value is', reg.group()

Source

2011-01-10 Zeno

... et voilà pourquoi vous ne devriez pas * * 'parse' HTML avec regex. – user225312

[Lire ceci] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454) puis utilisez les outils appropriés pour analyser html. –

@A A: non ce n'est pas le cas.

est. –

N'utilisez pas regex pour analyser html. Utilisez un analyseur html

import lxml.html 
doc = lxml.html.fromstring(your_html) 
result = doc.xpath("//div[@class='col result_name']") 
print result

lien obligatoire:

RegEx match open tags except XHTML self-contained tags

Source

2011-01-10 18:41:22 nosklo

Je reçois des résultats comme ceci: [, – Zeno

@Zeno: Oui, ce sont tous les divs lxml trouvé dans votre code HTML. Les éléments. Vous pouvez les imprimer ou faire d'autres analyses avec eux. Par exemple, essayez ceci: 'pour onediv dans le résultat: print lxml.html.tostring (onediv, pretty_print = True)' – nosklo

Est-ce que xpath supporte regex? Je veux faire quelque chose comme (col | row) là-dedans. – Zeno

Le point ne correspond pas à neccessarily nouvelles lignes REs, vous avez besoin du DOTALL drapeau (?s) pour cela.

Source

2011-01-10 18:39:42

http://docs.python.org/library/re.html:

Les caractères spéciaux sont:

'' (point.) Dans le mode par défaut, cela correspond à tout caractère à l'exception d'une nouvelle ligne. Si le drapeau DOTALL a été spécifié, ceci correspond à n'importe quel caractère incluant une nouvelle ligne.

Source

2011-01-10 18:40:09

Python: HTML regex ne correspond pas à

Répondre

Questions connexes