lxml ou imprimer le contenu Xpath

J'ai la fonction suivantelxml ou imprimer le contenu Xpath

def parseTitle(self, post): 
    """ 
     Returns title string with spaces replaced by dots 
    ""   
    return post.xpath('h2')[0].text.replace('.', ' ')

Je voudrais voir le contenu de post. J'ai essayé tout ce que je peux penser.

Comment puis-je correctement déboguer le contenu? Ceci est un site de films où je suis des liens et des titres et cette fonction devrait analyser le titre.

Je suis sûr que H @ n'existe pas, comment puis-je imprimer/déboguer cela?

Source

2010-03-04 Anonymous

Que contient le courrier? – Mark

post est l'objet arbre lxml, n'est-ce pas? donc d'abord, vous pouvez essayer:

# import lxml.html # if not yet imported 
# (or you can use lxml.etree instead of lxml.html) 
print lxml.html.tostring(post)

si n'est pas, vous devez créer l'élément objet arbre de celui-ci

post = lxml.html.fromstring(post)

ou peut-être le problème est que vous devez remplacer h2 avec //h2? Votre question n'est pas très explicative.

Source

2010-05-06 09:56:17 mykhal

lxml ou imprimer le contenu Xpath

Répondre

Questions connexes