2010-03-04 8 views
1

J'ai la fonction suivantelxml ou imprimer le contenu Xpath

def parseTitle(self, post): 
    """ 
     Returns title string with spaces replaced by dots 
    ""   
    return post.xpath('h2')[0].text.replace('.', ' ') 

Je voudrais voir le contenu de post. J'ai essayé tout ce que je peux penser.

Comment puis-je correctement déboguer le contenu? Ceci est un site de films où je suis des liens et des titres et cette fonction devrait analyser le titre.

Je suis sûr que H @ n'existe pas, comment puis-je imprimer/déboguer cela?

+0

Que contient le courrier? – Mark

Répondre

2

post est l'objet arbre lxml, n'est-ce pas? donc d'abord, vous pouvez essayer:

# import lxml.html # if not yet imported 
# (or you can use lxml.etree instead of lxml.html) 
print lxml.html.tostring(post) 

si n'est pas, vous devez créer l'élément objet arbre de celui-ci

post = lxml.html.fromstring(post) 

ou peut-être le problème est que vous devez remplacer h2 avec //h2? Votre question n'est pas très explicative.

Questions connexes