2009-03-20 10 views

Répondre

2

à proprement parler:

from xml.dom.minidom import parse, parseString 
tree = parseString("<div id='asd'><pre>skdsk</pre></div>") 
root = tree.firstChild 
node = root.childNodes[0] 
print node.toxml() 

Dans la pratique, cependant, je recommande la recherche à la bibliothèque http://www.crummy.com/software/BeautifulSoup/. Trouver le bon childNode dans un document xhtml, et sauter des "nœuds d'espaces" est une douleur. BeautifulSoup est un analyseur html/xhtml robuste avec des capacités de recherche d'arbres fantastiques.

Éditer: L'exemple ci-dessus compresse le code HTML en une seule chaîne. Si vous utilisez le HTML comme dans la question, les sauts de ligne et ainsi de suite vont générer des nœuds "blancs", donc le nœud que vous voulez ne sera pas à childNodes [0].

Questions connexes