J'utilise ElementTree et ne peux pas déterminer si le nœud enfant est du texte ou non. childelement.text
ne semble pas fonctionner car il donne des faux positifs même sur des nœuds qui ne sont pas des nœuds de texte.Python ElementTree Vérifiez le type de nœud/élément
Des suggestions?
Exemple
<tr>
<td><a href="sdas3">something for link</a></td>
<td>tttttk</td>
<td><a href="tyty">tyt for link</a></td>
</tr>
Après l'analyse de ce fichier xml, je le fais en Python:
for elem_main in container_trs: #elem_main is each tr
elem0 = elem_main.getchildren()[0] #td[0]
elem1 = elem_main.getchildren()[1] #td[1]
elem0 = elem_main.getchildren()[0]
print elem0.text
elem1 = elem_main.getchildren()[1]
print elem1.text
Le code ci-dessus ne sort pas elem0.text; c'est vide. Je vois le elem1.text (c'est-à tttttk) dans la sortie.
Update 2
Je construis en fait un dictionnaire. Le texte de l'élément avec chaque afin que je puisse trier la table HTML. Comment pourrais-je obtenir les s dans ce code?
Pouvez-vous donner un exemple? –
@Justin. S'il vous plaît vérifier l'exemple. –
Vous m'avez confondu :). Veuillez reformuler les deux derniers paragraphes. – Rahul