je le document XML suivant:comportement bizarre avec lxml getIterator()
<x>
<a>Some text</c>
<b>Some text 2</b>
<c>Some text 3</c>
</x>
Je veux obtenir le texte de toutes les balises, alors j'ai décidé d'utiliser getiterator()
.
Mon problème est, il ajoute des lignes vides pour une raison que je ne peux pas comprendre. Considérez ceci:
>>> for text in document_root.getiterator():
... print text.text
...
Some text
Some text 2
Some text 3
Remarquez les deux lignes blanches supplémentaires avant "Une partie du texte. Quelle est la raison pour ça? Si je passe une balise à la méthode getiterator()
, il n'y a pas de lignes vides, comme il se doit.
>>> for text in document_root.getiterator('a'):
... print text.text
...
Some text
Donc ma question est, ce qui est à l'origine de ces lignes vides supplémentaires au cas où je passe getiterator()
sans étiquette et comment puis-je les supprimer?
J'ai aussi essayé de faire: 'si text.text == '\ n': continue' pour qu'il saute les lignes vides, mais ce n'est pas le cas. – user225312