2017-10-16 4 views
0

Je souhaite analyser un fichier XML. Il est ok si mon dossier est comme « file.xml »Analyse XML à partir d'une page Web

J'utilise cette commande en Python:

from lxml import etree 

tree = etree.parse("C:/file.xml") 

Cependant, j'ai une nouvelle cible maintenant, la cible est un serveur web. Ce serveur génère un texte XML avec des valeurs actuelles. Peut-être que le problème provient de l'URL car il n'est pas terminé par ".xml"? L'URL est comme "http://ip/xml_render".

Mais, en python, j'ai l'erreur:

lxml.etree.XMLSyntaxError: Start tag expected, '<' not found, line 1, column 1 

En effet, ma page web n'est pas complètement comme un code source, il ressemble à ceci:

enter image description here

Ainsi, le problème concerne l'URL ou la page Web?

Merci.

+0

La est à quel point affiche votre navigateur XML. Vous pouvez utiliser "view source" pour voir le XML brut. – jordanm

Répondre

1

Vous devez saisir de la première bande, essayez ce

from urllib.request import urlopen 

xml = urlopen('www.yourwebsite.com') 
tree = etree.parse(xml)