Je suis la récupération de données à partir d'une URL comme:Les données XML extraites d'urlopen remplacent "<" and ">" par ";"
data = urllib2.urlopen(url).read()
Cependant, je remarque qu'il n'y a pas les tags. C'était parce que le "<" et ">" ont été remplacés par ";" personnage. Tout le reste est intact. Alors :
<foo>bar</foo>
est changé en ;foo;bar;/foo;
Comment puis-je résoudre ce problème et pourquoi est-ce qui se passe?
[EDIT]: J'ai découvert comment le réparer. Apparemment, il remplaçait '<' par '& lt' et '>' par '& gt'. Je suppose que les formes courtes des signes. Je ne sais toujours pas pourquoi cela se passe. Je suppose qu'il y a un bug dans le webservice/API.
Quelle est la source du code XML? – Jacopofar
Cela est * jamais * causé par 'urllib2'. Êtes-vous sûr à 100% que le serveur n'a pas produit ces données? –
Lorsque j'ouvre l'URL dans IE ou FF, je peux voir les tags très bien. – ritratt