2010-01-21 5 views

Répondre

0

C'est une tâche difficile. feedparser (Python) fait un certain nombre de choses pour essayer de deviner correctement le bon jeu de caractères. Il existe quelques endroits où il peut être fourni - comme l'en-tête du XML et l'en-tête de la transaction HTTP (qui remplace l'en-tête du XML). Si ce n'est pas là (ou c'est complètement invalide, ce qui est assez commun), cela revient à deviner les statistiques. Il existe une dernière technique: essayez de le convertir en UTF-8 et, en cas d'échec, convertissez-le en ISO-8859-1 en UTF-8 et réessayez. Bonne chance!

Questions connexes