2010-06-05 5 views
4

Chaque fois que j'essaie d'analyser XML avec des caractères spéciaux tels que ō ou 満 月 先生, j'obtiens une erreur. Les documents xml prétendent utiliser l'encodage UTF-8 mais cela ne semble pas être le cas. Voici ce que le texte gênant ressemble quand je vois le XML dans Firefox:Comment analyser XML avec des caractères spéciaux?

Bleach: The Diamond Dust Rebellion - M Å Hitotsu no Hy Å rinmaru; Bleach - La DiamondDust Rebellion - Hitotsu no Mou Hyourinmaru

Sur le site actuel, Å est en fait le caractère ò.

< br/> Un jour, Doraemon et ses amis se rencontrent Professeur Mangetsu (æ º æ å & ccedil ;, Professeur Mangetsu?), Qui étudie la magie et magique des êtres tels que gobelins, et sa fille Miyoko (& ccedil; & frac34; å & Curren,? å ­, Miyoko), et sont mis en garde contre la dange approximation du & "star of the Underworld &"; vers la Terre & # 039; s orbite. <br/br> </>

Et encore une fois, sur le site actuel, ces personnages apparaissent comme 満 月 先生 et 美 夜 子.

Le fichier XML réel est mis en forme correctement, à l'exception des caractères spéciaux, qui ne semblent certainement pas utiliser le codage UTF-8. Existe-t-il un moyen d'obtenir NSXML pour analyser ces fichiers XML?

+0

Ressemble UTF-8 interprété comme Latin-1 et réencodés. –

+0

Comme je l'ai mentionné, sur le site web actuel, les caractères apparaissent comme ō et 満 月 先生 mais dans le document XML (défini comme UTF-8 dans l'en-tête) ils apparaissent comme Å et æº æ å ç . Pensez-vous que c'est juste l'interprétation de Firefox par les caractères comme Latin-1, ou les gens qui ont créé le document XML ont foiré? Si j'essaye de charger le code XML dans Xcode avec NSUTF8StringEncoding, cela ne fonctionne pas. Si je spécifie des encodages tels que NSASCIIStringEncoding ou NSISOLatin1StringEncoding, il chargera le document, mais affichera le ō Å qui est le code pour Å (ressemble à une perte de données). – Snooze

Répondre

Questions connexes