2010-11-29 6 views
0

salut je suis en train de faire une boucle dans le document XML en utilisant NSXMLParser et avoir du mal avec la balise de description. Certains sites d'actualités ont des caractères étranges (balises HTML, <,>, etc.) dans la balise et l'analyse n'est donc pas conforme aux attentes. quelqu'un pourrait-il fournir de l'aide?NSXMLParser flux RSS caractères étranges problème

grâce

+0

S'il vous plaît fournir le code. Les caractères – squeezemylime

Répondre

0

Vous aurez besoin de convertir les références des entités aux personnages qu'ils représentent. Les balises HTML doivent être soit supprimées, soit introduites dans un UIWebView.

+0

sont identifiés par l'analyseur comme des caractères '<''>'. une idée de comment l'analyser avant de l'envoyer à xmlparser? – likki

+0

Donc, chacun des crochets est entouré de guillemets simples? Si c'est le cas, vous pouvez toujours remplacer toutes les instances de '<' par < and '> 'avec> avant de les envoyer à l'analyseur. – jessecurry

0

Pour sauter les balises HTML que vous devez faire ceci:

- (NSString *)flattenHTML:(NSString *)html { 

    NSScanner *theScanner; 
    NSString *text = nil; 
    theScanner = [NSScanner scannerWithString:html]; 

    while ([theScanner isAtEnd] == NO) { 

     [theScanner scanUpToString:@"<" intoString:NULL] ; 

     [theScanner scanUpToString:@">" intoString:&text] ; 

     html = [html stringByReplacingOccurrencesOfString:[NSString stringWithFormat:@"%@>", text] withString:@""]; 
    } 
    // 
    html = [html stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]]; 

    return html; 
} 

Ensuite, vous pouvez simplement remplacer d'autres caractères indésirables par la manipulation de chaînes.

Espérons que cela aide.

Merci,

Madhup

+0

Salut merci pour votre réponse, les caractères étranges sont à l'intérieur de la balise de description ( texte + caractères étranges). Dans ce cas, comment puis-je passer le texte trouvé à votre méthode. le problème est que les caractères étranges ont été identifiés par XMLParser comme des caractères '>' '<' et parfois l'analyseur assume la fin de la balise eben si elle est dans la balise de description. – likki

+0

@likki veuillez montrer l'exemple de réponse que vous essayez d'analyser ainsi que la partie dans laquelle vous faites face au problème. –

+0

Le marché a fait référence aux nations du problème en Europe toute l'année comme le PIIGS. Mais peut-être que ça devrait être le piigS. < img src = "http://feeds.feedburner.com/~r/rss/money_topstories/~4/mgzttHYMi9s" height = "1" width = "1"/> likki