2010-11-05 4 views
0

Je suis en train d'analyser un fichier XML à l'aide de NSXMLParser. Et il y a une section qui est complètement finie et finit par casser le processus d'analyse. Fondamentalement, c'est un peu de HTML qu'ils n'ont jamais enveloppé dans CDATA.Supprimer du contenu dans un fichier XML avant l'analyse

Y at-il de toute façon je peux supprimer cela avant de l'envoyer à travers l'analyseur afin qu'il ne casse pas. (Les informations contenues dans ce bit est pas important et peut être jeté)

Le XML ressemble un peu à ce

<foo> 
    text</span></li><li> 
    <span class="ft">Not important:</span> 
    <span class="fc"><a href="Some random link">0</a> 
</foo> 

Comme vous pouvez le voir les balises sont tous empan foiré. Comment peut-on se débarrasser complètement du contenu de foo?

Répondre

0

Vous pouvez d'abord exécuter HTML tidy sur les données - cela donnera un code XML valide. Vous pouvez ajouter des balises non html dans le fichier de configuration

+0

Je veux juste que la section disparaisse. Je ne veux pas essayer de le réparer. – endy

+0

Le problème est que pour supprimer foo - la manière habituelle est d'utiliser une regex mais utiliser regexes sur xml ne fonctionne pas bien - donc je pense que la fixation du xml et ensuite supprimer foo est le moyen le plus simple - sauf s'il y a un seul élément foo toujours vouloir l'enlever – Mark

Questions connexes