J'aimerais pouvoir analyser les flux RSS et Atom contenant XML non valide. Les erreurs que j'ai rencontrées et que je voudrais corriger incluent des choses «simples» telles qu'un >
où la fermeture ;
est manquante, les balises fermantes manquantes et les balises de fermeture qui apparaissent dans la mauvaise commande .Analyser les flux RSS rompus avec Perl
Je voudrais ignorer la question de savoir si, en théorie, cela rend sens de tenter d'analyser des documents XML malformés. Un terme "technique" qui semble venir plutôt proche de ce que je veux faire est "tag soupe". Quels modules CPAN dois-je utiliser pour construire un parseur capable de tolérer ou de corriger des erreurs simples comme celles décrites plus haut?