J'écris une petite application qui vise à extraire le XML de plusieurs sites et à traiter les données comme je le souhaite. J'ai fait une telle demande auparavant mais dans différentes langues et j'écris celle-ci pour la pratique de Haskell.Ignorer les attributs XML avec HXT unpickler
Quoi qu'il en soit, au fait. Après avoir regardé le Web au million et un parseurs XML différents, j'ai décidé d'aller avec HXT parce que qui n'aime pas les flèches. Suite à la page http://www.haskell.org/haskellwiki/HXT/Conversion_of_Haskell_data_from/to_XML je suis arrivé à quelque chose qui semble lire mon fichier XML et le mettre dans les types de données Haskell que j'ai définis. J'utilise des instances de XmlPickler pour lire les données du fichier pour y parvenir. Je suis arrivé à quelque chose qui fonctionnerait, sauf pour cette erreur:
Je suis conscient que je n'ai pas traité tous les attributs. Je ne veux pas tous les attributs. Y a-t-il un moyen de les ignorer? J'imagine que je pourrais traiter tous les attributs, les mettre dans un nouveau type de données et en extraire des attributs pour obtenir les données que je veux réellement. Je voudrais éviter ce petit bidouillage et je suis donc ici pour demander The Proper Way ™. Est-ce que j'utilise le mauvais outil pour le travail? Est-ce que le démélage des données d'un tiers est dangereux (comme c'est le cas en Python)?
J'ai regardé autour du Web pour une solution mais Text.XML.HXT.Arrow.XmlState.SystemConfig
ne semble pas avoir ce dont j'ai besoin pour désactiver ce comportement.
vous pouvez trouver un excellent article pour commencer avec hxt ici: http: // adit.io/posts/2012-04-14-working_with_HTML_in_haskell.html – fp4me
J'ai travaillé avec cet article hier, quelques heures après avoir posté ma question. Je pense que c'est plutôt bien! –