2010-01-09 2 views
4

laisse supposer que nous avons du XML comme ceci:retour plusieurs valeurs à l'aide zipper xml clojure

<a> 
    <b> 
    <c>text</c> 
    <d> 
     <e>text</e> 
     <f> 
     ... lots of cruft here .. 
     </f> 
    </d> 
    </b> 
    <b> 
    ... 
    </b> 
    <!-- more b sub-trees --> 
</a> 

Maintenant, en regardant à travers les échantillons dans zip_filter/xml.clj, j'ai compris comment se rendre à des valeurs uniques que je suis intéressé.

Je me demande comment je ferais quelque chose comme retourner une liste de paires de valeurs de texte de (ce).

EDIT:

Voici un code de travail, mais il est assez laid. Ne pas demander de refactoring trivial, mais y at-il une meilleure façon que les fermetures à glissière nous donnent pour faire cela?

(defn extract-data [xml] 
    (let [items (x/xml-> xml zf/descendants :Item)  ;items not top-level 
     getAttributes #(x/xml1-> % :ItemAttributes) ;items have itemattributes 
     getASIN  #(x/xml1-> % :ASIN x/text) ;items have ASINs 
     getTitle  #(x/xml1-> % :Title x/text) ;itemattributes have Titles 
     getAuthor  #(x/xml1-> % :Author x/text)] ;itemattributes have Authors 
    (map 
     ;build a function to get everything we need from the items, and apply 
     #(let [attributes (getAttributes %)] ;get the attributes, we'll use it twice 
     (list 
      (getASIN %) 
      (getTitle attributes) 
      (getAuthor attributes))) 
     items))) 

Répondre

4

Selon la version clojure que vous utilisez, vous trouverez peut-être la fonction juxt est utile. Votre code posté (uniquement les parties pertinentes):

(defn extract-data 
    [xml] 
    (let [...] 
    (map (juxt getASIN (comp getTitle getAttributes) (comp getAuthor getAttributes)) items)))) 
+0

+1 pour m'avoir montré juxt et une façon plus simple de le faire. Je vais l'essayer bientôt. – z5h

+0

Cool. Je peux aussi faire ceci pour éviter 2 appels à getAttributes. '(map (juxt getASIN (comp (juxt getTitle getAuthor) getAttributes)) items) mais je dois aplatir le vecteur. – z5h

2

Je suis sûr qu'il ya une plus belle façon, mais cela fait le travail:

(letfn [(get-tag [tag coll] (:content (first (filter #(= tag (:tag %)) coll))))] 
    (map #(list (get-tag :c %) (get-tag :e (get-tag :d %))) 
     (map :content (:content (clojure.xml/parse "foo.xml"))))) 

résultats dans

((["ctext1"] ["etext1"]) (["ctext2"] ["etext2"])) 
+0

Merci, je viens de poster une partie du code réel pour la structure de données réelle avec laquelle je travaille. +1 pour me montrer letfn et une façon de le faire. – z5h

+0

Ah Ok, pas de soucis. –