2017-06-12 5 views
1

j'ai les données XML comme suit ci-dessous,Comment lire les données à partir de XML attributs recurssively et de le stocker au format CSV en Java

<?xml version="1.0" encoding="ISO-8859-1"?> 
<FIXML xsi:schemaLocation="http://www.fixprotocol.org/FIXML-5-0-SP2 fixml-main-5-0-SP2_.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" s="2012-04-23" v="FIX.5.0SP2"> 
    <Batch ID="RPTTA111PUBLI20170509"> 
     <MktDef MktID="XEUR" MktSegID="14" EfctvBizDt="2017-05-11" NxtEfctvBizDt="2017-05-15" MktSeg="CONF" MarketSegmentDesc="FUT 8-13 Y. SWISS GOV.BONDS 6%" Sym="CH0002741988" ParentMktSegmID="FBND" Ccy="CHF" MktSegStat="1" USFirmFlag="Y" PartID="2"> 
      <MtchRules MtchRuleProdCmplx="5" MtchAlgo="PT" /> 
      <MtchRules MtchRuleProdCmplx="1" MtchAlgo="PT" /> 
      <FlexProdEligs FlexProdEligCmplx="5" FlexProdElig="Y" /> 
      <BaseTrdgRules QtSideInd="1" FastMktPctg="0"> 
       <TickRules TickRuleProdCmplx="1" StartTickPxRng="0" EndTickPxRng="99999.9999" TickIncr="0.01" /> 
       <TickRules TickRuleProdCmplx="5" StartTickPxRng="0" EndTickPxRng="99999.9999" TickIncr="0.01" /> 
       <QuotSizeRules MinBidSz="1" MinOfrSz="1" FastMktInd="0" /> 
       <QuotSizeRules MinBidSz="1" MinOfrSz="1" FastMktInd="1" /> 
       <PxRngRules PxRngRuleID="75" PxRngProdCmplx="1" StartPxRng="0" EndPxRng="99999.9999" PxRngValu="0.15" /> 
       <PxRngRules PxRngRuleID="347" PxRngProdCmplx="5" StartPxRng="0" EndPxRng="99999.9999" PxRngValu="0.12" /> 
      </BaseTrdgRules> 
      <MDFeedTyps MDFeedTyp="HS" MDBkTyp="2" MktDepth="10" MDRcvryTmIntvl="120000" SvcLctnID1="224.0.50.102" SvcLctnSubID1="59500" SvcLctnID2="224.0.50.230" SvcLctnSubID2="59500" /> 
      <MDFeedTyps MDFeedTyp="HI" MDBkTyp="2" MktDepth="10" MktDepthTmIntvl="0" SvcLctnID1="224.0.50.103" SvcLctnSubID1="59501" SvcLctnID2="224.0.50.231" SvcLctnSubID2="59501" /> 
      <MDFeedTyps MDFeedTyp="HI" MDBkTyp="3" MktDepthTmIntvl="0" SvcLctnID1="224.0.114.97" SvcLctnSubID1="59501" SvcLctnID2="224.0.114.113" SvcLctnSubID2="59501" /> 
      <MDFeedTyps MDFeedTyp="HS" MDBkTyp="3" SvcLctnID1="224.0.114.96" SvcLctnSubID1="59500" SvcLctnID2="224.0.114.112" SvcLctnSubID2="59500" /> 
      <MDFeedTyps MDFeedTyp="L" MDBkTyp="2" MktDepth="5" MktDepthTmIntvl="3500" MDRcvryTmIntvl="30000" SvcLctnID1="224.0.50.89" SvcLctnSubID1="59500" SvcLctnID2="224.0.50.217" SvcLctnSubID2="59500" /> 
     </MktDef> 
     <SecDef PriSetPx="158.39"> 
      <Instrmt ID="408805" Src="M" SecTyp="FUT" Status="1" ProdCmplx="1" CFI="FFMPSX" MatDt="2017-06-08" MMY="201706" Mult="1" ValMeth="FUT" SettlMeth="P" SettlSubMeth="4" PxPrcsn="2" MinPxIncr="0.01" MinPxIncrAmt="10"> 
       <AID AltID="1048612" AltIDSrc="M" /> 
       <AID AltID="XF000001RQD8" AltIDSrc="4" /> 
       <Evnt EventTyp="7" Dt="2017-06-08" /> 
      </Instrmt> 
      <MktSegGrp MktSegID="14"> 
       <SecTrdgRules> 
        <BaseTrdgRules> 
         <PxRngRules PxRngRuleID="75" /> 
        </BaseTrdgRules> 
       </SecTrdgRules> 
      </MktSegGrp> 
     </SecDef> 
    </Batch> 
</FIXML> 

Je veux lire les données de ce XML et de le stocker dans un fichier CSV au dessous de.

Les noms de colonne doivent être le nomElementElementName_ChildElementName (si nous en avons) _AttributeName. Ce format que je devrais suivre,

Supposons que RootElement est FIXML et que nous ayons les attributs "s" et "v", le nom de la colonne doit être comme suit FIXML_s, FIXML_v. Les noms des colonnes doivent être FIXML_Batch_ID et FIXML_Batch_MktDef_MktID comme suit:

1) FIXML_s  FIXML_v  FIXML_Batch_ID  FIXML_Batch_MktDef_MktID . . . . . 
    "2012-04-23" "FIX.5.0SP2" RPTTA111PUBLI20170509 XEUR .... 
. 
. 
. 

Nous avons des données de ce genre pour des milliers de lignes et quand il atteint la "</SecDef>" les données doivent imprimer en 2ème ligne et 3ème ligne comme ça continue.

Quelqu'un peut-il me guider à ce sujet. Je suis très nouveau à travailler sur des données XML.

+0

donc ce qui détermine quels attributs forment une seule ligne dans le résultat? –

+0

Pour SecDef nous avons PriSetPx et pour MktDef nous avons MktSegID. Sur la base de ces 2 attributs, nous déciderons du résultat de chaque itération. –

+0

Envisagez de simplifier votre extrait XML, puis affichez et expliquez le CSV correspondant complet que vous souhaitez créer avec XSLT, en expliquant quels éléments et leurs attributs sont mappés à une ligne du fichier CSV. Qu'est-ce qui est supposé arriver avec tous ces 'MDFeedTyps' avec les mêmes attributs, appartiennent-ils tous à la même ligne ou appartiennent-ils à des lignes différentes? –

Répondre

0

Vous pouvez prendre c'est comme un échantillon où

vous devez DESGn votre style.xsl

entendre le mien est

<?xml version="1.0"?> 
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format"> 
    <xsl:output method="text" omit-xml-declaration="yes" indent="no" /> 
    <xsl:template match="/"> 
topic,title,url 
<xsl:for-each select="//topic"><xsl:value-of select="@id" /><xsl:value-of select="concat(',' , title, ',' , url,' ')" /></xsl:for-each></xsl:template> 
</xsl:stylesheet> 

c'est le convertisseur

import org.w3c.dom.Document; 
import java.io.File; 
import javax.xml.parsers.DocumentBuilder; 
import javax.xml.parsers.DocumentBuilderFactory; 
import javax.xml.transform.Result; 
import javax.xml.transform.Source; 
import javax.xml.transform.Transformer; 
import javax.xml.transform.TransformerFactory; 
import javax.xml.transform.dom.DOMSource; 
import javax.xml.transform.stream.StreamResult; 
import javax.xml.transform.stream.StreamSource; 

public class XMLToCSV { 
    public static void main(String args[]) throws Exception { 
     File stylesheet = new File("/home/1/style.xsl"); 
     File xmlSource = new File("/home/1/xml.xml"); 

     DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); 
     DocumentBuilder builder = factory.newDocumentBuilder(); 
     Document document = builder.parse(xmlSource); 

     StreamSource stylesource = new StreamSource(stylesheet); 
     Transformer transformer = TransformerFactory.newInstance().newTransformer(stylesource); 
     Source source = new DOMSource(document); 
     Result outputTarget = new StreamResult(new File("/home/1/howto.csv")); 
     transformer.transform(source, outputTarget); 
     System.out.println("Done."); 
    } 
} 

Vous pouvez mettre en forme la sortie comme vous le souhaitez en utilisant ce

Voici comment mon xml ressemble

<?xml version="1.0"?> 
<howto> 
    <topic id="1"> 
     <title>Java</title> 
     <url>http://www.google.com</url> 
    </topic> 
    <topic id="2"> 
     <title>XML</title> 
     <url>http://www.ab</url> 
    </topic> 
    <topic id="3"> 
     <title>Javascript</title> 
     <url>http://www.tt</url> 
    </topic> 
    <topic id="4"> 
     <title>VBScript</title> 
     <url>http://www.wewe</url> 
    </topic> 
</howto> 

Hope this aidé ...

+0

J'ai aussi essayé XSLT, mais le problème que j'ai rencontré est que je ne peux pas obtenir toutes les données de MDFeedTyps et PxRngRules ... ainsi de suite. Pouvez-vous s'il vous plaît m'aider à obtenir ces données également. –

+0

S'il vous plaît montrer comment votre: csv sortie exacte ressemble correspodant à vos données, cela aiderait [compléter les données xml à csv] –

+1

Si vous utilisez Saxon, alors la construction d'un arbre DOM juste pour que vous puissiez le transformer est très mauvaise pratique: la transformation d'un DOM prend 5 à 10 fois plus de temps que la transformation d'un TinyTree Saxon natif. Vous devez fournir la source en tant que StreamSource ou SAXSource. –