2017-08-14 5 views
3

Je suis nouveau à l'analyse XML groovy. Je suis en train d'analyser le fichier xml ci-dessousComment analyser xml en utilisant groovy

<font face=Tahoma size=2> 
    Team,<br/><br/> Please find below the test summary details for the 'Test' execution.<br/><br/><b><U>Transaction Summary Table:</U></b><br/><br/> 
    <table border=1 CELLPADDING =3 style='font-family:Tahoma;font-size:12'> 
     <tr> 
     <b> 
      <th bgcolor=#C0C0C0> TransactionName </th> 
      <th bgcolor=#C0C0C0> AverageLatency </th> 
      <th bgcolor=#C0C0C0> MinimumLatency </th> 
      <th bgcolor=#C0C0C0> MaximumLatency </th> 
      <th bgcolor=#C0C0C0> AverageElapsedTime </th> 
      <th bgcolor=#C0C0C0> MinimumElapsedTime </th> 
      <th bgcolor=#C0C0C0> MaximumElapsedTime </th> 
      <th bgcolor=#C0C0C0> TotalCount </th> 
      <th bgcolor=#C0C0C0> PassPercentage </th> 
     </b> 
     </tr> 
     <tr> 
     <td>1 /aumentum/</td> 
     <td> 
      <center>1648.0</center> 
     </td> 
     <td> 
      <center>1240</center> 
     </td> 
     <td> 
      <center>2900</center> 
     </td> 
     <td> 
      <center>1907.0</center> 
     </td> 
     <td> 
      <center>1495</center> 
     </td> 
     <td> 
      <center>3140</center> 
     </td> 
     <td> 
      <center>45</center> 
     </td> 
     <td> 
      <center>100.0</center> 
     </td> 
     </tr> 
     <tr> 
     <td>T01_Aumentum_Home</td> 
     <td> 
      <center>6.0</center> 
     </td> 
     <td> 
      <center>1</center> 
     </td> 
     <td> 
      <center>10</center> 
     </td> 
     <td> 
      <center>1956.0</center> 
     </td> 
     <td> 
      <center>1490</center> 
     </td> 
     <td> 
      <center>3806</center> 
     </td> 
     <td> 
      <center>213</center> 
     </td> 
     <td> 
      <center>0.0</center> 
     </td> 
     </tr> 
</tbody> 
    </table> 
    <br/><br/>Thanks,<br/>Performance Team. 
</font> 
<br/><br/> 

Résultat attendu:

[{ 
"transaction name":"1 /aumentum/", 
"AverageLatency ":"1648.0", 
"Minimum latency":"1240", 
"MaximumLatency ":"2900", 
"AverageElapsedTime":"1907.0", 
"MinimumElapsedTime":"1495", 
"MaximumElapsedTime":"3140", 
"TotalCount":"45", 
"PassPercentage":"100.0" 
}, 
{ 
"transaction name": "1 /aumentum/", 
"AverageLatency ":"1648.0", 
"Minimum latency":"1240", 
"MaximumLatency ":"2900", 
"AverageElapsedTime":"1907.0", 
"MinimumElapsedTime":"1495", 
"MaximumElapsedTime":"3140", 
"TotalCount":"45", 
"PassPercentage":"100.0" 

}] 

j'ai les premiers enfants à l'aide de valeurs à l'aide docParser.getElementsByTag("tr").first()

Voici l'erreur que je reçois:

Exception thrown 
java.lang.IndexOutOfBoundsException: Index: 0, Size: 0 
    at org.jsoup.select.Elements.get(Elements.java:519) 
    at org.jsoup.nodes.Element.child(Element.java:174) 
    at org.jsoup.nodes.Element$child$0.call(Unknown Source) 
    at CommonUtils.parseLRHTMLReport(jmeteragent.groovy:304) 
    at CommonUtils$parseLRHTMLReport.call(Unknown Source) 

Voici ce que j'ai fait jusqu'à présent:

def transactiondetails12 = null 
def iterator12 = 0 
int count1 = 0 
def violcounts = 0 
def violations = null; 

tmpElement = docParser.getElementsByTag("tr").first() 
println tmpElement.children() 
// tmpElement= tmpElement.child(0) 
// println "#########tmpElement#########:" +tmpElement 


for (element in tmpElement.children()) { 
    if (iterator12 == 0) { 
     // transactiondetails1 = "<table border=1 CELLPADDING =3 style='font-family:Tahoma;font-size:12'><tr><b><th bgcolor=#C0C0C0>" + 
     element.child(0).text().trim() + "</th><th bgcolor=#C0C0C0>" + element.child(2).text().trim() + "</th><th bgcolor=#C0C0C0>" + 
       element.child(3).text().trim() + "</th><th bgcolor=#C0C0C0>" + element.child(4).text().trim() + "</th></b></tr>" 
     iterator12 = 1; 
     count1++; 
     // println "nqwlieufrh 2938ry `9p23dhWCDNJ p3fu89 Q2390RUD"+transactiondetails1 
    } else { 
     count1++; 
     if (count1 <= 5) { 

      // println "iterator1iterator1iterator1iterator1"+iterator1++ 
      transactiondetails12 = transactiondetails12 + "<tr><td>" + element.child(0).text().trim() + "</td><td><center>" + 
        element.child(2).text().trim() + "</center></td><td><center>" + 
        element.child(3).text().trim() + "</center></td><td><center>" + 
        element.child(4).text().trim() 
      println "transactiondetails12" + transactiondetails12 
      // println "3215463654156436212315465123011482145634217225445622341"+element.child(4).text().trim() 
      String violation1 = element.child(1).text() 
      // violation=Integer.valueOf(violation1) 
      // violation=Integer.parseInt(violation1) 

      // if(violation1>=0) 
      if (violation1.length() > 0) { 
       violcounts++ 
      } 


     } 
    } 

} 

Je n'ai aucune idée de mapper les valeurs tmpElement.children(). Tout conseil à ce sujet serait utile. Merci d'avance.

Répondre

1

L'exemple que vous avez fourni utilise la bibliothèque jsoup qui est utile pour la manipulation du DOM HTML. La solution à votre problème consiste à utiliser des sélecteurs corrects pour extraire les données.

Prenons exemple suivant:

def headers = docParser.select("tr > th").collect { it.text() } 
def result = [] 

docParser.select("tr:has(td)").each { tr -> 
    def obj = [:] 
    tr.select("td").eachWithIndex { Element td, int i -> 
     obj[headers[i]] = td.text() 
    } 
    result << obj 
} 

println JsonOutput.prettyPrint(JsonOutput.toJson(result)) 
  • docParser.select("tr > th").collect { it.text() } les collectionne les en-têtes de table et les magasins comme un ordonné List<String>
  • docParser.select("tr:has(td)") sélectionne toutes les lignes (à l'exclusion en-tête de table) avec des données
  • tr.select("td").eachWithIndex itère l'intérieur de chaque rangée , recueille les données et les associe avec l'en-tête par index i
  • les derniers écrans de ligne souhaitée sortie à la console

Sortie:

[ 
    { 
     "TransactionName": "1 /aumentum/", 
     "AverageLatency": "1648.0", 
     "MinimumLatency": "1240", 
     "MaximumLatency": "2900", 
     "AverageElapsedTime": "1907.0", 
     "MinimumElapsedTime": "1495", 
     "MaximumElapsedTime": "3140", 
     "TotalCount": "45", 
     "PassPercentage": "100.0" 
    }, 
    { 
     "TransactionName": "T01_Aumentum_Home", 
     "AverageLatency": "6.0", 
     "MinimumLatency": "1", 
     "MaximumLatency": "10", 
     "AverageElapsedTime": "1956.0", 
     "MinimumElapsedTime": "1490", 
     "MaximumElapsedTime": "3806", 
     "TotalCount": "213", 
     "PassPercentage": "0.0" 
    } 
] 

Et là, vous trouverez tous les scripts Groovy je l'ai utilisé pour expérimenter avec votre exemple: https://gist.github.com/wololock/651a536dff4e104ebba0eef69d4ac3ea

Je l'espère aide.