J'ai une structure xml commeComment ajouter des informations en-tête à la ligne d'information lors de l'analyse d'un xml avec étincelle
<root>
<bookinfo>
<time>1232314973</time>
<requestID>233</requestID>
<supplier>asd123</supplier>
</bookinfo>
<books>
<book>
<name>book1</name>
<pages>124</pages>
</book>
<book>
<name>book2</name>
<pages>456</pages>
</book>
<book>
<name>book4</name>
<pages>789</pages>
</book>
</books>
</root>
Je sais que je peux analyser le books
comme:
val xml = sqlContext.read.format("com.databricks.spark.xml")
.option("rowTag", "book").load("FILENAME")
Mais je tiens à ajouter les informations d'en-tête comme supplier
à chacune des lignes.
Y at-il un moyen d'ajouter ce "headerinfo" à toutes les lignes avec étincelle sans charger le fichier deux fois et stocker l'information dans vars/vals globaux?
Merci d'avance!
grâce qui ont aidé, mal voté la réponse. – kf2