J'ai un RDD [(Int, Iterable [Coordinates])] qui a été groupé par clé (index: Int). Coordonnées est une classe avec les membres:Comment aplatir le contenu Spark RDD groupé en lignes individuelles puis enregistrer dans le fichier
latitude: Double, longitude: Double
Je voudrais créer l'impression ou créer un fichier csv, ce serait sous la forme suivante (une ligne pour chaque point de données):
index,latitude,longitude
Avec le RDD [(Int, coordonnées)] non regroupées, il a travaillé comme ceci:
val textOutputRDD = initialRDD.map(
f => f._1.toString() + "," + f._2.latitude.toString() + "," + f._2.longitude.toString())
textOutputRDD.saveAsTextFile("TextOutput")
Comment puis-je réussi à le faire dans ce cas?
Quelle version de Spark Apache utilisez-vous? – stefanobaghino
@stefanobaghino 2.1.0 – ilvo