Existe-t-il un moyen d'imprimer les données entrantes? Par exemple J'ai un readStream sur un dossier à la recherche de fichiers json, mais il semble y avoir un problème car je vois des 'nulls' dans la sortie d'agrégation.Entrée de débogage de diffusion structurée
val schema = StructType(
StructField("id", LongType, false) ::
StructField("sid", IntegerType, true) ::
StructField("data", ArrayType(IntegerType, false), true) :: Nil)
val lines = spark.
readStream.
schema(schema).
json("in/*.json")
val top1 = lines.groupBy("id").count()
val query = top1.writeStream
.outputMode("complete")
.format("console")
.option("truncate", "false")
.start()
Pourquoi les lignes ne vous ' .writeStream.format ("console") 'alors? –