Je crée une nouvelle trame de données à partir d'une trame de données existante, mais besoin d'ajouter une nouvelle colonne (« field1 » dans le code ci-dessous) dans ce nouveau DF. Comment je fais ça? Un exemple de code de travail sera apprécié.Créer un nouveau champ vide avec dataframe/valeurs nulles
val edwDf = omniDataFrame
.withColumn("field1", callUDF((value: String) => None))
.withColumn("field2",
callUdf("devicetypeUDF", (omniDataFrame.col("some_field_in_old_df"))))
edwDf
.select("field1", "field2")
.save("odsoutdatafldr", "com.databricks.spark.csv");
@ zero323, merci pour le partage cela, très utile. Voir mes modifications pour le soutien d'autres types. –
@DmitriySelivanov Merci pour votre aide. J'ai abandonné l'idée d'utiliser 'Option' après quelques expériences ratées avec des littéraux il y a quelques temps :) – zero323
note:' toDF() 'nécessite' import spark.implicits._' – Boern