Je voudrais créer une UDF qui effectue les opérations suivantes:Comment écrire UDF avec des valeurs comme références à d'autres colonnes?
A DataFrame
a 5 colonnes et souhaitez créer la 6ème colonne avec la somme que la valeur qui contiennent le nom de la première et la deuxième colonne.
Permettez-moi d'imprimer le DataFrame
et expliquer avec qui:
case class salary(c1: String, c2: String, c3: Int, c4: Int, c5: Int)
val df = Seq(
salary("c3", "c4", 7, 5, 6),
salary("c5", "c4", 8, 10, 20),
salary("c5", "c3", 1, 4, 9))
.toDF()
DataFrame
résultat
+---+---+---+---+---+
| c1| c2| c3| c4| c5|
+---+---+---+---+---+
| c3| c4| 7| 5| 6|
| c5| c4| 8| 10| 20|
| c5| c3| 1| 4| 9|
+---+---+---+---+---+
df.withColumn("c6",UDFName(c1,c2))
Et le résultat de cette colonne doit être:
1º rang (C3, C4) Puis 7 + 5 = 12
2º Rangée (C5, C4) Puis 2 0 + 10 = 30
3e rangée (C5, C3) Ensuite, 9 + 1 = 10
Veuillez considérer [accepter] (https://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work) une réponse aux questions que vous posez. – Shaido