J'ai une base de données qui contient 4 colonnes.comment créer une fonction distincte personnalisée définie par l'utilisateur
exemple de trame de données
id1 id2 id3 id4
---------------
a1 a2 a3 a4
b1 b2 b3 b4
b1 b2 b3 b4
c1 c2 c3 c4
b2
c1
a3
a4
c1
d4
Il existe 2 types de données dans une rangée, soit toutes les colonnes ont des données ou une seule colonne. Je souhaite effectuer une fonction distincte sur toutes les colonnes, par exemple, en comparant les valeurs entre les lignes, je ne comparerai que la valeur présente dans une ligne et je ne considérerai pas les valeurs nulles.
sortie dataframe doit être
id1 id2 id3 id4
a1 a2 a3 a4
b1 b2 b3 b4
c1 c2 c3 c4
d4
J'ai regardé plusieurs exemples de UDAF à étincelle. Mais pas en mesure de modifier selon.
pourquoi utilisez-vous pas la méthode de filtrage sur les quatre colonnes? –
Comment le filtre peut m'aider? – Kaushal
s'il vous plaît voir ma réponse ci-dessous –