Je voudrais calculer une variable id
basée sur la combinaison unique de deux variables (ou plus). Prenons l'exemple simple ci-dessous:Attribuer un ID unique à des lignes équivalentes dans la trame de données
# Example dataframe
mydf <- data.frame(var1 = LETTERS[c(1, 2, 1)], var2 = LETTERS[c(2, 1, 3)])
mydf
# var1 var2
# A B
# B A
# A C
Ici, les lignes 1 et 2 devraient avoir la même id
parce AB
et BA
représentent une combinaison des mêmes éléments. La rangée 3 a cependant un id
différent puisque la combinaison AC
n'apparaît qu'une seule fois.
# Desired output
cbind(mydf, cid = c(1, 1, 2))
# var1 var2 cid
# A B 1
# B A 1
# A C 2
Une suggestion?
Echoue si, par exemple, les lignes 2 et 3 sont permutées dans 'mydf'. – 989