Je veux sous-ensemble mon dataframe sous la condition que le nombre de variables correspondant est égal à un nombre, par exempleSubset un dataframe où nombre de variables correspondant est k
example <- rbind(sample(letters[1:5]),
sample(letters[1:5]),
sample(letters[1:5]),
sample(letters[1:5]),
sample(letters[1:5]))
example
[,1] [,2] [,3] [,4] [,5]
[1,] "b" "a" "d" "e" "c"
[2,] "e" "c" "a" "d" "b"
[3,] "c" "a" "d" "b" "e"
[4,] "b" "d" "e" "c" "a"
[5,] "b" "c" "e" "d" "a"
si je voulais mon numéro de les variables correspondantes étaient 3, les deux dernières lignes seraient sélectionnées, puisqu'elles ont 3 lettres en commun (même endroit et même lettre).
Chaque ligne de la matrice doit être comparée à toutes les autres lignes dans la matrice et si elle correspond au seuil (ici 3) pour une ligne alors à la fois les lignes seraient être sélectionné? –
Exactement, les lignes qui ont 3 éléments en commun doivent être sélectionnées. –