2017-10-18 4 views
-3

Ma question est très similaire à celle-ci Subset with unique cases, based on multiple columns. La seule différence est que je ne veux pas que la valeur dupliquée apparaisse dans la trame de données finale. dataframe Original:Comment se débarrasser des valeurs en double dans la colonne de données

df 
v1 v2 v3 v4 v5 
1 7 1 A 100 98 
2 7 2 A 98 97 
3 8 1 C NA 80 
4 8 1 C 78 75 
5 8 1 C 50 62 
6 9 3 C 75 75 

utilisant > df[!duplicated(df[1:3]),] me fait

v1 v2 v3 v4 v5 
1 7 1 A 100 98 
2 7 2 A 98 97 
3 8 1 C NA 80 
6 9 3 C 75 75 

Mais ce que je voudrais est

v1 v2 v3 v4 v5 
1 7 1 A 100 98 
2 7 2 A 98 97 

6 9 3 C 75 75 

J'ai essayé d'utiliser unique, mais il semble qu'il est juste garder la colonne, j'analyse . Toute aide serait grandement appréciée!

Répondre

1

Nous devons aussi obtenir l'duplicated de l'autre extrémité

df[!(duplicated(df[1:3])|duplicated(df[1:3], fromLast = TRUE)),]