je la trame de données suivante:comment filtrer top 10 percentile d'une colonne dans un groupe de trames de données par identifiant en utilisant dplyr
id total_transfered_amount day
1 1000 2
1 2000 3
1 3000 4
1 1000 1
1 10000 4
2 5000 3
2 6000 4
2 40000 2
2 4000 3
2 4000 3
3 1000 1
3 2000 2
3 3000 3
3 30000 3
3 3000 3
nécessité de filtrer les lignes qui se situent au-dessus de 90 centiles dans la colonne « total_transfered_amount » pour chaque id paquet utilisant séparement dplyr preferabely, par exemple, je dois filtrer les lignes suivantes:
2 40000 2
3 30000 3
@akrun apprécient votre idée – sanaz
@DatamineR apprécie votre aide – sanaz
@ Mateusz1981 je doute sample_frac fonctionne basé sur le concept de percentile, ne veut pas échantillonner la colonne, je veux garder 90 percentile et se débarrasser des lignes qui faussent dans le top 10 percentile – sanaz