J'ai un grand ensemble de données provenant d'un fichier Excel (enregistré en tant que csv) qui a des essais (X) et des temps (Y) en son sein. Je sais qu'il existe un code permettant de supprimer des valeurs aberrantes uniques dans un essai en utilisant le code de test du khi-deux. Mais, je veux être en mesure de sortir la colonne entière qui a des valeurs aberrantes dans l'ensemble de données, tout en laissant intactes les autres données dans le fichier. J'ai du mal à trouver/à trouver un code qui permette cela. Y a-t-il des suggestions ?!Suppression de valeurs aberrantes dans r
Répondre
Compte tenu de votre réponse à @ user603, je suppose que vous voulez supprimer une variable X complète de votre jeu de données si même une seule observation a une valeur aberrante sur cette variable. Ceci est trivial à faire dans R. Utilisez votre stratégie privilégiée pour identifier les valeurs aberrantes et l'assigner à une variable:
outs = c(...)
data = data[,-outs]
Sinon, vous pouvez tout simplement pas inclure ces variables dans votre formule de modèle et laisser le data.frame comme est. Sur une note différente
, je pense que cela est une très mauvaise idée, et je pense qu'il doit y avoir une certaine confusion, vous invitant à croire c'est quelque chose que vous devriez faire. Permettez-moi d'exposer quelques points:
- Il n'est généralement pas logique de considérer les covariables comme ayant des valeurs aberrantes. Nous considérons généralement les valeurs aberrantes comme étant dans la variable de réponse . Dans ce cas, une possibilité serait de supprimer lignes (c'est-à-dire
data = data[-outs,]
). - Si vous avez des valeurs aberrantes, la suppression des observations est généralement la pire de vos options possibles. Il serait préférable d'utiliser un robust loss function, tel que le bisquare de Tukey.
(+1) Je pense que vous avez fait un travail décent de transformer une question hors sujet en une question sur le sujet avec vos dernières remarques :) – Macro
- 1. Suppression des valeurs aberrantes dans R
- 2. R: détection itératives valeurs aberrantes
- 3. Tabulation des valeurs aberrantes dans R
- 4. calculer les valeurs aberrantes dans R
- 5. robuste aux valeurs aberrantes lm dans R
- 6. Etiquetage des valeurs aberrantes Boxplot dans R
- 7. Suppression de valeurs aberrantes multiples dans le modèle de régression en R
- 8. Suppression des valeurs aberrantes du calcul du coefficient de corrélation
- 9. Modification de la règle des valeurs aberrantes dans un boxplot
- 10. Détection de valeurs aberrantes pour une trame de données multi-colonnes dans R
- 11. Valeurs aberrantes lors de l'évaluation des performances
- 12. Comment procédez-vous à l'amorçage et à la suppression des valeurs aberrantes dans Weka?
- 13. Comment trouver des valeurs aberrantes dans R en comparant le texte à une valeur numérique?
- 14. Identifier et stocker les valeurs aberrantes MATLAB
- 15. Règles aberrantes dans JFreeChart Boxplots?
- 16. Comment définir la couleur des valeurs aberrantes en R - réseau - bwplot
- 17. jitter si plusieurs valeurs aberrantes dans gpplot2 boxplot
- 18. R: Suppression des valeurs NA d'une trame de données
- 19. Etiquettes aberrantes d'un boxplot dans Gnuplot
- 20. Suppression des ponctuations dans R
- 21. R: nettoyage des valeurs aberrantes pour chaque colonne dans une base de données en utilisant des quantiles 0,05 et 0,95
- 22. Identification des données aberrantes
- 23. Suppression de lignes de données dans R
- 24. Suppression des niveaux d'indexation dans R
- 25. R - Suppression de week-end de dataframe en R
- 26. Suppression de certaines expressions régulières dans r
- 27. R: suppression des symboles '$'
- 28. R - Suppression de parties de valeur
- 29. Vous vous demandez comment numéroter les valeurs aberrantes lors de l'utilisation de qqnorm?
- 30. Méthodes de détection des valeurs aberrantes dans la reconnaissance du son?
vous voulez supprimer la ligne * entière *? – user189035
Oui ... Eh bien, toute la colonne avec la valeur aberrante –