2012-08-03 6 views
1

J'ai un grand ensemble de données provenant d'un fichier Excel (enregistré en tant que csv) qui a des essais (X) et des temps (Y) en son sein. Je sais qu'il existe un code permettant de supprimer des valeurs aberrantes uniques dans un essai en utilisant le code de test du khi-deux. Mais, je veux être en mesure de sortir la colonne entière qui a des valeurs aberrantes dans l'ensemble de données, tout en laissant intactes les autres données dans le fichier. J'ai du mal à trouver/à trouver un code qui permette cela. Y a-t-il des suggestions ?!Suppression de valeurs aberrantes dans r

+2

vous voulez supprimer la ligne * entière *? – user189035

+0

Oui ... Eh bien, toute la colonne avec la valeur aberrante –

Répondre

11

Compte tenu de votre réponse à @ user603, je suppose que vous voulez supprimer une variable X complète de votre jeu de données si même une seule observation a une valeur aberrante sur cette variable. Ceci est trivial à faire dans R. Utilisez votre stratégie privilégiée pour identifier les valeurs aberrantes et l'assigner à une variable:

outs = c(...) 
data = data[,-outs] 

Sinon, vous pouvez tout simplement pas inclure ces variables dans votre formule de modèle et laisser le data.frame comme est. Sur une note différente


, je pense que cela est une très mauvaise idée, et je pense qu'il doit y avoir une certaine confusion, vous invitant à croire c'est quelque chose que vous devriez faire. Permettez-moi d'exposer quelques points:

  1. Il n'est généralement pas logique de considérer les covariables comme ayant des valeurs aberrantes. Nous considérons généralement les valeurs aberrantes comme étant dans la variable de réponse . Dans ce cas, une possibilité serait de supprimer lignes (c'est-à-dire data = data[-outs,]).
  2. Si vous avez des valeurs aberrantes, la suppression des observations est généralement la pire de vos options possibles. Il serait préférable d'utiliser un robust loss function, tel que le bisquare de Tukey.
+4

(+1) Je pense que vous avez fait un travail décent de transformer une question hors sujet en une question sur le sujet avec vos dernières remarques :) – Macro

Questions connexes