I ont une trame de données comme ceci:calculer les valeurs aberrantes dans R
x
Team 01/01/2012 01/02/2012 01/03/2012 01/01/2012 01/04/2012 SD Mean
A 100 50 40 NA 30 60 80
I like pour effectuer le calcul de chaque cellule à la moyenne et écart-type pour calculer les valeurs aberrantes. Par exemple,
abs(x-Mean) > 3*SD
x$count<-c(1)
(incrémenter cette valeur si la condition ci-dessus est remplie). Je fais ceci pour vérifier l'anomalie dans mon ensemble de données. Si je connais les noms de colonnes, il serait plus facile de faire les calculs, mais le nombre de colonnes variera. Certaines cellules peuvent avoir NA dans les.
J'aime Subtrack dire de chaque cellule, et j'ai essayé ce
x$diff<-sweep(x, 1, x$Mean, FUN='-')
ne semble pas fonctionner, des idées?
Si vous nous fournissez un petit échantillon données avec 'dput (head (x))', alors nous pouvons simplement le couper et le coller dans nos navigateurs, et tester nos solutions. – nograpes