2017-05-09 3 views
0

J'ai une liste de valeurs qui augmentent de façon exponentielle. On m'a demandé d'avoir plusieurs coefficients de variation d'eux. Vous pouvez être d'accord avec moi que CV est seulement pour l'ensemble des nombres et diviser l'ensemble des nombres en sous-groupes et le calcul d'un CV pour chaque sous-groupe semble déraisonnable. Y aurait-il une idée statistique derrière plusieurs CV et s'il y en a, comment l'histogramme peut-il être fait par les CV, je veux dire ce que seraient les poubelles de l'historgram. J'apprécie les réponses à l'avanceCoefficient de variation?

Répondre

0

Je suis d'accord avec vous - cela n'a pas de sens pour moi de calculer plusieurs CV pour un jeu de données sauf si il ya une raison inférentielle pour le faire.

Cela étant dit, il pourrait en fait y avoir une raison de considérer des sous-groupes d'un ensemble de données. Dans le domaine des statistiques, le contexte est tout. Ma première pensée est de demander à votre collègue pourquoi il veut que vous procédiez ainsi. Peut-être qu'il y a une bonne raison, peut-être qu'ils n'ont pas une connaissance aussi complète des statistiques que vous, quoi qu'il en soit, cela devrait être une conversation éclairante.

Si vous décidez d'aller dans cette voie, voici un code R qui pourrait aider (R est grande - flexible, puissant et gratuit)

# first, simulating some fake data (100 values of measurement & group for 10 groups) 
x <- rnorm(100, mean=10, sd=1) 
group <- sample(LETTERS[1:10], 100, replace=T) 

# first few values of each 
head(data.frame(x, group)) 
      x group 
1 10.778480  F 
2 9.274193  B 
3 9.639143  G 
4 9.080369  I 
5 10.727895  D 
6 10.850306  G 

# this is the part you'd actually need... 
# calculating the sd & avgs for each group 
sds <- tapply(x, group, sd) 
avgs <- tapply(x, group, mean) 

# then the cv 
cvs <- sds/avgs 

cvs 
     A   B   C   D   E   F   G   H   I   J 
0.07859528 0.07570556 0.09370247 0.12552468 0.08897856 0.11044543 0.10947615 0.10323379 0.08908262 0.09729945 

# and if you want a histogram, R makes it pretty easy 
hist(cvs)