2009-08-13 10 views
1

Comment calculer la moyenne d'un ensemble de données tout en lissant les points qui ne correspondent pas à la «norme». Cela fait un moment que je devais faire de vrais calculs, mais je suis sûr que j'ai appris quelque part ...Moyenne pondérée des données sur les ventes

Disons que j'ai 12 jours de ventes sur un article: 2,2,2,50, 10,15,9,6,2,0,2,1

Je voudrais calculer les ventes moyennes par jour sans laisser le 4e jour (50) trop grossir la moyenne. Log, Percentile, quelque chose comme ça je pense ...

+1

Chaque professeur de statistiques que j'ai eu m'a appris que nous ne devrions pas supprimer des données simplement parce qu'elles ne sont pas conformes. Je vais quand même mettre en doute la réponse de Matt. – mcandre

+0

Oui, vous ne voulez certainement pas supprimer des données. La moyenne pour les 12 jours est ce qu'elle est, la 50 fait partie de la moyenne. Vous pourriez également être intéressé par les ventes médianes qui, pour cet ensemble de données seraient de 2, alors que la moyenne est de 8,4. –

+0

Si vous utilisez la moyenne comme prédicteur des ventes futures, il est parfaitement normal d'éliminer les valeurs aberrantes. –

Répondre

5

Il me semble que vous cherchez un moving average.

+0

Ah! Parfait, je savais qu'il avait un nom. –

1

Vous pouvez également filtrer par seuil à un multiple de l'écart-type. Cela permettrait de filtrer les résultats qui étaient beaucoup plus loin que prévu de la moyenne (moyenne).

La déviation standard est simplement sqrt (sum (your_values ​​- average_value)/number_of_values).

edit: Vous pouvez également regarder la pondération de la valeur par son écart par rapport à la moyenne. Ainsi, les valeurs qui sont très grandes peuvent être pondérées comme 1/exp (déviation) et contribuent donc beaucoup moins à la moyenne qu'elles sont.

1

Vous voudrez utiliser quelque chose comme IQR (interquartile range). Fondamentalement, vous divisez les données en quartiles et ensuite calculer la médiane des premier et troisième quartiles. Ensuite, vous pouvez obtenir votre tendance centrale des données.

Questions connexes