2009-04-26 4 views
3

Je ne suis pas sûr si cette question est appropriée pour Stack Overflow mais je vais essayer quand même. j'ai quelques données comme suit: (. Par exemple, 30% au lieu de 17%)Algorithme d'estimation statistique

alt text

J'ai aussi un autre ensemble de données que je crois suit une loi similaire, mais je ne connais que le pour cent au total Quelqu'un peut-il suggérer un algorithme pour estimer le% s pour chaque niveau individuel en fonction du nouveau total et de la distribution d'origine?

+1

C'est une bonne questionpour SO. Je modifierais cependant votre test et retirerais votre première phrase. Les premières phrases d'une question sont présentées sous forme de bulles d'aide ou d'aperçus, vous devez donc renoncer aux formalités et aller droit au but. – JoshBerke

+0

Le total possible doit-il rester fixe? –

+0

Ce n'est vraiment pas clair pour moi ce que vous essayez de faire. Je vais essayer de répondre à votre question si vous pouvez expliquer en détail ce que signifient toutes vos mesures, combien vous en avez et ce que vous voulez exactement estimer. – simon

Répondre

1

Votre question n'est pas claire. Si vous voulez estimer un nouveau pourcentage total en incluant les données supplémentaires que vous obtenez, vous devez avoir une quantité associée à votre pourcentage afin que vous puissiez créer une moyenne pondérée moyenne. Si vous voulez déterminer si le nouvel ensemble de données a une distribution différente de celle des données historiques, plusieurs tests effectuent principalement des calculs obtus sur les pourcentages réels cumulés par rapport aux valeurs attendues sous une valeur particulière. Il y a beaucoup de littérature sur le sujet sur la comparaison des distributions de deux populations. Pour les échantillons appariés, Wilcoxon-Rank est une méthode standard si vous ne pouvez faire aucune hypothèse sur la distribution des données. Pour les données non appariées, il existe non-parametric statistics mais elles nécessitent une étude approfondie.

1

Étape-1: Si votre pourcentage global est de 17% → 30% alors, Réel (total) 105 → ~ 189.

Step-2: Ce nombre doit être réparti sur tous les éléments dans la colonne réelle

De là, les choses deviennent non-linéaire, et nous avons besoin d'une formule pour arriver à Actual de PossiBLes. Et cela doit être fonction du total.

c.-à-d., Fonction (possible, total (réel)) = réel.

Si nous pouvons arriver à ce qui précède, il pourrait alors travailler;)

+0

hein? Je suppose que je ne reçois pas quelque chose de fondamental. – ojblass

0

Si votre nouveau total est x, puis mis (22/627) * x que possible pour le niveau 1, et (21/627) * x comme réel pour le niveau 1, ce qui vous donnera le même pourcentage qu'avant pour le niveau 1. Ensuite, faites la même chose pour les autres niveaux (donc possible pour le niveau 2 est (45/627) * x, etc.).