3

La probabilité attendue de sélectionner aléatoirement un élément parmi un ensemble de n éléments est P = 1,0/n. Supposons que je vérifie P en utilisant une méthode non biaisée suffisamment de fois. Quel est le type de distribution de P? Il est clair que P n'est pas distribué normalement, puisqu'il ne peut pas être négatif. Ainsi, puis-je supposer correctement que P est gamma distributed? Et si oui, quels sont les paramètres de cette distribution? L'histogramme des probabilités de sélection d'un élément à partir d'un ensemble de 100 éléments pour 1000 fois est affiché here.Probabilité de sélectionner un élément dans un ensemble

Est-il possible de convertir en une distribution standard

maintenant supposé que la probabilité observée de sélection de l'élément donné est P * (P *! = P). Comment puis-je estimer si le biais est statistiquement significatif?

EDIT: Ce n'est pas un devoir. Je fais un projet de passe-temps et j'ai besoin de cette statistique pour cela. J'ai fait mes derniers devoirs il y a ~ 10 ans :-)

+0

Est-ce que ce sont les devoirs? –

+1

Ce n'est pas un devoir. Je fais un projet de passe-temps et j'ai besoin de cette statistique pour cela. J'ai fait mes derniers devoirs il y a 10 ans :-) –

+0

Tout cela ne dépend-il pas de votre générateur de nombres aléatoires? Si un générateur de nombres aléatoires était * parfait *, la probabilité est toujours 1/n pour chaque choix quel que soit le nombre de choix et après 1000 choix, chaque élément aurait dû être choisi 1000 fois/n fois - il me semble manquer quelque chose ici. – Mecki

Répondre

3

Avec les répétitions, votre distribution sera binomiale. Soit X le nombre de fois que vous sélectionnez un objet fixe, avec M sélections totales

P {X = x} = (M choisissez x) * (1/N)^x * (N-1/N)^(Mx)

Vous pouvez trouver cela difficile à calculer pour un grand N. Il s'avère que pour un N suffisamment grand, cela converge réellement vers une distribution normale avec probabilité 1 (théorème de limite centrale).

Dans le cas où P {X = x} sera donné par une distribution normale. La moyenne sera M/N et la variance sera M * (1/N) * (N-1)/N.

+0

"ceci converge en fait vers une distribution normale avec probabilité 1": Non, la convergence est dans la distribution (après redimensionnement approprié). La différence entre les deux n'est pas pertinente ici, mais mathématiquement votre déclaration est très fausse. –

+0

La convergence est également beaucoup plus lente pour p proche de 0 ou 1, de sorte que N doit être extrêmement grand. –

3

Ceci est un binomial distribution clair avec p = 1/(nombre d'éléments) et n = (nombre d'essais).

Pour tester si le résultat observé diffère significativement du résultat attendu, vous pouvez effectuer le binomial test. Les exemples de dés sur les deux pages de Wikipédia devraient vous donner de bons conseils sur la façon de formuler votre problème. Dans votre exemple d'essai de 100 éléments, 1000, cela équivaudrait à rouler un dé 100 fois 1000 fois.

1

Comme d'autres l'ont noté, vous voulez la distribution binomiale. Cependant, votre question semble impliquer un intérêt pour une approximation continue. Il peut en fait être approximated par la distribution normale, et aussi par le Poisson distribution.

Questions connexes