2016-08-08 1 views
3

Pourquoi fonction r « s prop.test (documentation here) renvoient des résultats différents selon que je passe un matrix ou des vecteurs?R: prop.test renvoie des valeurs différentes selon que la matrice ou des vecteurs sont transmis à ce

Ici, je transmets des vecteurs:

> prop.test(x = c(135, 47), n = c(1781, 1443)) 

    2-sample test for equality of proportions with 
    continuity correction 

data: c(135, 47) out of c(1781, 1443) 
X-squared = 27.161, df = 1, p-value = 1.872e-07 
alternative hypothesis: two.sided 
95 percent confidence interval: 
0.02727260 0.05918556 
sample estimates: 
    prop 1  prop 2 
0.07580011 0.03257103 

Ici créer un matrix et le transmettre à la place:

> table <- matrix(c(135, 47, 1781, 1443), ncol=2) 
> prop.test(table) 

    2-sample test for equality of proportions with 
    continuity correction 

data: table 
X-squared = 24.333, df = 1, p-value = 8.105e-07 
alternative hypothesis: two.sided 
95 percent confidence interval: 
0.02382527 0.05400606 
sample estimates: 
    prop 1  prop 2 
0.07045929 0.03154362 

Pourquoi puis-je obtenir des résultats différents? Je m'attends à ce que les mêmes résultats soient retournés pour les deux scénarios.

Répondre

2

Lorsque x et n sont entrés comme vecteurs séparés, ils sont respectivement traités comme le nombre de succès et le nombre total d'essais. Mais lorsque vous entrez une matrice, la première colonne est traitée comme le nombre de succès et la seconde comme le nombre d'échecs. De l'aide pour prop.test:

x a vector of counts of successes, a one-dimensional table with two 
    entries, or a two-dimensional table (or matrix) with 2 columns, giving 
    the counts of successes and failures, respectively. 

Ainsi, pour obtenir le même résultat avec une matrice, vous devez convertir la deuxième colonne de la matrice au nombre de défaillances (en supposant que dans votre exemple x est le nombre de succès et n est le nombre d'essais).

x = c(135, 47) 
n = c(1781, 1443) 

prop.test(x, n) # x = successes; n = total trials 
2-sample test for equality of proportions with continuity correction 

data: x out of n 
X-squared = 27.161, df = 1, p-value = 1.872e-07 
alternative hypothesis: two.sided 
95 percent confidence interval: 
0.02727260 0.05918556 
sample estimates: 
    prop 1  prop 2 
0.07580011 0.03257103 
prop.test(cbind(x, n - x)) # x = successes; convert n to number of failures 
2-sample test for equality of proportions with continuity correction 

data: cbind(x, n - x) 
X-squared = 27.161, df = 1, p-value = 1.872e-07 
alternative hypothesis: two.sided 
95 percent confidence interval: 
0.02727260 0.05918556 
sample estimates: 
    prop 1  prop 2 
0.07580011 0.03257103 
+0

Merci pour la clarté de celui-ci. La partie "nombre d'échecs" au lieu de "nombre d'essais" était quelque chose que mon cerveau manquait. Je m'attendais à ce que l'entrée soit le nombre total d'essais et non (1 - succès). – Jarad