2010-02-02 4 views
1

Je travaille sur un projet qui est plutôt différent de tout ce que j'ai fait auparavant. J'ai deux tests avec des résultats binaires qui seront administrés au même échantillon, qui est tiré d'une population groupée (c'est-à-dire que certains sujets seront issus de la même famille). J'aimerais comparer les proportions de résultats de tests positifs, mais le regroupement rend le test de McNemar inapproprié, alors j'ai lu des approches alternatives. Les deux voies principales semblent être 1) les alternatives de McNemar adaptées aux clusters par Rao et Scott (1992), Eliasziw et Donner (1991) et Obuchowski (1998), et 2) GEE. Connaissez-vous des implémentations de la lignée Rao-Obuchowski dans R (ou, je suppose, SAS)? GEE est facile à trouver, mais avez-vous eu une expérience positive ou négative avec des paquets particuliers? Y a-t-il un autre moyen d'analyser ces données qui me manque complètement?Quels paquets R sont disponibles pour les données binaires à la fois corrélées et en cluster?

Merci d'avance pour votre aide - faites-moi savoir si des éclaircissements sont nécessaires.

+0

Il existe une implémentation du test stratifié McNemar/signe dans le paquet muStat - http://finzi.psych.upenn.edu/R/library/muStat/html/F2-SMN.pvalue.html. Cependant. Je ne suis pas sûr que cela corresponde à vos besoins. –

+0

Merci pour les réponses, tout le monde. Ils ont tous l'air bien - je rapporterai quand je peux dire plus. –

Répondre

3

Vous pouvez toujours utiliser un bootstrap en cluster. Rééchantillonnez les familles que vous croyez indépendantes. Autrement dit, gardez les familles ensemble quand vous rééchantillonnez. Calculer p2 - p1 pour chaque échantillon. Après 1000 itérations, calculer les quantiles supérieurs et inférieurs de 2,5%. Cela vous donnera un intervalle de confiance de 95% amorcé. Vous pouvez également calculer la fraction d'échantillons au-dessus de zéro, ou quelle que soit votre hypothèse. La procédure devrait avoir de bonnes propriétés à moins que le nombre de familles soit petit.

Il est probablement plus facile de le faire à la main dans R plutôt que de se fier à un paquet.

2

Découvrez le package survey: il est conçu pour prendre en compte les corrélations induites par l'échantillonnage en cluster.

1

Le package clust.bin.pair pour les données de paires appariées binaires en cluster a été récemment publié sur CRAN.

Il contient des implémentations d'Eliasziw et Donner (1991) et Obuchowski (1998), ainsi que deux tests plus récents dans la même famille Durkalski (2003) et Yang (2010).

Questions connexes