2016-08-19 1 views
0

J'essaie actuellement d'exécuter un GLM pour les données dans R et j'essaie de comprendre si j'utilise le meilleur modèle possible. Mes données sont des données de comptage pour la survie de quatre espèces de mouches au fil du temps, avec l'espèce, le sexe, la densité et le jour (j'ai répété mon taux de survie tous les 5 jours) comme différents facteurs.Utilisation de GLM avec Poisson ou binôme Négatif avec données de comptage

Mon code ressemble à ceci:

survival <- cbind(Dead,Alive) 
model1 <- glm (survival ~ Species*density*Sex*day, 
     data = DataM5, family = quasibinomial) 
car::Anova(model1, Type = "III") 
plot(model1) 

Mes parcelles QQ ont des queues lourdes et mes résidus vs parcelles ajustées semblent très en biais vers la droite. Je comprends cela comme signifiant que ma variance n'est pas distribuée normalement (Pardonnez-moi si je n'ai pas ce droit, je me bats pour comprendre les statistiques mais faites de mon mieux), et si c'est le cas, alors les suppositions de mon gm sont violées . D'après ce que j'ai lu, je pense que je dois utiliser une distribution de Poisson ou une distribution binomiale négative, mais je n'arrive pas à faire fonctionner l'un ou l'autre. Est-ce la bonne approche? Et si c'est comment puis-je le faire fonctionner dans R?

QQ Plot

Residual vs Fitted Plot

+0

Cette question semble être plus sur les statistiques que la programmation R. En conséquence, je l'ai marqué pour être déplacé vers Cross Validated –

Répondre

0
  1. Une régression de poisson avec une fonction de lien de journal est généralement utilisé pour modéliser la réponse de comptage
  2. Espèces Densité sexe * jour, vous y compris l'interaction de tous vos covariables , réfléchissez à la question de savoir si c'est vraiment nécessaire ou non. En utilisant ce modèle, vous aurez probablement un modèle qui surimprime les données.
  3. La régression de Poisson est l'un des GLM (s), mais les résidus ne sont pas supposés être distribués normalement.