2017-07-09 1 views
1

J'utilise un Test rapport vraisemblance (en R) de chercher des effets principaux dans mon modèle à trois facteurs fixes (site, année, habitat) comme celui-ci:Comment faire rapport d'essai Probabilité Ratio résultats

model1<-glm(tot.mass~hab, data=biom, family = Gamma(link = "log")) 
anova(model1, test="Chisq") 
model2<-glm(tot.mass~year, data=biom, family = Gamma(link = "log")) 
anova(model2, test="Chisq") 
model3<-glm(tot.mass~site, data=biom, family = Gamma(link = "log")) 
anova(model3, test="Chisq") 

On m'a dit qu'en utilisant "anova (model3, test =" Chisq ")" je trouverai si (dans cet exemple) ajouter dans le terme "site" améliore significativement le modèle. D'après ce que je comprends, puisque ma valeur de p est> 0,5, le site n'a pas d'effet significatif sur mon modèle (par exemple, ce n'est pas un effet principal pour cette variable de réponse). Ma sortie ressemble à ceci:

 Df Deviance Resid. Df Resid. Dev Pr(>Chi) 
NULL     687  1681.2   
site 2 16.543  685  1664.7 0.2884 

Mes questions sont 1) que j'interprète cela correctement et 2) comment pourrais-je signaler ces résultats? Devrais-je signaler la déviance et pvalue ("Pr (> Chi)")?

Merci!

+0

que vous essayez de faire le choix du modèle. Assurez-vous de lire et de comprendre les réponses à [cette question] (https://stats.stackexchange.com/q/20836/11849). – Roland

Répondre

1

Quelques commentaires avant de répondre,

1) Gardez toujours à l'esprit que l'ordre que vous testez les termes de votre modèle joue un rôle important dans leur signification statistique. Cela arrive parce que vous comparez séquentiellement des modèles les uns par rapport aux autres (c'est-à-dire dans votre cas, vous avez comparé le modèle NULL (pas de prédicteurs) à un modèle avec "site" comme seul prédicteur). Si vous ajoutez une variable supplémentaire, vous comparez le modèle contenant uniquement "site" à un modèle contenant "site" et "une autre variable". 2) Un moyen facile de se rappeler est de considérer la déviance comme la «distance» entre deux modèles (le chisq ne prend que des valeurs positives), donc plus éloignés sont deux modèles, plus la variable ajoutée est statistique significatif parce que le dernier modèle est supérieur par rapport au précédent.

3) Quand je parle de la première, deuxième, troisième, ..., dernier modèle que je parle de l'ordre que vous voyez ces sur la table ANOVA R.

4) Cette question est mieux être placé dans la section des statistiques.

Dans votre question,

 Df Deviance Resid. Df Resid. Dev Pr(>Chi) 
NULL     687  1681.2   
site 2 16.543  685  1664.7 0.2884 

1) Compte tenu de la table au-dessus du modèle contenant « site » ne fournit pas une amélioration significative (par rapport au modèle NULL) au niveau de la confiance que vous avez mentionné, ce qui pourrait signifie que la variable "site" est insignifiante au niveau de confiance donné, ce qui est proche de votre interprétation. Cependant, si vous voulez être 100% correct ce que vous obtenez de cette table est seulement ceci: "Étant donné le tableau ci-dessus le modèle contenant" site "ne fournit pas d'amélioration significative (par rapport au modèle NULL) à la niveau de confiance que vous avez mentionné ". Et je pense que c'est la bonne réponse à la question.

* Peut-être que si vous réorganisez les variables et ajouter une autre variable d'abord, puis « site » vous trouverez peut-être « site » statistiquement significatif, mais je pense qu'il est peu probable. (Commentaire 1)

* En utilisant également un autre modèle (c'est-à-dire logistique) pourrait vous donner un résultat différent. Donc rappelez-vous toujours que la chose que vous testez est si un modèle est statistiquement meilleur comparé à un autre. Par exemple, une variable peut être un bon prédicteur de la réponse, mais comme la forme fonctionnelle de votre modèle est incorrecte, vous pouvez en déduire que la variable est statistiquement non significative, ce qui est faux.

C'est ainsi que vous interpréterez ce résultat.

2) Vous devez signaler le Déviance , degrés de liberté DF=2 et apparemment p-valeur 0.2884