2017-04-21 2 views
0

J'ai beaucoup de données sur la façon dont les choses se sont développées en laboratoire. Cela implique différentes informations sur le site de collecte et différents traitements.Utiliser GLM dans R pour voir si le sex-ratio varie selon le groupe

Ma question ici: Les regroupements (lieu et traitement) ont-ils eu un effet sur la ration sexuelle résultante des mâles adultes envers les femelles? Et puis-je comprendre cela avec un GLM?

[Je ne sais pas combien de chaque sexe que je mets, il était aléatoire, certains jeunes sont morts au cours du développement et je ne sexés les adultes]

Je suivais le long de ce tutoriel où j'ai utilisé un GLM à enquêter sur les rapports sexuels: http://www.simonqueenborough.info/R/stats-basic/glm.html

Voici mes données et le code:

mo<-"Temp Locality Females Males 
A APR 88 110 
B APR 101 97 
C APR 85 94 
A ARS 65 69 
B ARS 57 78 
C ARS 54 76 
A RMO 103 90 
B RMO 97 101 
C RMO 82 78 
A RPV 89 92 
B RPV 98 86 
C RPV 64 76 
A SJU 66 63 
B SJU 57 66 
C SJU 16 17 
A TLC 45 46 
B TLC 41 43 
C TLC 27 44 
A TPN 25 20 
B TPN 22 25 
C TPN 16 22" 

data <- read.table(text=mo, header = TRUE) 
y<-cbind(data$Males,data$Females) 
model<-glm(y~data$Temp+data$Locality, family=binomial) 
summary(model) 

#results of summary (model) 
Call:      
glm(formula = y ~ sexy$Temp + sexy$Locality, family = binomial)      

Deviance Residuals:       
    Min  1Q Median  3Q  Max       
-0.8231 -0.5549 -0.2398 0.5038 1.2954       

Coefficients:      
       Estimate Std. Error z value Pr(>|z|)      
(Intercept)  0.03839 0.09885 0.388 0.698      
sexy$TempB  0.03032 0.09093 0.333 0.739      
sexy$TempC  0.14538 0.09818 1.481 0.139      
sexy$LocalityARS 0.14092 0.13098 1.076 0.282      
sexy$LocalityRMO -0.13872 0.11938 -1.162 0.245      
sexy$LocalityRPV -0.07783 0.12213 -0.637 0.524      
sexy$LocalitySJU -0.01914 0.14600 -0.131 0.896      
sexy$LocalityTLC 0.07243 0.15286 0.474 0.636      
sexy$LocalityTPN -0.03022 0.19444 -0.155 0.877 

de la fois résumé du modèle, j'ai trouvé aucune différence significative dans le rapport sexuel par la température ou de la localité. Est-ce réel? Le GLM est-il approprié ou existe-t-il une autre méthode?

+0

Ressemble à une question de statistiques plutôt qu'à une question de programmation. Vous devriez demander sur https://stats.stackexchange.com/ – Ryan

+0

Merci, allez là-bas! – Virchu

Répondre

0

Pas une question pour ici ... mais je vais y répondre de toute façon.

Votre modèle n'a aucun sens. Un modèle binomial devrait avoir une variable dépendante 1 ou 0. La question avec un modèle binomial serait «pour chaque observation individuelle d'une femme ou d'un homme (1 ou 0), la température ou la localité influence-t-elle la probabilité qu'une femme ou un homme soit observé? Ainsi, au lieu de modéliser le nombre de femelles par rapport au nombre de mâles, vous modélisez la probabilité qu'à un point donné, une femelle ou un mâle soit observé en fonction de l'influence de la température/localité.

Vous pouvez modéliser le ratio de manière explicite en créant une variable dépendante de sexe masculin/féminin ou vice versa et l'utiliser dans un modèle de régression linéaire. Mais ce serait probablement mal avisé. Modéliser les proportions dans un cadre linéaire peut être anti-conservateur, en particulier si les proportions sont proches de 1. Mais si vos ratios sont bien répartis entre 0: 1 et non asymétriques proches de 1, alors ce n'est peut-être pas si terrible. peu de bon moyen de modéliser un ratio).

Je considérerais reformater vos données afin que vous puissiez réellement le modeler dans un cadre binomial, comme votre idée originale. La logique de modélisation du modèle binomial est relativement proche de la question voulue (qu'est-ce qui influence la probabilité que j'observe un homme ou une femme)? Il suffit de faire une trame de données qui a 1 observation de Température et 1 observation de Localité pour chaque observation de genre (codée comme 1 ou 0 (p.ex., mâle == 1, femelle == 0)) et modélise cela dans un binôme/logistique cadre.

Vous pourriez faire un 2ème modèle binomial de dead vs pas mort si vous voulez voir ce que diff/localité diffs. influencé le développement à l'âge adulte.

AUSSI - vous devez appliquer un code de contraste à vos prédicteurs catégoriels si vous avez un quelconque intérêt à interpréter les directions d'effet, etc. de différentes temp/localités.