2017-07-19 5 views
0

J'ai des centaines de corrélations de populations (différentes espèces, localisations, etc.) au fil du temps. Comment puis-je analyser statistiquement toutes ces corrélations (pour leurs groupes respectifs)? J'ai des valeurs de p, des IC, des coefficients de corrélation pour chacune des 600+ corrélations, mais comment puis-je les comparer au sein de groupes (espèce, emplacement, etc.). J'ai essayé d'effectuer de grandes corrélations partielles sur le nombre de population corrélée (en pourcentage) et l'année, avec les espèces et l'emplacement (transformés en variables fictives) comme facteurs contrôlés lors de la corrélation dans Familles, et avec l'emplacement (comme variable fictive).) en tant que variable contrôlée lors de la corrélation au sein des espèces, mais je ne suis pas sûr que cela soit correct.Comparer plusieurs corrélations dans R

Voici quelques exemples de données, mais cela est une autre question logistique oppose à émettre des données réelles:

Location Species     Year Section Total Percent Family 
Chiswell A Black-legged Kittiwake 1976 Central 310 16.78397401 Gull 
Chiswell A Black-legged Kittiwake 1986 Central 982 53.16729832 Gull 
Chiswell A Black-legged Kittiwake 1989 Central 555 30.04872767 Gull 
Chiswell B Common Murre   1976 Central 150 20.6043956 Auk 
Chiswell B Common Murre   1986 Central 385 52.88461538 Auk 
Chiswell B Common Murre   1991 Central 193 26.51098901 Auk 
Natoa Is Black-legged Kittiwake 1976 Central 70 12.77372263 Gull 
Natoa Is Black-legged Kittiwake 1986 Central 168 30.65693431 Gull 
Natoa Is Black-legged Kittiwake 1989 Central 310 56.56934307 Gull 
Wooded Is Black-legged Kittiwake 1972 Central 1560 13.35159192 Gull 
Wooded Is Pelagic Cormorant  1972 Central 144 45.56962025 Cormorant 
Wooded Is Black-legged Kittiwake 1976 Central 2350 20.11297501 Gull 
Wooded Is Glaucous-winged Gull 1976 Central 150 13.83763838 Gull 
Wooded Is Horned Puffin   1976 Central 30 33.33333333 Auk 
Wooded Is Pelagic Cormorant  1976 Central 44 13.92405063 Cormorant 
Wooded Is Pigeon Guillemot  1976 Central 100 37.59398496 Auk 
Wooded Is Red-faced Cormorant  1976 Central 4 66.66666667 Cormorant 
Wooded Is Tufted Puffin   1976 Central 9600 98.21976673 Auk 
Wooded Is Black-legged Kittiwake 2000 Central 5587 47.81752824 Gull 
Wooded Is Glaucous-winged Gull 2000 Central 472 43.54243542 Gull 
Wooded Is Horned Puffin   2000 Central 30 33.33333333 Auk 
Wooded Is Pelagic Cormorant  2000 Central 64 20.25316456 Cormorant 
Wooded Is Pigeon Guillemot  2000 Central 83 31.20300752 Auk 
Wooded Is Red-faced Cormorant  2000 Central 1 16.66666667 Cormorant 
Wooded Is Tufted Puffin   2000 Central 87 0.890116636 Auk 
Wooded Is Black-legged Kittiwake 2001 Central 2187 18.71790483 Gull 
Wooded Is Glaucous-winged Gull 2001 Central 462 42.6199262 Gull 
Wooded Is Horned Puffin   2001 Central 30 33.33333333 Auk 
Wooded Is Pelagic Cormorant  2001 Central 64 20.25316456 Cormorant 
Wooded Is Pigeon Guillemot  2001 Central 83 31.20300752 Auk 
Wooded Is Red-faced Cormorant  2001 Central 1 16.66666667 Cormorant 
Wooded Is Tufted Puffin   2001 Central 87 0.890116636 Auk 

Tout conseil est apprécié, je vous remercie!

+0

Je ne suis pas sûr de ce que votre sortie souhaitée est. Peut-être un exemple de table? – pyll

+0

@pyll ma sortie désirée serait une corrélation "complète" d'une espèce au sein d'une section ou au sein d'une famille. J'ai effectué une corrélation juste avec un sous-ensemble d'espèces (p. Ex. Macareux touffeté) du pourcentage et de l'année, mais cela ne tient pas compte de l'emplacement, bien que j'aie un corcoeff, p valeur, etc. Je ne pense pas que ce soit statistiquement correct. – LearningTheMacros

Répondre

0

Ceci est hors de la portée d'une question de débordement de pile et devrait probablement être posté dans un forum plus orienté statistiquement.

Cependant, je voudrais vérifier le paquet vegan et examiner spécifiquement l'analyse de la correspondance canonique ou l'analyse des composants principaux. Les méthodes d'ordination vous permettent de réduire la dimensionnalité et d'examiner les corrélations significatives/utiles entre de nombreuses variables de regroupement.

Vegan

Mise à jour

Avec une série temporelle comme l'une des variables du modèle, il serait statistiquement correct pour déterminer s'il y a des effets liés aux collections répétées au fil du temps. Une ANOVA multi-voies peut être plus utile pour déterminer la corrélation entre variables que de trouver des groupes de points dans une méthode d'ordination.

+0

Je suis d'accord, mais il y a beaucoup plus de trafic ici dans Stack overflow par rapport aux autres forums de statistiques. J'ai déjà travaillé en Vegan avec des analyses NMDS. Je ne suis pas sûr si cela s'applique à cela cependant, je vais vérifier à nouveau. – LearningTheMacros

+0

Les NMDS sont des OMI assez limitées, mais vous pouvez utiliser une autre méthode d'ordination pour comprendre les variables de regroupement significatives. Comme autre méthode, vous pouvez toujours créer un linéaire général à partir des données de comptage avec une distribution quasi-Poisson, pour toutes les variables de regroupement et utiliser un test f pour déterminer la signification à partir de la valeur p. –

+0

J'ai essayé le GLM mais je ne pense pas que ce soit ce que je cherche. Je ne sais pas non plus si PCA ou CCA sont ce que je cherche non plus. Essentiellement, j'essaie simplement de voir si les populations ont changé au fil du temps pour des espèces de diverses populations dans une grande zone géographique, mais je ne sais pas comment faire cela en dehors de 600 corrélations, ce que j'ai fait. Je suppose que je peux juste montrer quel pourcentage de populations pour chaque espèce diminue/augmente, serait-ce statistiquement valide? Existe-t-il un moyen plus complet? – LearningTheMacros