2017-10-04 5 views
0

Dans l'analyse d'ordination contraint, comme CAP ou dbRDA, les chercheurs veulent souvent savoir quelle part de la dissimilarité est attribuée à des espèces spécifiques. En Primer PERMANOVA, Spearman rank ou Pearson correlations d'espèces à l'axe est une option à celle fournit une estimation des espèces qui caractérisent la variation entre les assemblages d'espèces lors de l'utilisation CAP ou RDA. Dans R, vegan fournit une mesure différente, connue sous le nom de scores d'espèces, qui peut être calculée mais non sans un examen attentif des lacunes potentielleshttps://github.com/vegandevs/vegan/issues/254#issuecomment-334071917. et vegan dbrda species scores are empty despite community matrix provided, lors de l'utilisation de capscale.Quelle est la différence entre les scores des espèces végétaliennes R et la corrélation des rangs Primer Spearman des espèces à l'axe?

Je voudrais mieux comprendre comment les corrélations et les scores d'espèces sont calculés en Primer PERMANOVA. Premièrement, y a-t-il une réelle différence dans ce que ces méthodes visent à montrer? Quels sont les avantages et les inconvénients de l'utilisation Spearman ou Pearson correlations sur les scores d'espèces de R- vegan? Est-ce que la méthode de calcul des corrélations d'espèce à axe dans Primer souffre de problèmes similaires à ceux détaillés dans les liens ci-dessus pour les scores d'espèce dans capscale ou dbrda dans R? Dans Primer, quelles sont les variables utilisées à partir de la matrice et de l'axe de la communauté pour calculer les corrélations entre elles? S'agit-il de données brutes ou transformées? Et enfin, si la méthode de corrélation est une meilleure estimation de la quantité relative par laquelle les espèces causent des différences entre les assemblages que les scores des espèces dans R, cela devrait-il être considéré comme une alternative aux scores des espèces végétaliennes?

+1

** Si vous n'obtenez pas de réponse ici après un délai raisonnable, vous pouvez essayer de poster (avec un lien vers cette question) à r-sig-ecology @ r-project.org' ... –

+0

Je voudrais commenter, mais écrire la réponse prend beaucoup de temps ... Cela nécessite un long commentaire. –

+0

Des commentaires récents sur https://github.com/vegandevs/vegan/issues/254 Je comprends qu'il y a des pièges potentiels et des complications sérieuses concernant l'utilisation de corrélations d'axe d'espèce - d'où la raison pour laquelle cela n'est pas utilisé dans R végétalien. Il semble que les corrélations d'ordres de rang souffrent des mêmes complications imposées par la distance non euclidienne dans l'espace d'ordination, comme détaillé https://stackoverflow.com/questions/46531969/vegan-dbrda-species-scores-are-empty-despite- matrice communautaire fournie pour les scores des espèces végétaliennes «dbrda». Dans l'attente des commentaires des utilisateurs de PRIMER sur les corrélations. –

Répondre

1

Je ne l'ai jamais vu PRIMER et je ne peux pas commenter sur les différences entre végétalien et PRIMER, mais je peux vous expliquer comment nous travaillons dans végétalien.

Si vous pensez aux scores d'espèces de variables environnementales ajustées comme des flèches, il y a deux aspects distincts: la direction et la longueur. D'abord sur la direction de la flèche.

En général, les flèches ne sont pas parallèles aux axes, mais elles pointent vers la direction à laquelle l'espèce ou la variable environnementale change le plus rapidement. Les directions des flèches peuvent être trouvées à partir du modèle linéaire lm(y ~ Ax1 + Ax2). Si y est une espèce, cela donne la flèche pour le score de l'espèce, et si y est une variable environnementale, ceci donne un vecteur ajusté. Corréler des espèces avec des axes implique deux modèles distincts lm(y ~ Ax1) et lm(y ~ Ax2). Le modèle végétalien définit une surface de tendance linéaire et le modèle d'axe définit deux surfaces de tendance linéaires distinctes avec chacune un gradient le plus raide le long d'un axe. L'exemple suivant montre comment le modèle linéaire lié aux scores des espèces en PCA dans végétalien:

library(vegan) 
data(varespec) 
pc <- rda(varespec) 
biplot(pc) # species scores as biplot arrows 
plot(envfit(pc ~ Pleuschr + Cladarbu + Cladrang + Cladstel, varespec)) 
ordisurf(pc ~ Cladstel, varespec, knots = 1, add = TRUE) 

La fonction envfit ajoute des flèches qui pointent vers la même direction que les scores des espèces et ordisurf ajoute surface de tendance linéaire (knots = 1) à Cladstel. Les isoclines de la surface de tendance linéaire sont équidistantes et perpendiculaires à la flèche. La projection des unités d'échantillonnage à la flèche donne l'abondance prédite de l'espèce dans cette solution bidimensionnelle.L'interprétation des scores d'espèces est similaire dans RDA, mais là vous devez vous rappeler d'utiliser des scores de combinaison linéaire (display="lc"), et dans CCA vous devez vous rappeler d'utiliser la régression pondérée (envfit et ordisurf prendre soin de cela automatiquement, mais avec lm ou autre non - végétalien outils dont vous avez besoin de poids explicites).

Cette approche n'est pas facilement modifiée pour utiliser des corrélations de rang. Pour les rangs, vous devez projeter des points (unités d'échantillonnage) sur une séquence univariée. Souvent, les gens projettent sur des axes (c'est-à-dire qu'ils corrèlent des axes avec des espèces). Cependant, une meilleure corrélation sera trouvée si nous trouvons une ligne traversant l'origine qui donne la meilleure corrélation de rang lorsque des unités d'échantillonnage sont projetées dessus pour des rangs (si une ligne unique, ou un secteur contenant des lignes, existe). Ce serait similaire à notre approche de trouver la direction du changement le plus raide dans la surface de la tendance linéaire. Ceci est facilement fait avec l'espace euclidien, comme tous les espaces d'ordination sont, mais pas avec des rangs de projections.

L'hypothèse de surface de tendance linéaire est assez simpliste. C'est le modèle pour les espèces dans PCA et RDA, et c'est le modèle pour les contraintes dans RDA et là il montre comment l'analyse voit vos données (rappelez-vous les scores "lc"!). Cependant, avec d'autres variables et avec d'autres méthodes d'ordination, des modèles de réponse plus complexes sont souvent plus adéquats. Ceux-ci peuvent être ajustés [ted] en utilisant ordisurf avec knots> 1.

Puis sur les longueurs des flèches, ou les distances des scores d'espèces à partir de l'origine. La fonction envfit() trouve la direction correcte, mais elle met à l'échelle la longueur de la flèche par le coefficient de corrélation. En PCA et RDA, nous avons plusieurs options de mise à l'échelle alternatives: voir la description longue de scaling et correlation en ?scores.cca. L'échelle par défaut (correlation = FALSE) fait que les flèches sont proportionnelles au changement absolu de l'abondance des espèces. Autrement dit, les espèces abondantes peuvent changer beaucoup et peuvent avoir de longues flèches, mais les espèces rares peuvent seulement changer un peu et avoir toujours des flèches courtes. C'est un changement absolu, pas un changement relatif. Avec correlation = TRUE, les longueurs des flèches sont proportionnelles au changement relatif et seront similaires à la mise à l'échelle par les corrélations utilisées dans envfit. Encore une fois, étudiez le manuel pour plus de détails (?scores.cca).

0

S'il vous plaît voir ci-dessous une réponse très utile de Marti Anderson en réponse à un courriel relatif à cette question ci-dessus - Copié avec sa permission:

Cher Philippe,

Merci pour votre message et l'intérêt pour tous ces méthodes et leur interprétation. Je ne ferai aucun commentaire sur les choses basées sur R implémentées dans le végétalien, car Jari est le mieux à même de le faire, mais je serais heureux de commenter les vecteurs de corrélation raw (ou Perason) implémentés dans PRIMER/PERMANOVA Logiciel. Tout d'abord, permettez-moi de souligner que ceux-ci sont destinés à être un outil exploratoire. Tout simplement, tout ce qu'ils font est de montrer les corrélations brutes (ou multiples) des espèces individuelles (ou d'autres variables) avec les axes d'ordination. Deux mises en garde importantes à leur utilisation ou importantes à noter ici. Tout d'abord, ils ne vous disent absolument rien sur le rôle spécifique que certaines espèces ont pu jouer dans les schémas de conduite observés dans le dbRDA (ou nMDS ou PCO ou tout autre axe d'ordination dont vous parlez). Ils ne peuvent pas le faire parce qu'ils sont attirés après le fait et, comme nous le savons, les relations entre les variables d'espèces originales et les axes d'ordination, dans de très nombreux cas, ne devraient pas être linéaires (ou même monotones). L'ordination se fait (généralement) dans l'espace d'une mesure de dissimilarité choisie (telle que BC ou Jaccard, etc.). Ceci est approprié pour beaucoup de raisons (que je suis sûr que vous connaissez déjà et je ne vais pas aller à).Pour voir quels sont les motifs d'espèces individuelles dans un espace d'ordination contraint comme dbRDA (ou toute autre ordination), je suggère que vous utilisiez des diagrammes à bulles, qui sont un outil beaucoup plus raffiné pour visualiser les motifs. (Et d'ailleurs, dans PRIMER 7, vous pouvez superposer des parcelles de bulles segmentées pour visualiser simultanément des motifs pour un ensemble d'espèces.L'avantage des parcelles à bulles est qu'elles peuvent, pour une espèce donnée, montrer n'importe quel motif qui pourrait être se produisent, y compris les changements d'échelon entre les groupes, les interactions potentielles entre les facteurs, les modèles unimodaux ou multimodaux le long des gradients, etc. Maintenant, l'utilisation de vecteurs de corrélation de rang (ou Pearson) présente l'avantage de pouvoir tracer plusieurs espèces à la fois. , mais ils sont clairement un outil contondant par comparaison, car ils ne peuvent bien montrer que les espèces qui peuvent avoir des relations croissantes ou décroissantes avec les axes d'ordination, ce qui n'est souvent pas le cas, mais ils ont leur utilité, en particulier dans la PAC. où les axes ont été dessinés spécifiquement pour maximiser les différences de groupe Dans ce cas, les groupes sont séparés sur la parcelle, de sorte que les espèces ayant des axes plus longs dessinés comme croissant ou décroissant sur ces parcelles correspondra généralement aux espèces qui caractérisent les différences de groupe. Cependant, même dans l'exemple de la PAC, les différences de groupe sont parfois causées par des changements de composition dans des ensembles entiers d'espèces (mineures) agissant ensemble de façon multivariée et simultanée à travers la mesure de dissimilarité. ces espèces lorsqu'elles sont considérées indépendamment et individuellement.

Eh bien, j'espère que j'ai aidé à clarifier les problèmes ici un peu. Le résultat de tout ce qui précède est que ce n'est pas un problème de mettre ces vecteurs sur n'importe quel tracé d'ordination que vous pouvez choisir, mais ils sont un exercice heuristique et postérieur, plutôt qu'un outil définitif ou diagnostique dans un environnement de dissimilarité, et ils montrent seulement un certain type de relation. D'autres outils (tels que les bulles ou les parcelles à bulles segmentées) seront plus riches en informations sur les types d'espèces individuels.

J'espère que ce qui précède est utile! Cordialement, Marti Anderson