2013-08-29 2 views
1

Je voudrais comparer le comportement de plusieurs mesures de dissimilarité (c'est-à-dire Bray-Curtis, Jaccard, Gower). Je l'ai vu cela à l'aide d'un composant principal biplot (à savoir voir et Caceres Legendre, 2013 ci-dessous):Comparaison des mesures de dissimilarité en utilisant PCA dans R

enter image description here

Toute suggestion comment on va à ce sujet? Exemple de données fournies ci-dessous:

# Load the required packages 
library(ade4) 
library(vegan) 
library(FD) 

#Load data 
data(dune) 

# Calculate a series of dissimilarity measures for the data 
dune.bc <- vegdist(dune, method="bray") 
dune.mh <- vegdist(dune, method="manhattan") 
dune.eu <- vegdist(dune, method="euclidean") 
dune.cn <- vegdist(dune, method="canberra") 
dune.k <- vegdist(dune, method="kulczynski") 
dune.j <- vegdist(dune, method="jaccard") 
dune.g <- vegdist(dune, method="gower") 
dune.m <- vegdist(dune, method="morisita") 
dune.h <- vegdist(dune, method="horn") 
dune.mf <- vegdist(dune, method="mountford") 
dune.r <- vegdist(dune, method="raup") 
dune.bi <- vegdist(dune, method="binomial") 
dune.c <- vegdist(dune, method="chao") 

#Compare the behaviour of the dissimilarity measures using a PCA plot 
# Suggestions on how proceed with this step would be greatly appreciated! 

Répondre

0

Hmm, ce n'est pas ce que font les auteurs. Si vous lire ce papier, le biplot PCA est l'un de la matrice des propriétés de chaque coefficient de dissimilarité, pas une PCA de sur k des matrices de dissimilarité. Fondamentalement, ils ont analysé le tableau 2 dans le document via PCA (moins la colonne à l'extrême droite, étiqueté * D * max).

Je ne sais pas moyen de comparer les matrices de dissemblance, autrement que par une rotation Procuste et test de permutation de PROTESTATION associé, ou un test de Mantel, peut-être: voir procrustes(), protest() et mantel()

Vous pouvez consulter le rankindex() des coefficients avec les valeurs de gradient comme une autre comparaison.

+0

Merci pour votre réponse. Oui, je suis conscient que la PCA est basée sur une matrice 1-0 des propriétés de dissimilarité, j'utilisais juste leur graphique comme exemple de ce que je voudrais illustrer le comportement différent des mesures de dissimilarité. Je vais explorer vos suggestions et poster une réponse si elles mènent à une solution. Merci. – Elizabeth

+0

@Elizabeth Pensez ensuite à la façon dont ils structurent leurs données, chaque colonne dans les données d'entrée est variable et décrit une propriété du coefficient de dissimilarité. Vous avez calculé plusieurs matrices de dissimilarité et vous n'avez donc que des données relatives à la dissimilarité par paire. Les auteurs ont 1 matrice de données, vous avez * n * matrices de dissimilarité. Ces deux ne vont jamais à la maille. Quels sont vos critères pour juger ou comparer les coefficients de dissimilarité? Il semble que vous êtes intéressé par qui mappe vos données * mieux *? Et c'est très différent de ce que le document que vous citez. –

+0

Je comprends votre point de vue. Ce que j'essaie finalement de montrer, c'est la similitude des indices de similarité en termes de résultats qu'ils produisent (clustering, PCA ou autre) pour un ensemble de données donné. Je voudrais un moyen de montrer cela graphiquement. Bien sûr, je pourrais montrer une série de résultats de clustering ou de PCA, un pour chaque mesure de similarité, mais ce que je cherche est un moyen de comparer directement les différences dans les résultats qu'ils produisent. – Elizabeth

0

Il semble que ce que vous essayez de faire soit une analyse de deuxième étape?

Prenez plusieurs matrices de dissimilarité, générez des corrélations de rang par paire entre toutes ces matrices et cela grimpe à des matrices de dissimilarité de vos matrices de dissimilarité. De là, vous pouvez utiliser NMDS pour les tracer tous. En général, vous constaterez que des calculs similaires (famille eucleadienne, famille bray-curtis, ect.) Sont étroitement liés.

Extraction: Exploration des interactions par analyses communautaires de deuxième étape. (2006) clarke, Somerfield, Airoldi et warwick

Ici, ils font ce que vous proposez, ou si vous voulez: sur des mesures de ressemblance pour les études écologiques, y compris dissemblances taxonomiques et un coefficient de Bray-Curtis ajusté Zer-pour les assemblages dénudés. (2006) Clarke, Somerfield et Chapman.