Je voudrais comparer le comportement de plusieurs mesures de dissimilarité (c'est-à-dire Bray-Curtis, Jaccard, Gower). Je l'ai vu cela à l'aide d'un composant principal biplot (à savoir voir et Caceres Legendre, 2013 ci-dessous):Comparaison des mesures de dissimilarité en utilisant PCA dans R
Toute suggestion comment on va à ce sujet? Exemple de données fournies ci-dessous:
# Load the required packages
library(ade4)
library(vegan)
library(FD)
#Load data
data(dune)
# Calculate a series of dissimilarity measures for the data
dune.bc <- vegdist(dune, method="bray")
dune.mh <- vegdist(dune, method="manhattan")
dune.eu <- vegdist(dune, method="euclidean")
dune.cn <- vegdist(dune, method="canberra")
dune.k <- vegdist(dune, method="kulczynski")
dune.j <- vegdist(dune, method="jaccard")
dune.g <- vegdist(dune, method="gower")
dune.m <- vegdist(dune, method="morisita")
dune.h <- vegdist(dune, method="horn")
dune.mf <- vegdist(dune, method="mountford")
dune.r <- vegdist(dune, method="raup")
dune.bi <- vegdist(dune, method="binomial")
dune.c <- vegdist(dune, method="chao")
#Compare the behaviour of the dissimilarity measures using a PCA plot
# Suggestions on how proceed with this step would be greatly appreciated!
Merci pour votre réponse. Oui, je suis conscient que la PCA est basée sur une matrice 1-0 des propriétés de dissimilarité, j'utilisais juste leur graphique comme exemple de ce que je voudrais illustrer le comportement différent des mesures de dissimilarité. Je vais explorer vos suggestions et poster une réponse si elles mènent à une solution. Merci. – Elizabeth
@Elizabeth Pensez ensuite à la façon dont ils structurent leurs données, chaque colonne dans les données d'entrée est variable et décrit une propriété du coefficient de dissimilarité. Vous avez calculé plusieurs matrices de dissimilarité et vous n'avez donc que des données relatives à la dissimilarité par paire. Les auteurs ont 1 matrice de données, vous avez * n * matrices de dissimilarité. Ces deux ne vont jamais à la maille. Quels sont vos critères pour juger ou comparer les coefficients de dissimilarité? Il semble que vous êtes intéressé par qui mappe vos données * mieux *? Et c'est très différent de ce que le document que vous citez. –
Je comprends votre point de vue. Ce que j'essaie finalement de montrer, c'est la similitude des indices de similarité en termes de résultats qu'ils produisent (clustering, PCA ou autre) pour un ensemble de données donné. Je voudrais un moyen de montrer cela graphiquement. Bien sûr, je pourrais montrer une série de résultats de clustering ou de PCA, un pour chaque mesure de similarité, mais ce que je cherche est un moyen de comparer directement les différences dans les résultats qu'ils produisent. – Elizabeth