2013-08-22 3 views
2

J'ai le code suivant qui effectue la classification hiérarchique et trace eux dans heatmap.Interprétation du résultat de 'cutree' à partir de hclust/heatmap.2

set.seed(538) 
# generate data 
y <- matrix(rnorm(50), 10, 5, dimnames=list(paste("g", 1:10, sep=""), 
paste("t", 1:5, sep=""))) 
# the actual data is much larger that the above 

# perform hiearchical clustering and plot heatmap 
test <- heatmap.2(y) 

Ce que je veux faire est d'imprimer le membre du cluster de chaque hiérarchie de la parcelle. Je ne suis pas sûr de savoir quelle est la bonne façon de le faire.

J'ai essayé ceci:

cutree(as.hclust(test$rowDendrogram), 1:dim(y)[1]) 

Mais ayant problème dans l'interprétation du résultat. Quelle est la signification de chaque valeur dans la matrice? Par exemple g9-9 = 8. Que veut dire 8 ici?

1 2 3 4 5 6 7 8 9 10 
g1 1 1 1 1 1 1 1 1 1 1 
g2 1 2 2 2 2 2 2 2 2 2 
g3 1 2 2 3 3 3 3 3 3 3 
g4 1 2 2 2 2 2 2 2 2 4 
g5 1 1 1 1 1 1 1 4 4 5 
g6 1 2 3 4 4 4 4 5 5 6 
g7 1 2 2 2 2 5 5 6 6 7 
g8 1 2 3 4 5 6 6 7 7 8 
g9 1 2 3 4 4 4 7 8 8 9 
g10 1 2 3 4 5 6 6 7 9 10 

Vos conseils avisés seront grandement appréciés.

Répondre

4

La colonne j vous indique comment grouper vos g s si vous vouliez exactement j groupes.

Les colonnes 1 et 10 ne sont pas très utiles, mais peut-être que la colonne 2 est un bon exemple. Il vous dit que si vous vouliez exactement deux groupes, ils seraient:

group1: {g1, g5} 
group2: {g2, g3, g4, g6, g7, g8, g9, g10} 
Questions connexes