J'ai créé un cluster hiérarchique pour un projet. J'ai 300 observations chacune de 20 variables. J'ai indexé toutes les variables de sorte que chaque variable soit comprise entre 0 et 1, une plus grande valeur étant meilleure.Comment modifier les libellés de noeud d'un diagramme de dendrogramme
J'ai utilisé le code suivant pour créer un graphe de grappe.
d_data <- dist(all_data[,-1])
d_data_ind <- dist(data_ind[,-1])
hc_data_ind <- hclust(d_data_ind, method = "complete")
dend<- as.dendrogram(hc_data_ind)
plot(dend)
Maintenant, les étiquettes des nœuds sont dans les noms de ligne, les numéros 1 à 300 (voir l'image du haut). Au cours de l'analyse, j'ai enlevé la première colonne du bloc de données qui est étiqueté «géographie» (voir photo du bas), parce qu'ils étaient des noms de villes dans le texte et bousiller l'analyse. Mais vraiment besoin d'obtenir les noms de villes sur la parcelle de cluster dans leurs bons endroits, car je dois choisir une liste de villes en fonction des résultats.
Quel code dois-je écrire pour insérer les noms de villes dans la colonne "geography" dans ce tracé, correspondant à leurs noms de lignes?
Comme vous pouvez le voir dans le cadre de données (image du bas), tous les noms de villes sont classés par ordre alphabétique, dans l'ordre croissant, tout comme les noms des lignes. Je suis sûr qu'il n'est pas difficile de mettre les noms de la ville sur l'intrigue, je ne peux pas le trouver en faisant des recherches sur Google.
S'il vous plaît se habituer à fournir le code reproductible, prêt à copier-coller terme, pour le rendre plus facile pour les visiteurs et lecteurs. (Par exemple 'all_data' n'est pas donné, les captures d'écran des ensembles de données ne sont pas utiles, fournissant le résultat de' dput (my_data) 'est le chemin à parcourir.) – lukeA
merci pour le conseil, je vais pratiquer dans le futur – Elan
[Pourquoi pas améliorer votre question maintenant] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)? – Jaap