2017-06-29 2 views
2

J'ai quelques données et aussi la matrice de distance par paires de ces points de données. Je veux les regrouper en utilisant le clustering agglomératif. Je lis que dans sklearn, nous pouvons avoir «précalculé» comme affinité et je suppose que c'est la matrice de distance. Mais je n'ai trouvé aucun exemple utilisant une affinité précalculée et une matrice de distance personnalisée. Toute aide sera appréciée. Appelons votre matrice de distance Dagglomération agglomérative dans sklearn

Répondre

2

agg = AgglomerativeClustering(n_clusters=5, affinity='precomputed') 
agg.fit_predict(D) # Returns class labels. 

Si vous êtes intéressé à générer l'ensemble de la hiérarchie et la production d'un dendrogramme, API de scikit-learn enveloppe le scipy hierarchical clustering code. Il suffit d'utiliser le code scipy directement.

+0

Merci beaucoup. Ça m'a aidé. –

+1

Si cela répond à votre question, je vous encourage à marquer la bonne réponse en cochant la case correspondante. Cela profite à vous, à moi et aux gens qui ont le même problème plus tard. Sinon, qu'est-ce qui peut être clarifié? –