J'ai quelques données et aussi la matrice de distance par paires de ces points de données. Je veux les regrouper en utilisant le clustering agglomératif. Je lis que dans sklearn, nous pouvons avoir «précalculé» comme affinité et je suppose que c'est la matrice de distance. Mais je n'ai trouvé aucun exemple utilisant une affinité précalculée et une matrice de distance personnalisée. Toute aide sera appréciée. Appelons votre matrice de distance D
agglomération agglomérative dans sklearn
2
A
Répondre
2
agg = AgglomerativeClustering(n_clusters=5, affinity='precomputed')
agg.fit_predict(D) # Returns class labels.
Si vous êtes intéressé à générer l'ensemble de la hiérarchie et la production d'un dendrogramme, API de scikit-learn
enveloppe le scipy
hierarchical clustering code. Il suffit d'utiliser le code scipy
directement.
Merci beaucoup. Ça m'a aidé. –
Si cela répond à votre question, je vous encourage à marquer la bonne réponse en cochant la case correspondante. Cela profite à vous, à moi et aux gens qui ont le même problème plus tard. Sinon, qu'est-ce qui peut être clarifié? –