0

Je teste l'algorithme Birch clustering implémenté dans Scikit Learn. Je suis un peu confus au sujet d'une déclaration dans le manuel; en ce qui concerne le paramètre n_clusters, il indiquePrésentation des paramètres du clustering Birch dans Scikit Learn

n_clusters : int, instance of sklearn.cluster model, default None 

D'autre part, la description initiale de l'algorithme est le suivant:

classe sklearn.cluster.Birch (seuil = 0,5, branching_factor = 50, n_clusters = 3, compute_labels = True, copie = True)

je prendrais cela pour dire que n_clusters est par défaut à , pas Aucun. C'est aussi ce qu'il semble faire quand je l'exécute.

Ai-je mal lu ceci d'une certaine façon? Quelle est la logique derrière cela?

(je suppose que cela ne permet pas que je ne suis pas 100% sûr de ce que ce paramètre ne fait, je l'ai compris d'appliquer une sorte de bien-regroupement supplémentaire au résultat de la méthode Birch.)

Tous l'aide est très appréciée!

+0

Oh non! Un bug de documentation !!! Nous sommes condamnés, nous devons demander des sites au hasard sur l'interwebz sur ce qu'il faut faire maintenant !!! Mon ordinateur va exploser maintenant. –

Répondre

0

Oui, vous avez raison. La valeur par défaut doit être 3 au lieu de None.

Lorsque n_clusters = integer, l'ajustement du modèle devient Agglomerative Clustering dont n_clusters est réglé sur la valeur de cette integer.

Lorsque n_clusters = None, l'étape de regroupement supplémentaire n'est pas effectuée et les sous-clusters sont renvoyés comme ils l'étaient auparavant.

See #6635 github issue

+1

merci! content que ce ne soit pas juste que je sois bête ... – patrick