2017-06-16 3 views
1

Dans la bibliothèque spark.mllib, KMeans a pour fonction de définir le paramètre epsilon lors de la construction de l'instance de Kmeans.Comment configurer epsilon dans K-Means dans la nouvelle bibliothèque Spark ml

Mais je n'ai vu aucune fonction dans la nouvelle bibliothèque Spark.ml de Kmeans pour configurer ce paramètre. La raison que je demande est parce que le nombre de cluster que les nouveaux KMeans génèrent est inférieur à ce que j'ai spécifié dans la méthode setK(), donc je veux augmenter le nombre de clusters générés en diminuant epsilon un peu.

Est-ce que quelqu'un sait comment installer epsilon dans la nouvelle classe Spark.ml Kmeans?

org.apache.spark.ml.clustering.KMeans

Merci.

Répondre

1

Epsilon dans la bibliothèque spark.ml a été renommé tol (abréviation de tolérance)

Exemple:

KMeans kmeans = new KMeans().setK(2).setSeed(1L).setTol(0.0001) 
KMeansModel model = kmeans.fit(dataset);