Est-ce que les Kmeans totaux dans la somme des carrés peuvent augmenter avec le nombre de groupes?

Je constate une augmentation du total dans la somme des carrés lorsque j'utilise le code ci-dessous. Est-ce possible ou je fais une erreur dans le code?Est-ce que les Kmeans totaux dans la somme des carrés peuvent augmenter avec le nombre de groupes?

v<-foreach(i = 1:30,.combine = c) %dopar% { 
    iter <- kmeans (clustering_data,centers = i,iter.max = 1000) 
    iter$tot.withinss 
}

Source

2017-08-03 user3736494

K-means est un algorithme randomisé. Cela ne garantit pas de trouver l'optimum.

Donc, vous avez simplement eu un mauvais hasard.

Source

2017-08-06 13:37:45

Oui. Voir la réponse d'Anony-Mousse.

Si vous utilisiez l'argument nstart = 25 de la fonction kmeans(), vous exécuteriez l'algorithme 25 fois, laissez R collecter les mesures d'erreur de chaque exécution et générer des moyennes en interne. De cette façon, vous n'avez pas besoin de construire une boucle foreach.

de la documentation de R kmeans()

## random starts do help here with too many clusters 
## (and are often recommended anyway!): 
(cl <- kmeans(x, 5, nstart = 25))

Vous devez choisir une valeur raisonnable pour nstart. Ensuite, les erreurs par différentes initialisations aléatoires sont plus susceptibles d'être moyennées. (Mais il n'y a aucune garantie que tot.withinss soit minime après nstart runs.)

Source

2017-08-07 09:09:18 knb

Est-ce que les Kmeans totaux dans la somme des carrés peuvent augmenter avec le nombre de groupes?

Répondre

Questions connexes