2011-06-02 3 views

Répondre

1

Nécessaire pour calculer chaque distance entre les points et les points centraux de chaque grappe.

0

Une façon de calculer l'erreur de reconstruction à partir d'un vecteur donné est de calculer la distance euclidienne entre elle et sa représentation. Dans K-means, chaque vecteur est représenté par son centre le plus proche. Par conséquent, après avoir exécuté k signifie: Pour chaque vecteur, calculez l'erreur pour le vecteur en tant que distance euclidienne entre ce vecteur et son centroïde. Résumez les erreurs pour chaque vecteur, et vous avez l'erreur sur votre ensemble d'entraînement. Des erreurs plus faibles auront tendance à donner de meilleurs regroupements.

En effet, l'algorithme de K-Means essaye lui-même d'optimiser cette métrique, et si vous le laissez aller à la convergence, il trouvera un minimum local pour l'erreur de reconstruction de la distance euclidienne.

+0

reliant les premiers google hits ne sera pas très utile. –

+0

C'est décidément pas sans rapport. J'ai enlevé le lien et l'ai remplacé par un résumé de 2 lignes, mais maintenant je pense que ma réponse est un peu pire. –

Questions connexes