2017-05-21 3 views
-1

Je veux exécuter le PAM afin de grouper une matrice de données.Choisissez la bonne valeur de "K" dans PAM

Mais maintenant je n'ai pas compris comment choisir de la bonne façon la valeur "K".

Ce qui devrait être le nombre maximal de clusters.

Enfin, est-il correct que je dois faire le PAM avant le ClusGap?

Merci!

Répondre

0

Avec ces heuristiques (ils peuvent ne pas choisir le vrai meilleur k) que vous le feriez habituellement

  1. Exécutez l'algorithme de classification (k-means, PAM) à plusieurs reprises pour chaque k jusqu'à un maximum.
  2. Pour chaque k, vous gardez le meilleur par SSQ (pour k-means) ou TD (PAM).
  3. Ensuite, vous calculez vos statistiques de heuristiques pour chaque résultat
  4. Tracer la courbe de la statistique
  5. Selon l'heuristique, choisissez le genou/coude/minimum/maximum. Comparer le meilleur au deuxième meilleur, si elles sont très similaires, l'algorithme de clusterage n'a probablement pas fonctionné au et vous devrez peut-être modifier le prétraitement, ou essayer d'autres algorithmes.