2

Quelqu'un peut-il expliquer s'il y a un avantage à utiliser la classification hiérarchique par rapport à la mise en grappe spectrale? Je sais comment ils fonctionnent, mais je veux savoir dans quelles situations il est préférable d'utiliser la classification hiérarchique sur le clustering spectral.Mise en grappe spectrale vs mise en grappe hiérarchique

Répondre

2

Clustering hiérarchique:

  • Il est bon pour les données taxinomiques.
  • Continuez à connecter des points similaires jusqu'à ce que vous finissiez avec un seul cluster contenant tous les points de données.
  • À partir du regroupement obtenu après la combinaison de toutes les données, on parle de dendrogramme.
  • Selon le nombre de clusters souhaité, vous coupez le dendrogramme à un niveau.

Clustering spectral:

  • Il est pour les données de regroupement qui est en forme complexe comme K-means et le regroupement à base de densité échouent dans ces cas.
  • Pour traiter les points de données en tant que sommets d'un graphique, connectez les sommets qui sont suffisamment proches. Par conséquent, vous choisissez également une valeur ε. Tous les sommets plus proches de ε sont connectés. Contrairement à la classification hiérarchique, vous ne disposez pas d'un graphe unique entièrement connecté (sauf si vous prenez une valeur ε élevée et qu'il n'y a pas de composants non connectés). Au lieu de cela, vous obtenez plusieurs composants connectés, chacun représentant un cluster.
2

La classification hiérarchique est généralement plus rapide et produit un joli dendrogramme à étudier. Les dendrogrammes sont très utiles pour comprendre si vous avez un bon clustering.

En outre, la classification hiérarchique est très flexible. Vous pouvez utiliser différentes fonctions de distance et différentes stratégies de liaison.

Le regroupement spectral a une théorie intéressante; mais pour bien fonctionner, vos données doivent déjà être constituées de «composants connectés» bien séparés. Lorsque vous avez des données très bruyantes, bonne chance.