Je dois regrouper ma population en 8 clusters
. J'utilise proc fastclus
et la méthode k-means
(pour minimiser la variance entre les clusters). Les observations représentent un score, il est donc important que même après le processus de clustering, elles restent ordonnées. J'ai remarqué que de cette façon:Cluster K-means avec proc fastclus (SAS) maintenant les observations ordonnées
proc sort data=input.population;
by score;
run;
proc fastclus data = input.population
maxclusters = 8 list
out = score_clus
converge = 0.01 maxiter = 100
least = 2 noprint;
var score;
run;
la procédure n'a pas maintenu l'ordre. Il y a un moyen (peut-être un paramètre du proc) que je peux utiliser pour mettre une autre liaison: minimiser la variance, mais maintenir le score ordonné à l'intérieur du cluster.