Je veux regrouper un grand échantillon de données et pour cela j'utilise k signifie fonction dans MATLAB. Le problème est qu'il retourne une matrice avec toutes les données triées dans le nombre de clusters que je spécifie.Choix du nombre de clusters dans k signifie
Comment puis-je connaître le nombre de clusters optimal?
Je pensais que si j'obtenais le nombre égal d'éléments dans chaque cluster qui serait optimal mais cela n'arrive jamais. Au contraire, il peut continuer à regrouper les données pour n'importe quel nombre que je mets.
S'il vous plaît aider ...
@ user506710: Regardez http://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set pour avoir quelques idées. – zellus