0

I ont un ensemble de données de Nnoeuds et Kcentres de distribution. Si je connais leurs pays respectifs (x, y) coordonnéesClustering avec N noeuds et des centres de distribution K

Quel algorithme puis-je utiliser pour regrouper ces nœuds en gardant l'équilibre entre la distance nœud central et le nombre de noeuds affectés aux centres ?

Par exemple, je pourrais utiliser comme critères, attribuer les noeuds à leur centre le plus proche de la distribution, mais cela pourrait produire des centres de distribution avec de nombreux nœuds, et je veux éviter cela. De l'aide? Formuler cela comme un problème d'optimisation.

+3

Peut être écrit en tant que MIP (problème de programmation en nombre mixte). Quelque chose comme un problème d'affectation, –

+2

Combien plus important est-il que les nœuds soient bien distribués par rapport à leur "entrepôt"? Considérons un exemple inventé avec 2 entrepôts, et N-1 nœuds sont proches de l'entrepôt A, et seulement 1 nœud proche de B. Quand est-ce que nous connectons les nœuds à B? –

+0

Tu as raison Erwin, c'était la première technique et ça fonctionnait très bien mais j'expérimente des méthodes plus rapides en sacrifiant la meilleure réponse, pour cette raison, un MIP n'est plus une option pour moi. Merci pour votre suggestion – jonango

Répondre

1

E.g. distance moyenne, et un facteur de pénalité lorsque trop de N sont affectés au même K.

Ensuite, utilisez une technique d'optimisation standard pour trouver une solution.

Ne vous attendez pas à quelque chose de prêt à l'emploi pour supporter des contraintes vagues comme la vôtre. Vous devez décider quelle est la bonne solution, puis avoir une recherche d'optimiseur une bonne solution.