1

J'ai des données dans le format suivant:Utilisation de Weka pour la classification non supervisée

X,Y,sim(X,Y) 

C'est une liste de triplets, avec:

  • X, le nom d'un objet;
  • Y, le nom d'un autre objet;
  • sim (X, Y), un nombre réel exprimant la distance entre les deux objets.

Maintenant, je veux appliquer un algorithme de clustering non supervisé sur ces données. Je pensais à Weka mais je serais ravi d'envisager des alternatives.

+0

Pourquoi le downvote? – Pierre

Répondre

1

Il y a beaucoup d'algorithmes qui peuvent travailler avec des matrices de similarité:

  • Lien Hiérarchique
  • dbscan
  • OPTIQUES
  • affinité propagation
  • spectral clustering

juste pour n'en nommer que quelques-uns. En ce qui concerne les logiciels, je préfère ELKI, il a beaucoup plus de choix de clustering.

Questions connexes