I ont un grand ensemble de données avec l'utilisateur BINARY/éléments Matrice:données binaires Cluster
- J'ai besoin de regrouper les utilisateurs et les éléments. Est-il possible de les faire simultanément dans Mahout? Plus important encore, si j'utilise loglikelihood comme mesure de similarité, quels sont les algorithmes de clustering qui prendront en charge cette métrique de distance pour regrouper les données?
Merci Sean, Pourriez-vous s'il vous plaît être plus précis sur les parties agglomératives de Mahout. Je suis dans la phase de conception et j'ai besoin de savoir si j'ai la matrice de similarité, ce qui serait un bon algorithme de clustering à utiliser en fonction de cette mesure pour regrouper les données. – user1848018
Je pense à 'TreeClusteringRecommender', qui est un code ancien et non distribué que j'ai fait, et pas quelque chose que je recommanderais particulièrement à quiconque. Mais comme ce n'est pas basé sur le centroïde, vous avez seulement besoin d'une métrique de similarité. En général, la réponse à votre problème est «k-medoids». –
Merci Sean, j'apprécie – user1848018