Comme le titre dit tout, Voici le lien vers la classification spectrale Spectral clustering DocumentationDans la classification spectrale de cornac, quelle devrait être la valeur de l'élément diagonale matrice d'affinité
La première étape, il est d'extraire la matrice de similarité pour nos points de données . Quand il dit matrice de similarité, je suppose que la similarité entre les mêmes entités (utilisateurs, documents, etc.) devrait être 1 (par opposition à la matrice de distance, où il est 0).
Mais dans leur exemple, ils ont attribué un score à 0 pour les mêmes entités:
0 0,0
1,1 0
Ici, je suis un peu confus. Est-ce que quelqu'un, qui a travaillé sur le clustering spectral avant de m'aider à sortir ..
P.S .: J'ai ma propre approche pour calculer les scores de similarité, donc je ne veux pas utiliser dans les fonctions de mahout construit.
Merci à l'avance ..
Tenez compte * pas * à l'aide Mahout. Je n'ai pas beaucoup confiance dans cet outil, en particulier il semble vraiment très lent. Après avoir été capable de battre le runtime Mahout sur un seul processeur avec un meilleur outil, j'ai presque abandonné Mahout. Ce n'est pas parce qu'il fonctionne sur Hadoop que c'est bon ou rapide. –
(Mais à part ça, je crois que vous avez raison, et la valeur devrait être 1, ou tout ce que le noyau cède.Si il est artificiellement mis à 0, il ne devrait pas faire partie de la sortie.) –
Thanks Anony- Moousse. En fait, tester le clustering spectral, avec différentes valeurs de graines. Mettre à jour le fil, une fois terminé –