-1

J'ai plusieurs seaux. Chaque compartiment contient de nombreux tags (chaînes). Comment puis-je regrouper des compartiments en fonction de la similarité ou du chevauchement?Comment puis-je regrouper des ensembles de chaînes?

E.g.

Bucket A: 'autruche', 'moineau', 'oiseau-mouche', 'zèbre', 'geai bleu'

Bucket B: 'banane', 'pastèque', 'raisin', 'carotte'

seau C: 'céleri', 'laitue', 'les épinards', 'banane', 'carotte'

seau D: 'moineau', 'chien', 'chat', 'lion', « éléphant ',' cheval '

Dans ce très, très petit exemple, B + C ferait une grappe (à cause de la banane & carotte) tandis que A et D b e dans leur propre cluster car il n'y en a pas assez pour les regrouper.

Répondre

1

Vous pouvez utiliser des distances basées sur des ensembles telles que Jaccard avec la classification hiérarchique.