Aidez-moi à résoudre ce problème:Classement des meilleurs groupes de données en fonction des regroupements observés dans le passé
Je veux trouver un moyen de regrouper ces animaux. Disons que tous les jours vous observez un groupe d'animaux qui traînent comme des amis. Vous voulez déterminer la meilleure façon de regrouper les animaux en fonction de ceux qu'ils préfèrent.
Pour illustrer, vous observez:
Aujourd'hui, vous avez vu ces animaux se détendre ensemble: {Elephant Tiger girafe Peacock}
Le lendemain vous avez vu ces: {girafe Peacock Elephant Lion Singe}
et puis le lendemain: vous {Elephant Tiger Hyène Rhino}
donc de cela pourrait conclure que l'éléphant et e Tiger sont de bons amis parce qu'ils ont passé deux occasions différentes. Vous diriez la même chose pour le paon et l'éléphant.
Quel serait un algorithme pour déterminer la meilleure façon de regrouper ces animaux?
Pour donner un peu plus de détails, je travaille sur un gros problème de type de données et j'essaie de classer ce problème.
L'apprentissage automatique peut-il résoudre ce problème?
Les données réelles pourraient ressembler à ceci:
{A B F G R P K U J H} {A F G K B J H A S} et des millions de lignes de ce ...
me pointant dans la bonne direction serait utile aussi.
C'est une réponse géniale! –
Merci beaucoup pour la réponse détaillée. J'ai été en mesure d'utiliser votre réponse comme référence pour implémenter une solution dans R. Pour tous ceux qui s'intéressent à ce problème, lisez l'algorithme Apriori. – kmd12
Génial, et heureux que vous ayez trouvé du travail sur ce problème. Je n'ai pas réussi à trouver les bons mots clés. On dirait que cela s'appelle "set mining"/"extraction de règle d'association". Essayer de chercher le premier vous donnera juste un tas de résultats de poker si :) – Imran