Je voudrais des informations sur les algorithmes qui peuvent aider à identifier la communalité et les différences entre les ensembles de données qui se chevauchent.Quels algorithmes comptent les fréquences des éléments communs dans une collection d'ensembles?
En utilisant le système de tag stackoverflow comme exemple:
Disons que cette question a été donnée 5 tags. Disons qu'il y a 1000 autres questions qui ont au moins un de ces tags. Parmi ces 1000 questions, combien de ces questions ont des étiquettes communes que mon article original n'a pas?
Une autre façon plus simple de décrire c'est un système automatique de suggestion de marquage:.
« vous a tagué votre question [5 balises I sélectionnées] des questions autres similiar ont été étiquetés avec [liste des balises qui pourraient être de intérêts]. où la liste [des balises qui pourraient intéresser] sont souvent INTERVENUES balises qui ne sont pas dans ma liste orginal.
exemples de code en C# si possible :)