J'ai un ensemble de fichiers texte. Je veux calculer une unicité de contenu pour différents sous-ensembles.Méthodes pour le calcul de l'unicité du contenu sur C#
E.g. nous avons 10 documents (A1 - A10) et voulons calculer l'unicité pour le sous-ensemble des documents A1 et A2. Le résultat doit donc être une valeur comprise entre 0 et 1 (1 - contenu absolument unique, 0 - contenu absolument dupliqué).
Quelles méthodes de calcul de l'unicité du contenu connaissez-vous? Veuillez suggérer ces méthodes avec les implémentations .NET.
Merci.