2010-03-29 3 views
1

J'ai un ensemble de fichiers texte. Je veux calculer une unicité de contenu pour différents sous-ensembles.Méthodes pour le calcul de l'unicité du contenu sur C#

E.g. nous avons 10 documents (A1 - A10) et voulons calculer l'unicité pour le sous-ensemble des documents A1 et A2. Le résultat doit donc être une valeur comprise entre 0 et 1 (1 - contenu absolument unique, 0 - contenu absolument dupliqué).

Quelles méthodes de calcul de l'unicité du contenu connaissez-vous? Veuillez suggérer ces méthodes avec les implémentations .NET.

Merci.

Répondre

Questions connexes