2010-10-05 4 views
0

Quel serait le meilleur moyen de comparer de gros paragraphes de texte pour distinguer les différences? Par exemple, la chaîne A et la chaîne B sont les mêmes, à l'exception de quelques mots manquants, comment les mettre en évidence? À l'origine, j'ai pensé à le décomposer en tableaux de mots et à comparer les éléments. Cependant, cela se décompose lorsqu'un mot est supprimé ou inséré.Dire la différence entre deux gros morceaux de texte

+0

en cours d'exécution d'un algorithme standard diff/delta ... –

Répondre

0

Vous souhaitez examiner les plus longs algorithmes de sous-séquence commune. La plupart des langues ont une bibliothèque qui fera le sale boulot pour vous, et here est une pour C#. La recherche de "C# diff" ou "VB.Net diff" vous aidera à trouver des bibliothèques supplémentaires qui répondent à vos besoins.

0

différence Habituellement texte est mesurée en termes de edit distance, qui est essentiellement le nombre d'ajouts de caractères, des suppressions ou des modifications nécessaires pour transformer un texte dans l'autre.

Une implémentation commune de cet algorithme utilise dynamic programming.

0

Si c'est un one-shot deal, les enregistrer dans MS Word et utiliser le document fonction de comparaison.

+0

Nah ce sera une chose récurrente qui doit se produire dans le code derrière sur une webapp ASP.net –

Questions connexes