2009-10-13 3 views
1

comment vais-je simuler l'algorithme de distance damerau leveshtein de manière à détecter le plagiat dans les documents? Merci!détection de plagiat en utilisant l'algorithme de damerau levenshtein

+2

Google et poser ici de pures questions techniques. Je suppose que personne ne vous répondra quelque chose comme ça. –

+0

L'article Wikipedia devrait vous aider à démarrer. – Henning

+1

cela ressemble sûrement à des devoirs. –

Répondre

2

Levenshtein distance est principalement utilisé pour comparer deux chaînes, telles que la comparaison des noms ou la recherche de remplaçants dans un vérificateur d'orthographe. L'utilisation de cet algorithme pour un document entier pour détecter le plagiat n'est pas typique.

Cependant, il y a du travail dans la région. Tout porte à cet article, qui nécessite un abonnement:

Plagiat Détection Utilisation du Levenshtein et Smith-Waterman algorithme

http://www.computer.org/portal/web/csdl/doi/10.1109/ICICIC.2008.422

Plagiat dans les textes est des questions de préoccupation croissante à la communauté universitaire . Maintenant, le plagiat de texte le plus commun se produit en faisant une variété de modifications mineures qui comprennent l'insertion, la suppression ou la substitution de mots. De tels changements simples nécessitent cependant des comparaisons de chaînes excessives. Dans cet article, nous présentons une méthode de détection du plagiat hybride. Nous étudions l'utilisation d'une ligne diagonale, dérivée de la distance de Levenshtein, et l'algorithme SmithWaterman simplifié qui est un outil classique dans l'identification et la quantification des similitudes locales dans les séquences biologiques, en vue de l'application dans la détection du plagiat. Notre approche évite les comparaisons de chaînes impliquées globalement et considère les facteurs psychologiques, qui peuvent conduire à une accélération significative des résultats de l'expérience. Sur la base des résultats, nous indiquons la faisabilité d'une telle amélioration en utilisant la distance de Levenshtein et l'algorithme de Smith-Waterman et pour illustrer les gains d'efficacité. À l'avenir, il serait intéressant d'explorer les heuristiques appropriées dans le domaine de la comparaison de texte

Questions connexes