comment vais-je simuler l'algorithme de distance damerau leveshtein de manière à détecter le plagiat dans les documents? Merci!détection de plagiat en utilisant l'algorithme de damerau levenshtein
Répondre
Levenshtein distance est principalement utilisé pour comparer deux chaînes, telles que la comparaison des noms ou la recherche de remplaçants dans un vérificateur d'orthographe. L'utilisation de cet algorithme pour un document entier pour détecter le plagiat n'est pas typique.
Cependant, il y a du travail dans la région. Tout porte à cet article, qui nécessite un abonnement:
Plagiat Détection Utilisation du Levenshtein et Smith-Waterman algorithme
http://www.computer.org/portal/web/csdl/doi/10.1109/ICICIC.2008.422
Plagiat dans les textes est des questions de préoccupation croissante à la communauté universitaire . Maintenant, le plagiat de texte le plus commun se produit en faisant une variété de modifications mineures qui comprennent l'insertion, la suppression ou la substitution de mots. De tels changements simples nécessitent cependant des comparaisons de chaînes excessives. Dans cet article, nous présentons une méthode de détection du plagiat hybride. Nous étudions l'utilisation d'une ligne diagonale, dérivée de la distance de Levenshtein, et l'algorithme SmithWaterman simplifié qui est un outil classique dans l'identification et la quantification des similitudes locales dans les séquences biologiques, en vue de l'application dans la détection du plagiat. Notre approche évite les comparaisons de chaînes impliquées globalement et considère les facteurs psychologiques, qui peuvent conduire à une accélération significative des résultats de l'expérience. Sur la base des résultats, nous indiquons la faisabilité d'une telle amélioration en utilisant la distance de Levenshtein et l'algorithme de Smith-Waterman et pour illustrer les gains d'efficacité. À l'avenir, il serait intéressant d'explorer les heuristiques appropriées dans le domaine de la comparaison de texte
- 1. en utilisant la distance levenshtein pour générer l'extrait
- 2. Comment développer un détecteur de plagiat?
- 3. iphone problème de détection de collision en utilisant chipmunk
- 4. clés de détection de direction du clavier en utilisant keyPressed
- 5. Question sur la distance de Levenshtein
- 6. Détection de son de clap en C#
- 7. Détection d'incompatibilité de casse sur le nom de fichier dans Windows (de préférence en utilisant python)?
- 8. Détection de la hauteur de la zone de visualisation en utilisant Javascript
- 9. Détection EOF dans un fichier binaire en utilisant le Schéma
- 10. Détection d'erreurs dans plusieurs requêtes MySQL en utilisant PHP
- 11. Détection/hachage de texte en double
- 12. méthodes détection de collision en C++
- 13. Détection EOF en C
- 14. php détection de chenilles
- 15. en utilisant l'iPhone OpenGl ES efficacement pour 2d (et la détection de collision)
- 16. Détection de collision XNA
- 17. Détection de UITableView scrolling
- 18. Détection de l'inactivité à l'aide de Python
- 19. Recherche dans des champs de texte intégral dans SQL Server pour détecter le plagiat
- 20. Algorithme de détection de codage de caractères
- 21. Détection de l'opération d'arrière-plan
- 22. détection tactile d'affichage de défilement
- 23. Efficacité de la détection Palindrome
- 24. Silverlight StackPanel Détection de débordement
- 25. Détection de capacités iPhone/iPod?
- 26. Comment implémentez-vous la distance Levenshtein dans Delphi?
- 27. Détection de visage + morphing d'image
- 28. Détection de coordonnées par téléphone mobile
- 29. Modification/détection Stratégie de sécurité locale programme
- 30. Détection de l'image touch (cocos2d)?
Google et poser ici de pures questions techniques. Je suppose que personne ne vous répondra quelque chose comme ça. –
L'article Wikipedia devrait vous aider à démarrer. – Henning
cela ressemble sûrement à des devoirs. –