2009-03-26 9 views
0

Je stocke des articles dans SQL Server 2005 et je cherche un moyen de coller dans le texte d'un article, puis de rechercher un plagiat potentiel (contenu copié) dans la base de données .Recherche dans des champs de texte intégral dans SQL Server pour détecter le plagiat

Quelle est la meilleure façon de procéder? Existe-t-il un moyen d'obtenir une jauge dans la mesure où quelque chose est similaire à quelque chose d'autre en utilisant l'indexation de texte intégral, pour plusieurs paragraphes de contenu?

Répondre

1

pourquoi ne pas installer Google Desktop et avoir seul indice qu'un répertoire

alors vous pouvez google faire l'indexation pour vous

+0

Je suis intrigué par votre réponse - dois-je exporter tout à partir de champs de texte SQL dans un dossier? – Caveatrob

+0

si vous pouvez l'exporter vers un fichier texte, google desktop peut l'analyser. semble que cela fonctionnerait bien. – 0x4f3759df

+0

Je pensais que vous aviez un tas de fichiers texte dans un dossier que vous chargiez dans sql, donc si vous aviez un tas de fichiers txt dans un dossier que vous n'auriez pas besoin de faire quoi que ce soit, il suffit de pointer google desktop. – 0x4f3759df

0

Ce n'est pas vraiment le genre de problème que l'indexation de texte intégral dans SQL Server est conçu pour résoudre. Il n'y a rien de construit dans SQL Server que vous pouvez vraiment utiliser pour vous aider.

Il existe un certain nombre d'outils de détection de plagiat spécialisés, qu'une recherche Google va vous proposer. C'est probablement votre meilleur pari.

Questions connexes