0

Notre application permet à un utilisateur d'entrer les noms de sociétés avec lesquels son organisation travaille. Un problème actuel est que la façon dont un utilisateur saisit le nom de l'entreprise varie d'un utilisateur à l'autre. Nous devons consolider ces données. Existe-t-il des approches éprouvées pour s'attaquer à ce problème?Consolidation/Clustering Termes et expressions

Répondre

1

Le problème de la qualité des données est généralement appelé Data Cleansing. Il existe de nombreuses méthodes et outils dans ce domaine.

Le meilleur pour vous dépendra de l'étendue de votre problème et aussi des technologies que vous utilisez. Mais si je comprends bien, les données qui sont stockées sont OK, le problème est que les données d'entrée de l'utilisateur à rechercher avec une orthographe incorrecte? Dans ce cas, la recherche floue pourrait aider.

+0

La recherche floue est logique, avez-vous des suggestions en ce qui concerne les outils? – Rob

+0

Quelles technologies utilisez-vous? – ewernli

+0

À peu près la pile standard .net/sql. Actuellement en utilisant des requêtes en texte intégral, mais cela n'aide pas beaucoup. – Rob

Questions connexes