Notre application permet à un utilisateur d'entrer les noms de sociétés avec lesquels son organisation travaille. Un problème actuel est que la façon dont un utilisateur saisit le nom de l'entreprise varie d'un utilisateur à l'autre. Nous devons consolider ces données. Existe-t-il des approches éprouvées pour s'attaquer à ce problème?Consolidation/Clustering Termes et expressions
0
A
Répondre
1
Le problème de la qualité des données est généralement appelé Data Cleansing. Il existe de nombreuses méthodes et outils dans ce domaine.
Le meilleur pour vous dépendra de l'étendue de votre problème et aussi des technologies que vous utilisez. Mais si je comprends bien, les données qui sont stockées sont OK, le problème est que les données d'entrée de l'utilisateur à rechercher avec une orthographe incorrecte? Dans ce cas, la recherche floue pourrait aider.
Questions connexes
- 1. SymPy: Comment retourner une expression en termes d'autres expressions?
- 2. termes solr: stimuler et démonter?
- 3. termes de développement web et dictionnaire
- 4. Liste longue, expressions régulières multiples et performance
- 5. ASP.NET Routage et expressions régulières
- 6. Expressions Linq et classes d'agrégat
- 7. expressions régulières et requête XPath
- 8. C# expressions Lambda et NHibernate
- 9. SQL Server et expressions régulières
- 10. Java et .Net expressions régulières
- 11. Perdu avec LINQ et expressions
- 12. Composants Silverlight et Expressions sur une BuildBox
- 13. Termes déroutants dans asp.net
- 14. Les expressions Lambda et Linq suivantes sont-elles équivalentes?
- 15. Expressions régulières et chemins de fichier relatifs
- 16. Comment inclure - et 'dans ces expressions régulières?
- 17. expressions lambda emboîtées et cultures de chaîne
- 18. Expressions lambda et comment les combiner?
- 19. expressions régulières divisées et match de
- 20. Python 2.6+ str.format() et expressions régulières
- 21. Métacaractères et parenthèses dans les expressions régulières
- 22. Expressions d'écriture: Infix, Postfix et Préfixe
- 23. Expressions régulières: différence entre^et \ A
- 24. Fonction php array_key_exists et expressions régulières
- 25. Generic List EnleverAll expressions et lambda
- 26. expressions régulières et de multiples systèmes d'écriture
- 27. Délégués et expressions ASP.NET - Demande d'information
- 28. Expressions de script et de test Shell
- 29. Entity Framework et expressions Lambda imbriquées
- 30. Utilisation des expressions lambda et linq
La recherche floue est logique, avez-vous des suggestions en ce qui concerne les outils? – Rob
Quelles technologies utilisez-vous? – ewernli
À peu près la pile standard .net/sql. Actuellement en utilisant des requêtes en texte intégral, mais cela n'aide pas beaucoup. – Rob