Voici un bon début pour vous de comprendre réellement ce que la composante de recherche floue ne (similaire au groupement flou): SSIS fuzzy lookup
J'ai effectivement utilisé cela à un client où je recevais leurs données client qui a été pointé du doigt la graisse par quelqu'un. J'ai créé une table de consultation statique basée sur les noms de la société:
LKU Table (remarquez comment ceux-ci sont les mêmes au début)
Nom | Recherche Nom de sortie
Microsoft | Microsoft
JP Morgan Chase | JP Morgan Chase
McDonalds | McDonalds
Je recevoir des données dans un fichier texte qui ressemble à ceci:
dactylographié Nom
Microsft
JP Morgan
McDons
Utilisation de la recherche floue, je se joindrait à la colonne Nom (ne pas oublier que ceci est sensible à la casse - utilisateur supérieur ou inférieur à lancer) pour obtenir le nom recherché. J'ai fixé le seuil de similitude à environ 80% (pourcentage recommandé ou plus).Je verrais alors mes correspondances via la visionneuse de données qui pourrait ressembler à ceci:
Nom tapé | Nom de recherche | Confiance | Similitude
Microsoft | Microsoft | 100% | 100%
JP Morgan | JP Morgan Chase | 88% | 90%
McDons | McDonalds | 60% | Ensuite, basé sur une division conditionnelle, j'ai chargé les uns avec une confiance et une similitude pour cent> 80% et moins de 100% dans la table de recherche et chargé les autres dans une table d'erreur. Un e-mail a ensuite été envoyé par e-mail si le nombre était supérieur à un dans la table d'erreurs. Ainsi, la table de recherche de résultat serait quelque chose comme ceci:
Look Up Table
Nom | Recherche Nom de sortie
Microsoft | Microsoft
JP Morgan Chase | JP Morgan Chase
McDonalds | McDonalds
JP Morgan | JP Morgan Chase
Tableau d'erreur
Nom | Nom proposé | Message d'erreur
McDons | McDonalds | La confiance était de 60% et la similarité était de 50%
Espérons que cela a aidé.