Tous Soundex, Metaphone et schémas de variantes vont de temps en temps pour donner des résultats qui ne sont pas identiques à ce que vous attendez. C'est inévitable - ils peuvent être considérés comme des algorithmes de hachage plus ou moins simples avec des propriétés spéciales de préservation de l'information, et produiront parfois des collisions quand vous préféreriez qu'ils ne le fassent pas, et produiront parfois des différences quand vous préférez .
Une façon possible d'améliorer les choses consiste à utiliser des «anneaux synonymiques». Cela produit essentiellement des listes de mots qui doivent être considérés comme synonymes, indépendamment de l'orthographe. Je les ai rencontrés dans le contexte de l'appariement des noms.Par exemple, des variantes sur Chaudri inclus:
Chaudary CHAUDERI CHAUDERY CHAUDHARY CHAUDHERI Chaudhery CHAUDHRI CHAUDHRY CHAUDHURI CHAUDHURY CHAUDHY CHAUDREY Chaudri CHAUDRY Chauduri CHAWDHARY Chawdhry CHAWDHURY CHDRY CHODARY CHODHARI CHODHOURY CHODHRY CHODREY CHODRY CHODURY CHOUDARI Choudary CHOUDERY Choudhari CHOUDHARY CHOUDHERY CHOUDHOURY Choudhri CHOUDHRY Choudhuri CHOUDHURY Choudrey Choudri CHOUDRY Choudury CHOUWDHRY CHOWDARI Chowdary Chowdhary CHOWDHERY CHOWDHRI Chowdhry Chowdhuri CHOWDHURRYY CHOWDHURY CHOWDORY CHOWDRAY CHOWDREY CHOWDRI CHOWDRURY Chowdry CHOWDURI CHOWDURY CHUDARY CHUDHRY CHUDORY COWDHURY
Vous pouvez avoir des bugs dans votre code Je crois que Bushley devrait être BXL. Je pense que les deux derniers sont corrects. –
@JonathanWood - dans Double Metaphone B est casté à P, alors que (je crois) ce n'était pas le cas du Metaphone original. Donc PXL pour Bushley est correct en DM. – APC