2008-09-24 7 views

Répondre

11

SOUNDEX est en effet orienté en anglais. Deux autres qui prennent en compte une plus grande variété de différences phonétiques sont: Double Metaphone et NYSIIS.

Ils produisent des encodages dans un espace beaucoup plus grand que SOUNDEX. Double Metaphone, spécifiquement, comprend des réductions dans le but exprès de gérer des prononciations alternatives basées sur plus de langues que l'anglais.

J'ai fait une présentation sur la correspondance de chaînes floue récemment, the slides peut être utile.

+1

Le lien vers vos diapositives est cassé (404) –

+2

@John: nouveau lien semble être http://asymmetrical-view.com/talks/#fuzzy-string-matching – Hace

+1

Merci, je viens de le mettre à jour pour pointer vers le PDF dans le repo github connexe - J'espère que cela reste plus constant. Merci. –

Questions connexes