J'utilise à la fois Soundexing Daitch-Mokotoff et Damerau-Levenshtein pour savoir si une entrée d'utilisateur et une valeur dans l'application sont «identiques».Calcul d'une distance relative Levenshtein - logique?
La distance de Levenshtein est-elle supposée être utilisée comme valeur absolue? Si j'ai un mot de 20 lettres, une distance de 4 n'est pas si mauvaise. Si le mot a 4 lettres ...
Ce que je fais maintenant est de prendre la distance/longueur pour obtenir une distance qui reflète mieux quel pourcentage du mot a été changé.
Est-ce une approche valide/éprouvée? Ou est-ce simplement stupide?
Cette approche n'est pas très stupide, elle a déjà été utilisée avec un certain succès. Il y a cependant de meilleures mesures. –
Quels sont ces articles à votre avis? –