Comment puis-je faire Levenshtein mesure de distance sur le mot (pas de caractère) Niveau en R?Levenshtein distance dans R au niveau de la phrase
Voir les éléments suivants:
Résultat attendu 1)
# levenshtein operations needed: Delete*2 --> 2 operations
array1 <- c("word", "car")
array2 <- c("word", "pool", "beer", "car")
Je recherche une fonction levenshtein()
, de sorte que la distance de 2 est renvoyée pour l'exemple ci-dessus:
levenshtein(array1, array2)
--> 2
Résultat attendu 2)
# levenshtein operations needed: Delete and insert --> 2 operations
array1 <- c("word", "car", "pool")
array2 <- c("word", "pool", "car")
Je recherche une fonction levenshtein()
, de sorte que la distance de 2 est renvoyée pour l'exemple ci-dessus:
levenshtein(array1, array2)
--> 2
J'ai trouvé ce qui suit: Word-level edit distance of a sentence Mais je ne ai pas trouver un implentation Needleman-Wunsch travail que les rendements les résultats attendus, décrits ci-dessus.
salut Carl, merci pour votre réponse. Je ne suis pas sûr que votre réponse retournerait la distance de 2 pour les deux exemples? J'ai fait une modification à l'exemple au cas où ce n'était pas clair. – ThanksGuys
Je ne comprends pas ce que vous demandez je pense. Cherchez-vous à trouver toutes les occurrences dans array2 qui ont une distance d'édition combinée de 2, telles que 'insertions + deletions = 2'? Quel est le but réel ici? en termes simples @ThanksGuys? –