J'ai l'algorithme suivant préparé pour faire correspondre deux chaînes.exploration de texte avec r bibliothèque stringdist
library(stringdist)
qgrams('perimetrico','perimetrico peri',q=2)
pe ri tr er im me o et ic co p
V1 1 2 1 1 1 1 0 1 1 1 0
V2 2 3 1 2 1 1 1 1 1 1 1
En ce qui me concerne, c'est l'implémentation formelle pour compter le nombre d'occurrences.
stringdist('perimetrico','perimetrico peri', method='qgram', q=2)
5
Mais je ne suis pas à l'aise avec cette solution. C'est pourquoi je veux compter sur le premier résultat comme la manière suivante:
pe=1
ri=1
tr=1
er=1
im=1
me=1
o=0
et=1
ic=1
co=1
p=0
Ainsi, le résultat final serait 9/11 = 82% match de
Pourriez-vous utiliser 'moyenne (x> 0)' dans votre fonction? – CPak
Excellente contribution !!! clap clap clap – lolo
@CPak oui, cela fonctionnerait, mais je ne sais pas grand-chose sur les données OP. Que faire si '-1 'quelque part. – PoGibas