Je veux aligner deux séquences d'ADN de manière optimale, mais j'ai la fonction de pénalité de gap de longueur L, que si L est un multiple de 3, la pénalité est un * L pour une constante une. Si L n'est pas un multiple de 3, alors la pénalité est b * L pour une constante b.Alignement de séquence avec pénalité arbitraire de gap
Je suis supposé concevoir un algorithme O (n * m), où n et m sont des longueurs de séquences d'ADN, qui trouvent l'alignement optimal. Mais la partie délicate à ce sujet est que je dois garder une trace de la taille de l'écart qu'il étend. Par exemple, si j'ai deux lacunes contiguës et que je prolonge un intervalle, je devrais mettre à jour le score par L - b (L-1), mais je n'ai pas pu formuler correctement les sous-problèmes. J'ai pensé à introduire un nouveau paramètre L pour "deviner" la longueur de l'écart final, mais cela dépasserait facilement O (n * m). Y a-t-il un moyen de formuler ces sous-problèmes efficacement?
Toute observation clé serait grandement appréciée.