2009-11-23 6 views
2

Je lance une ligne de commande autonome pour aligner de nombreuses séquences de requêtes sur une grande base de données de nucléotides. Je peux modifier les paramètres de la ligne de commande du programme blastn pour modifier divers paramètres tels que les scores de correspondance/discordance. Je me demande - pour le 'bit score' que blastn produit, est-il sensé de comparer les scores de bits pour des alignements avec des requêtes et des bases de données identiques mais des paramètres de correspondance/incompatibilité différents? J'essaie d'évaluer à quel point l'explosion est performante avec différentes valeurs de paramètres, mais je veux m'assurer que tout est comparé sur des bases égales. Merci.Évaluation de la signification d'un score BLASTn?

+0

Comment essayez-vous de mesurer la performance? Vous dites que vous voulez mesurer la performance de BLAST, mais vous ne savez pas quel est votre objectif en l'exécutant. –

Répondre

1

Je ne comprends pas pourquoi vous pensez que comparer les scores bit vous donnera un aperçu de la performance de BLAST. La méthode habituelle pour faire

Malheureusement, une grande partie du travail sur BLAST et d'autres programmes d'alignement est basée sur la recherche d'alignements locaux non-couplés et l'extension empirique de cette théorie aux alignements à brèches. En particulier, les scores de bits sont calculés comme suit:

S' = (lambda * S - ln(K))/ln(2) 

Dans la formule ci-dessus, K et lambda sont des constantes pour votre matrice de substitution, S est le score (somme des scores de substitution et Gap), et S » est le score bit. Cela signifie que vos scores bit changeront certainement à la suite de la variation des paramètres d'écart d'ouverture/d'écart, ce qui signifie que votre comparaison est invalide. Ceci est un résultat regrettable du fait qu'il y a peu de théorie sur les alignements à brèches, de sorte que les scores d'écart optimaux pour un système donné doivent être mesurés empiriquement. Parce que les scores ne sont pas comparables, je vous suggère de faire votre évaluation basée sur un ensemble alternatif de données qui n'implique pas les scores d'alignement. Par exemple, si je m'intéresse aux paramètres optimaux d'ouverture de trou/extension de gap pour comparer des séquences protéiques, je peux regarder des protéines de structure connue et évaluer chaque jeu de paramètres en fonction de sa capacité à faire des alignements. Ceci évite de comparer entièrement les scores d'alignement, ce qui est bien car la comparaison des scores de bits n'est pas forcément utile.

0

Je ne suis pas sûr que vous pouvez le faire. Avez-vous vraiment besoin de modifier les paramètres match/mismatch? Quel est ton but?

0

Il n'est pas nécessairement vrai que les scores en bits ne sont pas comparables. De la documentation BLAST sur le site Web de NCBI:

"Les scores de bit sont normalisés, ce qui signifie que les scores de différents alignements peuvent être comparés, même si différentes matrices de notation ont été utilisées."

http://www.ncbi.nlm.nih.gov/bookshelf/br.fcgi?book=handbook&part=ch16