2

Je souhaite utiliser le modèle HMM (forward backward) pour la prédiction de la structure secondaire de la protéine.Algorithme forward-backward pour la prédiction de la structure secondaire

Fondamentalement, un modèle à trois états est utilisée: États = {H = hélice alpha, B = feuillet bêta, C = bobine}

et chaque état a une probabilité d'émission pmf de 1 par 20 (pour les 20 acides aminés). Après avoir utilisé un «ensemble d'apprentissage» de séquences sur le modèle vers l'arrière, la maximisation de l'attente converge vers une matrice de transitions optimale (3 par 3 entre les trois états) et la probabilité d'émission pmf pour chaque état. Est-ce que quelqu'un connaît un ensemble de données (de préférence très petit) de séquences pour lesquelles les valeurs «correctes» de la matrice de transition et les probabilités d'émission sont déterminées. Je voudrais utiliser cet ensemble de données dans Excel pour appliquer l'algorithme vers l'avant et construire ma confiance pour déterminer si je peux obtenir le même résultat.

Et puis passer à quelque chose de moins primitive que Excel: o)

+0

vous pouvez également demander à biostars: http://www.biostars.org – Pierre

+0

Pierre, merci pour le conseil. Je vais le faire en attendant aussi. –

Répondre

0

La meilleure façon de le faire est probablement de produire vos propres données simulées à partir des distributions que vous décidez. Ensuite, vous exécutez votre programme pour voir si les estimations des paramètres convergent vers vos paramètres connus. Dans votre cas, cela impliquera d'écrire une chaîne de Markov qui changera d'état en état avec une probabilité connue et arbitraire (par exemple, P (Helix to Chain) = 0,001), puis émet un acide aminé avec probabilité (pour exemple, P (méthionine) = 0,11). Pour chaque étape, imprimez l'état et l'émission. Vous pouvez ensuite regarder vos probabilités a posteriori approcher l'état de chaque site.

Vous pouvez les rendre aussi arbitraires que vous le souhaitez, car lorsque vous exécutez votre HMM, vous devez converger vers les distributions appropriées.

Bonne chance!

Questions connexes