Je souhaite utiliser le modèle HMM (forward backward) pour la prédiction de la structure secondaire de la protéine.Algorithme forward-backward pour la prédiction de la structure secondaire
Fondamentalement, un modèle à trois états est utilisée: États = {H = hélice alpha, B = feuillet bêta, C = bobine}
et chaque état a une probabilité d'émission pmf de 1 par 20 (pour les 20 acides aminés). Après avoir utilisé un «ensemble d'apprentissage» de séquences sur le modèle vers l'arrière, la maximisation de l'attente converge vers une matrice de transitions optimale (3 par 3 entre les trois états) et la probabilité d'émission pmf pour chaque état. Est-ce que quelqu'un connaît un ensemble de données (de préférence très petit) de séquences pour lesquelles les valeurs «correctes» de la matrice de transition et les probabilités d'émission sont déterminées. Je voudrais utiliser cet ensemble de données dans Excel pour appliquer l'algorithme vers l'avant et construire ma confiance pour déterminer si je peux obtenir le même résultat.
Et puis passer à quelque chose de moins primitive que Excel: o)
vous pouvez également demander à biostars: http://www.biostars.org – Pierre
Pierre, merci pour le conseil. Je vais le faire en attendant aussi. –