Récemment, je suis tombé sur this article, et je me demandais quelle serait la différence entre les résultats que vous obtiendriez d'un réseau neuronal récurrent, comme ceux décrits ci-dessus, et une simple chaîne de Markov serait. Je ne comprends pas vraiment l'algèbre linéaire qui se passe sous le capot dans un RNN, mais il semble que vous êtes en train de concevoir une façon super compliquée de faire un modèle statistique pour ce que la lettre suivante va être basée les lettres précédentes, quelque chose qui est fait très simplement dans une chaîne de Markov.Pourquoi devrions-nous utiliser des RNN au lieu des modèles de Markov?
Pourquoi les RNN sont-ils intéressants? Est-ce juste parce qu'ils sont une solution plus généralisable, ou y a-t-il quelque chose qui me manque?