J'utilise d'abord L.LSTM, puis j'ai trouvé ce NStepLSTM, qui est une partie découverte du document tutoriel officiel. https://docs.chainer.org/en/stable/reference/generated/chainer.links.NStepLSTM.html?highlight=NstepPourquoi NStepLSTM ne possède-t-il pas la méthode reset_state?
Pourquoi chainer.links.NStepLSTM ou chainer.links.NStepBiLSTM ont pas reset_state? comment réinitialiser_state?
passe-t-il une liste de séquences (chacune est une chaîne de séquence? Une variable, par exemple un article contient plusieurs mots est une variable)? Est-ce que ce but de classe est de faire face à la séquence de longueur variable?
pouvons-nous utiliser tronqué BPTT pour économiser de la mémoire dans chainer.links.NStepLSTM? comment
Vous voulez dire que je n'ai pas besoin d'écrire le programme de mise à jour BPTT lorsque j'utilise NStepLSTM? Je dois implémenter une situation où la sortie de NStepLSTM de chaque timestep sera concaténée, et puis nourrir l'entrée de la couche suivante (la couche après NStepLSTM emploiera tous les pas de temps de NStepLSTM), Dans ce cas, Comment écrire BPTT updater? Ou vous voulez dire que je n'ai pas besoin d'écrire explicitement BPTT updater? – machen
fait l'entrée de NStepLSTM cette liste de variable: entre chaque variable à l'intérieur de cette liste doit avoir une corrélation temporelle ??? – machen
Si je ne veux utiliser que le dernier pas de temps pour calculer la perte, parce que NStepLSTM renvoie 3 variables, dois-je utiliser le dernier ou le premier? – machen