0La chaleur
2Répondre
Q Débordement des coefficients d'apprentissage
0La chaleur
1Répondre
Comment calculer les gradients pour un réseau neuronal avec theano en utilisant Q-Learning
1La chaleur
1Répondre
Apprentissage de différences temporelles et rétropropagation
1La chaleur
2Répondre
1La chaleur
1Répondre
1La chaleur
1Répondre
Comment trouver les fonctions de base linéaires optimales d'un MDP?
4La chaleur
1Répondre
Tensorflow et multitraitement: passer des sessions
2La chaleur
1Répondre
Est-ce une implémentation correcte de Q-Learning for Checkers?
2La chaleur
1Répondre
Différence temporelle de gradient Lambda sans approximation de fonction