0La chaleur
1Répondre
activations d'enregistrement de l'implémentation de lignes de base openAI
0La chaleur
2Répondre
Comprendre les fonctions de stratégie et de valeur apprentissage par renfort
0La chaleur
1Répondre
Apprentissage direct/indirect et supervisé/non supervisé/de renforcement
1La chaleur
1Répondre
3La chaleur
1Répondre
OpenAI Gym: Comprendre la notation `action_space`
0La chaleur
1Répondre
Tensorflow: tf.gradients entre les différents chemins du graphique
2La chaleur
1Répondre
Comment implémenter un environnement personnalisé dans keras-rl/OpenAI GYM?
3La chaleur
1Répondre
0La chaleur
1Répondre
Différenciation automatique dans les réseaux de gradient de politique
2La chaleur
1Répondre
Python jeu réseau neuronal. Comment configurer les entrées