Apprentissage par renforcement - Apprendre à partir de pixels bruts

J'ai été présenté à RL par le livre de Sutton. Afin d'approfondir cette connaissance, je voudrais explorer comment l'agent apprend à partir de pixels bruts et essayer de mettre en œuvre un exemple en utilisant H2O. Je veux utiliser l'API Java. Est-ce que l'eau gazeuse est la distribution que je devrais utiliser? Apprentissage par renforcement - Apprendre à partir de pixels bruts

Comment diffuser des pixels bruts à h2o? Comment un jeu de ping-pong, par exemple, peut-il être utilisé pour apprendre à l'agent h2o RL? Quelle API Deep Learning H2O est utilisée? Je voudrais savoir si les réponses se rapportent à l'eau car je me réfère à d'autres documents pour en apprendre davantage sur RL.

Mise à jour: http://h2o2016.wpengine.com/wp-content/themes/h2o2016/images/resources/DeepLearningBooklet.pdf

Mais je dois comprendre comment utiliser Java pour diffuser des pixels d'image à partir d'un jeu pour aider l'agent h2o RL apprendre. Les exemples utilisent principalement R et Python.

Source

2017-05-08 Mohan Radhakrishnan

H2O ne prend pas en charge l'apprentissage par renforcement pour le moment.

Vous voudrez peut-être vérifier quelque chose comme OpenAI Gym, Keras-RL (apprentissage par renforcement profond pour Keras) ou un Theano-based implementation of Deep Q-learning.

Source

2017-05-10 04:06:37

Mais le code a besoin d'algorithmes fondamentaux qui pourraient déjà être en H2O. On pourrait en combiner quelques-uns et obtenir le résultat? –

@MohanRadhakrishnan Oui, c'est vrai, H2O pourrait être étendu pour inclure un cadre d'apprentissage de renforcement. Cependant, personne ne travaille activement là-dessus, à ce que je sache. –

Apprentissage par renforcement - Apprendre à partir de pixels bruts

Répondre

Questions connexes