J'ai été présenté à RL par le livre de Sutton. Afin d'approfondir cette connaissance, je voudrais explorer comment l'agent apprend à partir de pixels bruts et essayer de mettre en œuvre un exemple en utilisant H2O. Je veux utiliser l'API Java. Est-ce que l'eau gazeuse est la distribution que je devrais utiliser? Apprentissage par renforcement - Apprendre à partir de pixels bruts
Mise à jour: http://h2o2016.wpengine.com/wp-content/themes/h2o2016/images/resources/DeepLearningBooklet.pdf
Mais je dois comprendre comment utiliser Java pour diffuser des pixels d'image à partir d'un jeu pour aider l'agent h2o RL apprendre. Les exemples utilisent principalement R et Python.
Mais le code a besoin d'algorithmes fondamentaux qui pourraient déjà être en H2O. On pourrait en combiner quelques-uns et obtenir le résultat? –
@MohanRadhakrishnan Oui, c'est vrai, H2O pourrait être étendu pour inclure un cadre d'apprentissage de renforcement. Cependant, personne ne travaille activement là-dessus, à ce que je sache. –