2017-06-07 2 views
3

Je veux configurer un agent RL sur l'environnement OpenAI CarRacing-v0, mais avant cela, je veux comprendre l'espace d'action. En the code on github ligne 119 dit:OpenAI Gym: Comprendre la notation `action_space`

self.action_space = spaces.Box(np.array([-1,0,0]), np.array([+1,+1,+1])) # steer, gas, brake 

Comment puis-je lire cette ligne? Bien que mon problème soit concret par rapport à CarRacing-v0, je voudrais comprendre la notation spaces.Box() en général

Répondre

4

Box signifie que vous avez affaire à des quantités réelles.

Le premier tableau np.array([-1,0,0] est les valeurs acceptées les plus basses et le second np.array([+1,+1,+1]) sont les valeurs acceptées les plus élevées. Dans ce cas (en utilisant le commentaire), nous voyons que nous avons 3 actions:

  1. direction: valeurs réelles en [-1, 1]
  2. gaz: valeurs réelles en [0, 1]
  3. Pause: valeurs réelles dans [0, 1]