2

Je suis en train d'élaborer un modèle dans lequel les entreprises doivent fixer les prix et prendre des décisions en matière de production. Les prix sont continus et les variables de décision le sont également. (inventaire, dernières ventes, prix ...).Méthodes d'apprentissage par renforcement qui mappent de continu à continu

Quelle méthode d'apprentissage par renforcement puis-je utiliser de façon continue ou continue? Quels paquets python sont là? S'il n'y a pas de paquets python, je pourrais écrire un wrapper.

Répondre

1

PyBrain La bibliothèque learningign est ce que vous cherchez. C'est une mise en œuvre assez complexe des réseaux de neurones, mais quand vous le comprendrez, vous obtiendrez un outil vraiment puissant. PyBrain est une bibliothèque python pour la modélisation de réseaux neuronaux. Overview of the PyBrain devrait vous donner une idée de base: à chaque pas de temps, vous fournissez un réseau de neurones avec un ensemble de valeurs continues et sortez un autre ensemble de valeurs continues. Mais le plus important est que vous pouvez évaluer la sortie et former votre réseau de neurones.

Toutes ces étapes - y compris la formation réseau - sont déjà implémentées dans PyBrain.

+0

Le problème est que sa documentation est clairsemée. Pourriez-vous me donner un indice de ce que je pourrais utiliser pour continus à continu? –

+1

J'ai mis à jour ma réponse. Veuillez le réviser. – Vladimir