Je suis en train d'élaborer un modèle dans lequel les entreprises doivent fixer les prix et prendre des décisions en matière de production. Les prix sont continus et les variables de décision le sont également. (inventaire, dernières ventes, prix ...).Méthodes d'apprentissage par renforcement qui mappent de continu à continu
Quelle méthode d'apprentissage par renforcement puis-je utiliser de façon continue ou continue? Quels paquets python sont là? S'il n'y a pas de paquets python, je pourrais écrire un wrapper.
Le problème est que sa documentation est clairsemée. Pourriez-vous me donner un indice de ce que je pourrais utiliser pour continus à continu? –
J'ai mis à jour ma réponse. Veuillez le réviser. – Vladimir