J'ai créé un petit programme IA qui peut jouer Othello. L'algorithme que j'utilise (MCTS UTC) a un paramètre où je peux régler le rapport exploration/exploitation. Il s'agit d'une seule valeur flottante allant de 0 à 10 (l'infinité est possible mais les valeurs élevées n'ont pas beaucoup de sens)Optimisation des paramètres pour le jeu de plateau AI
Je peux facilement laisser jouer l'algorithme par rapport à lui-même avec différentes valeurs de ce paramètre. Cela me donnerait une idée de laquelle des deux valeurs est la meilleure.
Qu'est-ce qu'un bon algorithme pour optimiser ce paramètre?
(je préfère un algorithme qui a des recherches ou des publications aller indepth pour expliquer pourquoi ou quand il fonctionne mieux.)