2017-02-07 5 views
0

J'ai créé un petit programme IA qui peut jouer Othello. L'algorithme que j'utilise (MCTS UTC) a un paramètre où je peux régler le rapport exploration/exploitation. Il s'agit d'une seule valeur flottante allant de 0 à 10 (l'infinité est possible mais les valeurs élevées n'ont pas beaucoup de sens)Optimisation des paramètres pour le jeu de plateau AI

Je peux facilement laisser jouer l'algorithme par rapport à lui-même avec différentes valeurs de ce paramètre. Cela me donnerait une idée de laquelle des deux valeurs est la meilleure.

Qu'est-ce qu'un bon algorithme pour optimiser ce paramètre?

(je préfère un algorithme qui a des recherches ou des publications aller indepth pour expliquer pourquoi ou quand il fonctionne mieux.)

Répondre

1

Tenir compte quelque chose de l'ordre d'un algorithme génétique où le programme joue avec lui-même et les gagnants le ratio est conservé et varie un peu. Gardez une trace des valeurs. Au fil du temps, il peut converger vers un «meilleur» équilibre.