J'ai essayé de comprendre le fonctionnement de l'algorithme minimax aux états intermédiaires d'un jeu de tic tac toe. Mais je suis incapable de le faire. Je comprends que l'algorithme min max renvoie le meilleur état possible pour le joueur à chaque étape. Si les États étaient comme cetteMinimax algorithme Tic Tac Toe état intermédiaire
Aux dernières étapes du jeu, il est plus facile de comprendre que l'état qui conduit à un avantage ou un maximum de points pour un joueur est la meilleure configuration. Dans cet exemple, nous pouvons voir que l'état qui a le score '1', à la feuille est le meilleur état. Mais que se passe-t-il aux étapes intermédiaires ou au début du jeu?
Supposons que nous ayons 3 positions pour commencer ou le joueur pourrait aller à ces états en jouant une certaine position. Et ces positions conduisent encore à d'autres configurations de planches dans l'arbre. Chacune des trois branches du nœud initial/de départ mènera finalement à la victoire notée '1' au niveau des nœuds feuilles ou une défaite désignée par '-1' dans les nœuds feuilles ou dans certains cas un pointage noté '0'.
Qu'est-ce que l'algorithme de minimax faire ici? Quelle position ou branche le minimax retournera-t-il après le nœud initial?