2017-03-05 2 views
0

J'essaie d'implémenter un algorithme minimax pour un joueur IA dans un jeu de cartes simple. Cependant, à partir de la recherche, je suis confus quelles sont les différences clés entre l'évaluation de l'état et l'heuristique. D'après ce que je comprends, les heuristiques sont calculées par l'information courante disponible pour le joueur (par exemple dans les échecs, les pièces et leurs emplacements pertinents). Avec cette information, ils arrivent à une conclusion basée sur une fonction heuristique qui fournit essentiellement une "règle empirique".Quelle est la différence entre l'évaluation d'état et l'heuristique dans le jeu-IA?

Une évaluation d'état est la valeur exacte de l'état actuel.

Cependant je ne sais pas pourquoi les deux choses coexistent car je ne vois pas comment elles sont très différentes les unes des autres. S'il vous plaît, est-ce que quelqu'un peut travailler et éclaircir ma confusion. Merci.

Répondre

0

En supposant un jeu à somme nulle, vous pouvez implémenter une évaluation d'état pour les états finaux (jeu terminé avec victoire, nul, perte de perspective du joueur X) qui donne 1,0, -1. Une recherche complète dans les arbres vous permettra de jouer parfaitement. Mais en pratique, l'arbre est énorme et ne peut pas être entièrement recherché. Par conséquent, vous devez arrêter la recherche à un moment donné, ce qui n'est pas un état final. Il n'y a pas de gagnant ou de perdant déterminé. Maintenant, il est difficile de marquer cet état avec 1,0, -1 car le jeu pourrait être trop complexe pour évaluer facilement le gagnant à partir d'un état éloigné de l'état final. Mais vous devez encore évaluer ces positions et pouvez utiliser certaines hypothèses sur le jeu, ce qui équivaut à des informations heuristiques. Un exemple est la pièce-masse dans les échecs (la reine a plus de valeur qu'un pion). C'est une information heuristique incorporée dans la fonction d'évaluation non parfaite (approximation de la fonction réelle). Plus vos hypothèses/heuristiques sont bonnes, meilleure est l'approximation de l'évaluation réelle!

Mais il existe d'autres parties où l'information heuristique peut être incorporée. Une zone très importante contrôle la recherche d'arbres. Quel premier mouvement sera évalué en premier, lequel durera? La sélection de bons mouvements permet d'abord à des algorithmes comme alpha-beta d'élaguer d'énormes parties de l'arbre. Mais bien sûr, vous devez indiquer quelques hypothèses/informations heuristiques pour ordonner vos mouvements (par exemple, reine-move plus puissant que pawn-move, c'est un exemple inventé, je ne suis pas sûr de l'effet de cette heuristique dans les échecs -Is ici)