Recherche en présence d'un adversaire

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quel algorithme est principalement utilisé dans le jeu d'échecs pour réduire le nombre de mouvements à évaluer?

  • Elagage Alpha-Beta (correct)
  • Programmation par contraintes
  • Algorithme génétique
  • Fouille de données

Quel est l'état final d'un jeu dans le cas du jeu du morpion?

  • Peut se terminer avant que tous les mouvements soient effectués
  • Dépend uniquement des mouvements de Max
  • Toujours un match nul
  • Peut être soit une victoire pour Max ou Min (correct)

Quelle est la complexité du jeu de Go en termes de noeuds d'arbres de jeux?

  • 10^100
  • 10^123
  • 10^360 (correct)
  • 10^58

Quel programme a été le premier à atteindre un niveau proche des meilleurs joueurs humains au Backgammon?

<p>TD-Gammon (D)</p> Signup and view all the answers

Quel est le rôle de l'utilité dans un état de jeu pour un joueur donné?

<p>Évalue la valeur finale du jeu (D)</p> Signup and view all the answers

Quelle est la principale méthode d'apprentissage utilisée par AlphaGo Zero?

<p>Apprentissage par renforcement uniquement (A)</p> Signup and view all the answers

Quelle technologie a été utilisée par Deep Blue pour battre Garry Kasparov?

<p>Un hardware avec circuits spécialisés (A)</p> Signup and view all the answers

Quelle caractéristique distingue AlphaZero des autres programmes de jeu?

<p>Il est capable de jouer à plusieurs jeux différents (A)</p> Signup and view all the answers

Flashcards

Jeu à adversaire

Un jeu où deux joueurs s'affrontent pour atteindre un objectif spécifique, les mouvements étant déterminés par des règles strictes.

Algorithme MiniMax

Un algorithme qui permet de trouver le meilleur mouvement possible pour un joueur dans un jeu à adversaire, en évaluant tous les mouvements possibles et en choisissant celui qui maximise ses chances de gagner.

Elagage Alpha-Beta

Une technique d'optimisation de l'algorithme MiniMax qui permet d'éliminer certaines branches de l'arbre de recherche, réduisant ainsi le temps de calcul.

État initial (s0)

L'état initial d'un jeu à adversaire, à partir duquel les joueurs peuvent effectuer leurs mouvements.

Signup and view all the flashcards

Actions(s)

L'ensemble des actions possibles qu'un joueur peut effectuer dans un état donné du jeu.

Signup and view all the flashcards

Result(s,a)

L'état résultant d'un jeu à adversaire après qu'un joueur a effectué une action spécifique.

Signup and view all the flashcards

Terminal-test(s)

Indique si le jeu est terminé ou non, c'est-à-dire si l'un des joueurs a gagné.

Signup and view all the flashcards

Utility(s,j)

La valeur finale du jeu pour un joueur donné, à la fin de la partie.

Signup and view all the flashcards

Study Notes

Plan du Cours - Recherche en présence d'un adversaire

  • Liens établis avec les cours précédents
  • Exemple de jeu avec adversaire illustré (ex: morpion)
  • Algorithme MiniMax détaillé
  • Elagage Alpha-Beta détaillé
  • Exemples historiques de jeux (morpion, Othello, échec, Go)

Rappel

  • Algorithme génétique
  • Fouille de données
  • Algorithme A*
  • Programmation par contraintes

Exemple : Jeu du morpion

  • Démonstration d'un arbre de jeu avec les mouvements de MAX et MIN.
  • Affichage des états terminaux et des utilités associées (valeurs de gain).

Définitions

  • Joueurs : MAX et MIN
  • s0 : état initial
  • Actions(s) : ensemble des mouvements possibles à partir de l'état s
  • Result(s,a) : état résultant de l'action a dans l'état s
  • Terminal-test(s) : vrai si le jeu est terminé, faux sinon
  • Utility(s,j) : valeur finale du jeu pour le joueur j dans l'état s.

Exemples de Complexités d'arbres de jeux (#noeuds)

  • Jeu de morpion : environ 10^5 noeuds.
  • Othello : environ 10^58 noeuds.
  • Jeu d'échecs : environ 10^123 noeuds.
  • Jeu de Go : environ 10^360 noeuds.

MiniMax

  • Formule de MiniMax
  • Illustration graphiquement sur l'arbre de jeu
  • Calcul de la meilleure stratégie pour un joueur (MAX ou MIN).

Elagage Alpha-Beta

  • Illustration graphique de l'élagage (coupe alpha et bêta) sur l'arbre de jeu, illustrant les cas où la valeur est inférieure à un seuil, ou supérieur à un autre.
  • Explication de l'algorithme d'élagage Alpha-Beta pour réduire la recherche dans l'arbre.

Deep Blue (jeu d'échecs)

  • Premier ordinateur à battre le champion du monde Garry Kasparov en 1997.
  • Composé de 30 nœuds de 120 MHz avec 480 circuits dédiés aux échecs.
  • Faisait partie des supercalculateurs dans le top 500 mondial.
  • Utilisait l'élagage alpha-bêta et un dictionnaire d'ouvertures/fermetures.

TD-Gammon (Jeu de Backgammon)

  • Premier programme à atteindre le niveau des meilleurs joueurs humains en 1992.
  • Apprentissage complètement automatique (jeu contre lui-même).
  • Apprentissage par renforcement et par réseaux de neurones
  • Convergence après 1 500 000 parties.
  • Découverte de nouvelles stratégies par l'apprentissage.

AlphaGo (jeu de Go)

  • Bat le meilleur joueur humain en 2017.
  • Apprentissage en deux étapes (d'abord entraînement sur les parties humaines, puis apprentissage contre lui-même).
  • AlphaGo Zero : apprentissage uniquement à partir des règles.
  • AlphaZero : une version jouant aux échecs, Go et Shogi, battant les meilleurs programmes dans ces trois jeux.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Cours de DataScience & IA PDF

More Like This

Use Quizgecko on...
Browser
Browser