Recherche en présence d'un adversaire
8 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quel algorithme est principalement utilisé dans le jeu d'échecs pour réduire le nombre de mouvements à évaluer?

  • Elagage Alpha-Beta (correct)
  • Programmation par contraintes
  • Algorithme génétique
  • Fouille de données
  • Quel est l'état final d'un jeu dans le cas du jeu du morpion?

  • Peut se terminer avant que tous les mouvements soient effectués
  • Dépend uniquement des mouvements de Max
  • Toujours un match nul
  • Peut être soit une victoire pour Max ou Min (correct)
  • Quelle est la complexité du jeu de Go en termes de noeuds d'arbres de jeux?

  • 10^100
  • 10^123
  • 10^360 (correct)
  • 10^58
  • Quel programme a été le premier à atteindre un niveau proche des meilleurs joueurs humains au Backgammon?

    <p>TD-Gammon</p> Signup and view all the answers

    Quel est le rôle de l'utilité dans un état de jeu pour un joueur donné?

    <p>Évalue la valeur finale du jeu</p> Signup and view all the answers

    Quelle est la principale méthode d'apprentissage utilisée par AlphaGo Zero?

    <p>Apprentissage par renforcement uniquement</p> Signup and view all the answers

    Quelle technologie a été utilisée par Deep Blue pour battre Garry Kasparov?

    <p>Un hardware avec circuits spécialisés</p> Signup and view all the answers

    Quelle caractéristique distingue AlphaZero des autres programmes de jeu?

    <p>Il est capable de jouer à plusieurs jeux différents</p> Signup and view all the answers

    Study Notes

    Plan du Cours - Recherche en présence d'un adversaire

    • Liens établis avec les cours précédents
    • Exemple de jeu avec adversaire illustré (ex: morpion)
    • Algorithme MiniMax détaillé
    • Elagage Alpha-Beta détaillé
    • Exemples historiques de jeux (morpion, Othello, échec, Go)

    Rappel

    • Algorithme génétique
    • Fouille de données
    • Algorithme A*
    • Programmation par contraintes

    Exemple : Jeu du morpion

    • Démonstration d'un arbre de jeu avec les mouvements de MAX et MIN.
    • Affichage des états terminaux et des utilités associées (valeurs de gain).

    Définitions

    • Joueurs : MAX et MIN
    • s0 : état initial
    • Actions(s) : ensemble des mouvements possibles à partir de l'état s
    • Result(s,a) : état résultant de l'action a dans l'état s
    • Terminal-test(s) : vrai si le jeu est terminé, faux sinon
    • Utility(s,j) : valeur finale du jeu pour le joueur j dans l'état s.

    Exemples de Complexités d'arbres de jeux (#noeuds)

    • Jeu de morpion : environ 10^5 noeuds.
    • Othello : environ 10^58 noeuds.
    • Jeu d'échecs : environ 10^123 noeuds.
    • Jeu de Go : environ 10^360 noeuds.

    MiniMax

    • Formule de MiniMax
    • Illustration graphiquement sur l'arbre de jeu
    • Calcul de la meilleure stratégie pour un joueur (MAX ou MIN).

    Elagage Alpha-Beta

    • Illustration graphique de l'élagage (coupe alpha et bêta) sur l'arbre de jeu, illustrant les cas où la valeur est inférieure à un seuil, ou supérieur à un autre.
    • Explication de l'algorithme d'élagage Alpha-Beta pour réduire la recherche dans l'arbre.

    Deep Blue (jeu d'échecs)

    • Premier ordinateur à battre le champion du monde Garry Kasparov en 1997.
    • Composé de 30 nœuds de 120 MHz avec 480 circuits dédiés aux échecs.
    • Faisait partie des supercalculateurs dans le top 500 mondial.
    • Utilisait l'élagage alpha-bêta et un dictionnaire d'ouvertures/fermetures.

    TD-Gammon (Jeu de Backgammon)

    • Premier programme à atteindre le niveau des meilleurs joueurs humains en 1992.
    • Apprentissage complètement automatique (jeu contre lui-même).
    • Apprentissage par renforcement et par réseaux de neurones
    • Convergence après 1 500 000 parties.
    • Découverte de nouvelles stratégies par l'apprentissage.

    AlphaGo (jeu de Go)

    • Bat le meilleur joueur humain en 2017.
    • Apprentissage en deux étapes (d'abord entraînement sur les parties humaines, puis apprentissage contre lui-même).
    • AlphaGo Zero : apprentissage uniquement à partir des règles.
    • AlphaZero : une version jouant aux échecs, Go et Shogi, battant les meilleurs programmes dans ces trois jeux.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Cours de DataScience & IA PDF

    Description

    Ce quiz explore les concepts de recherche dans des environnements avec adversaires, en se concentrant sur des algorithmes comme MiniMax et Alpha-Beta. Il inclut des exemples de jeux classiques tels que le morpion et Othello, tout en rappelant des algorithmes connexes. Testez vos connaissances sur la stratégie des jeux et la théorie des interviews adverses.

    More Like This

    Use Quizgecko on...
    Browser
    Browser