Sistemi di Pianificazione Automatica e Grafi
40 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Qual è lo scopo principale di un sistema di pianificazione basato su obiettivi?

  • Minimizzare i costi
  • Raggiungere un obiettivo predefinito (correct)
  • Scegliere il piano più complesso
  • Massimizzare la performance
  • Come si rappresentano le transizioni di stato in un grafo per un problema di planning?

  • Attraverso nodi che puntano agli altri nodi
  • Con archi che collegano nodi (correct)
  • Con cerchi concentrici intorno ai nodi
  • Utilizzando linee tratteggiate tra i nodi
  • Qual è la differenza principale tra ricerca informata e ricerca non informata?

  • La ricerca informata utilizza conoscenza per una ricerca più efficiente (correct)
  • La ricerca non informata è sempre più veloce della ricerca informata
  • La ricerca informata esplora casualmente il grafo
  • La ricerca non informata basata su una funzione euristica
  • Quale algoritmo è un esempio di ricerca non informata?

    <p>Depth-First Search (DFS)</p> Signup and view all the answers

    Cosa rappresenta un nodo finale in un grafo di planning?

    <p>Lo stato obiettivo</p> Signup and view all the answers

    Qual è un vantaggio degli algoritmi di ricerca informata rispetto a quelli non informati?

    <p>Possono ridurre il tempo di ricerca</p> Signup and view all the answers

    Qual è il risultato di un problema di planning risolto tramite ricerca su grafo?

    <p>Una sequenza di azioni dal nodo iniziale al nodo finale</p> Signup and view all the answers

    Cosa caratterizza un sistema di pianificazione utility based?

    <p>Utilizza una funzione di utilità per ottimizzare performance e costi</p> Signup and view all the answers

    Quale delle seguenti affermazioni rappresenta una caratteristica dell'algoritmo A*?

    <p>L'algoritmo trova una soluzione ottimale quando essa esiste.</p> Signup and view all the answers

    Quale funzione euristica fornisce una stima migliore del costo nel problema del puzzle a 8 tasselli?

    <p>h2(s) che utilizza la Manhattan Distance.</p> Signup and view all the answers

    Cosa implica il concetto di 'mondo chiuso' nella modellazione dei problemi?

    <p>Tutte le precondizioni per le azioni devono essere vere.</p> Signup and view all the answers

    Qual è la funzione euristica che stima il numero di literali che mancano in un obiettivo nel modello STRIPS?

    <p>Una stima del numero di literali mancanti.</p> Signup and view all the answers

    Quale delle seguenti affermazioni è vera riguardo le funzioni euristiche nel contesto dell'algoritmo A*?

    <p>Entrambe forniscono una sottostima del costo reale.</p> Signup and view all the answers

    In quale situazione uno stato non viene considerato eseguibile secondo il concetto di mondo chiuso?

    <p>Quando mancano alcune precondizioni necessarie.</p> Signup and view all the answers

    Quale delle seguenti affermazioni meglio descrive la funzione h2(s) nel contesto del puzzle a 8 tasselli?

    <p>Calcola le distanze manhattan per una migliore stima.</p> Signup and view all the answers

    Nel contesto dell'algoritmo A*, qual è una conseguenza negativa di utilizzare una funzione euristica che è una sovrastima?

    <p>L'algoritmo diventa inefficiente.</p> Signup and view all the answers

    Qual è la decisione ottimale in condizioni di incertezza stretta utilizzando un approccio ottimistico nella matrice di ricompensa fornita?

    <p>10.00</p> Signup and view all the answers

    Con un indice di Hurwicz di 0.5, quale decisione selezioneresti utilizzando il criterio ponderato?

    <p>9.00</p> Signup and view all the answers

    Cosa si intende per 'informazione perfetta' in un contesto di decisione?

    <p>Quando si conosce con certezza lo stato di natura che si verificherà.</p> Signup and view all the answers

    Qual è la principale differenza tra l'ERPI e l'EVPI?

    <p>L'ERPI è una somma di ricompense, mentre l'EVPI è una differenza.</p> Signup and view all the answers

    Quale affermazione descrive correttamente l'Expected Reward under perfect information?

    <p>La ricompensa massima che si potrebbe ottenere senza incertezze.</p> Signup and view all the answers

    Qual è lo scopo principale dell'Expected Value of Perfect Information (EVPI)?

    <p>Determinare quanto vale avere conoscenza perfetta in un contesto decisionale.</p> Signup and view all the answers

    Nel problema di Newsboy, quale metodo utilizzarebbe una persona per minimizzare il rammarico?

    <p>Applicare il criterio di Savage per valutare le perdite relative.</p> Signup and view all the answers

    Qual è una conseguenza di avere informazioni perfette nel processo decisionale?

    <p>La precisione delle previsioni aumenta.</p> Signup and view all the answers

    Qual è l'uso principale della tabella delle decisioni nella gestione degli stati e delle conseguenze?

    <p>Rappresentare l'interazione tra stati e conseguenze.</p> Signup and view all the answers

    Quali delle seguenti affermazioni descrive meglio una decisione in condizioni di incertezza stretta?

    <p>L'agente conosce i possibili stati ma non le probabilità.</p> Signup and view all the answers

    Qual è la differenza principale tra decisioni in condizioni di rischio e incertezza stretta?

    <p>In condizioni di rischio, l'agente può calcolare le probabilità degli esiti.</p> Signup and view all the answers

    Qual è il criterio di Bayes utilizzato per selezionare un'azione nel contesto delle decisioni in condizioni di rischio?

    <p>Scegliere l'azione che massimizza il reward.</p> Signup and view all the answers

    Che cosa rappresenta la distanza di Manhattan nel contesto dell'8-puzzle?

    <p>La somma dei movimenti orizzontali e verticali richiesti.</p> Signup and view all the answers

    Quali precondizioni devono essere soddisfatte per eseguire l'azione Move(C, Table, A)?

    <p>On(C, Table), Clear(A), Clear(C).</p> Signup and view all the answers

    Qual è la rappresentazione dello stato successore per l'azione Move(C, Table, A)?

    <p>On(B,Table), On(A,Table), On(C,A), ¬Clear(A), ¬On(C,Table).</p> Signup and view all the answers

    Qual è l'output della funzione di valutazione F() per uno stato nello scenario dell'8-puzzle quando h() è 2 e il costo del passo è 1?

    <p>$3$</p> Signup and view all the answers

    Qual è la differenza principale tra le informazioni nel caso ideale e nel caso reale?

    <p>Nel caso ideale si ottengono informazioni perfette, mentre nel caso reale si ricevono informazioni accurate ma non certe.</p> Signup and view all the answers

    Cosa si intende per ESI?

    <p>Efficienza di un’informazione campione che misura il valore delle informazioni ottenute rispetto all'ideale.</p> Signup and view all the answers

    Qual è il valore dell'Expected Value of Sample Information (EVSI)?

    <p>È la differenza tra il guadagno massimo con il sondaggio e il guadagno massimo senza il sondaggio.</p> Signup and view all the answers

    Qual è la caratteristica principale di un decisore incline al rischio?

    <p>Scelgono azioni con il massimo guadagno atteso, indipendentemente dalla varianza.</p> Signup and view all the answers

    Come si definisce una soluzione ammissibile in un problema di ottimizzazione?

    <p>È una soluzione che soddisfa tutti i vincoli del problema.</p> Signup and view all the answers

    Qual è un indicatore dell’efficienza di un sondaggio secondo l'ESI?

    <p>Un valore di ESI vicino a 1 indica informazioni quasi perfette.</p> Signup and view all the answers

    Cosa determina una strategia nel contesto decisionale sequenziale?

    <p>Le probabilità delle condizioni che si potrebbero verificare.</p> Signup and view all the answers

    Perché un'azienda potrebbe investire in un sondaggio?

    <p>Per ottenere informazioni supplementari che migliorano la decisione.</p> Signup and view all the answers

    Study Notes

    Sistemi di Pianificazione Automatica

    • I sistemi di pianificazione automatica possono essere classificati in due tipi: goal based e utility based.
    • I sistemi goal based mirano a raggiungere un obiettivo predefinito.
    • I sistemi utility based mirano a raggiungere l'obiettivo con il piano che massimizza la performance o minimizza i costi.
    • I sistemi utility based agiscono sulla base di una funzione di utilità.

    Modellazione di un Problema di Pianificazione come un Problema di Ricerca su Grafo

    • Un problema di pianificazione può essere modellato come un problema di ricerca su grafo.
    • Ogni stato dell'ambiente è rappresentato come un nodo del grafo.
    • Il nodo di partenza rappresenta lo stato iniziale e il nodo finale rappresenta lo stato obiettivo.
    • Le transizioni di stato sono rappresentate come archi che collegano i nodi.
    • La soluzione è trovata cercando la sequenza di azioni che conduce dal nodo iniziale al nodo finale attraverso il percorso con il minor costo.
    • Ogni azione ha un esito deterministico.

    Algoritmi di Ricerca su Grafo

    • Esistono due tipi di algoritmi di ricerca su grafo: Uninformed Search e Informed Search.
    • Uninformed Search esplora lo spazio delle possibili soluzioni senza alcuna conoscenza riguardo al percorso migliore.
    • Esempi di Uninformed Search includono BFS e DFS.
    • Informed Search utilizza la conoscenza impressa dallo sviluppatore per ricercare la soluzione in modo più efficiente.
    • Esempi di Informed Search includono Greedy Algorithm e A*.

    Proprietà dell’algoritmo A*

    • L'algoritmo A* è completo, ottimale ed efficiente quando la funzione euristica h utilizzata è una sottostima.
    • Completo: trova una soluzione quando ne esiste una.
    • Ottimale: trova la soluzione ottimale, se questa esiste.
    • Efficiente: non ci sono altri algoritmi con la stessa funzione euristica che ottengono performance migliori.

    Funzioni Euristiche del Puzzle a 8 Tasselli

    • Nel puzzle a 8 tasselli, due principali funzioni euristiche sono utilizzate dall'algoritmo A*:
      • h1(s): conta il numero di tasselli fuori posto.
      • h2(s) (Manhattan Distance): stima il numero di mosse necessarie per posizionare ogni tassello nella posizione corretta.
    • h2(s) fornisce una stima migliore rispetto a h1(s) e guida la ricerca in modo più efficace.

    Concetto di Mondo Chiuso

    • In un approccio dichiarativo, il mondo è descritto attraverso predicati (logica del primo ordine).
    • Le azioni sono eseguibili solo se soddisfano delle precondizioni.
    • Il concetto di mondo chiuso afferma che qualsiasi condizione non dichiarata nella descrizione dello stato è considerata falsa.

    Funzione Euristica basata sul modello STRIPS

    • Nel modello STRIPS, il dominio è rappresentato utilizzando la logica del primo ordine, attraverso i letterali.
    • Una funzione euristica può essere una stima del numero di letterali nell'obiettivo che mancano nello stato attuale.

    Stato Successore per un Agente che Manipola Blocchi

    • L'azione Move(C, Table, A) è applicabile se le precondizioni On(C, Table), Clear(A) e Clear(C) sono soddisfatte.
    • Lo stato successore è rappresentato da:
      • On(B,Table)
      • On(A,Table)
      • On(C,A)
      • ¬Clear(A)
      • ¬On(C,Table)
      • Clear(B)
      • Clear(C)

    Matrice di Ricompensa o Tabella delle Decisioni

    • La tabella delle decisioni rappresenta l'interazione tra gli stati e le conseguenze di ogni azione.
    • Ogni azione ha una conseguenza che varia a seconda dello stato della natura.

    Decisioni sotto Incertezza

    • In condizioni di incertezza stretta, l'agente conosce i possibili stati della natura, ma non può quantificarne la probabilità.
    • In condizioni di rischio, l'agente può caratterizzare gli stati della natura con una distribuzione probabilistica.

    Criterio di Bayes

    • Il criterio di Bayes seleziona l'azione che fornisce il massimo reward in condizioni di rischio.

    Approcci alla Decisione in condizioni di Incertezza Stretta

    • Approccio conservativo (Wald): sceglie l'azione con la minima ricompensa peggiore.
    • Approccio ottimistico (Max reward): sceglie l'azione con la massima ricompensa migliore.
    • Approccio ponderato (Hurwicz): combina il minimo e il massimo reward con un indice di ponderazione.
    • Criterio di regret / rammarico (Savage): sceglie l'azione che minimizza il massimo rammarico.

    Informazione Perfetta

    • L'informazione perfetta si ha quando lo stato della natura che si verificherà è noto con certezza.
    • Expected Reward under Perfect Information (ERPI) è la somma dei massimi reward per ogni azione moltiplicate per la distribuzione di probabilità.
    • Expected Value of Perfect Information (EVPI) è la differenza tra ERPI e la ricompensa attesa senza informazione perfetta.

    Valore della Sample Information

    • Expected Value of Sample Information (EVSI) è il valore che un'azienda attribuisce a informazioni supplementari che possono migliorare la decisione.
    • Efficienza dell'informazione campione (ESI) misura l'accuratezza di un sondaggio rispetto all'informazione perfetta.

    Decisore Incline al Rischio

    • Un decision-maker incline al rischio sceglie l'azione con la più alta expected reward, anche se ha una varianza alta.
    • Un decision-maker non incline al rischio sceglie l'azione con la varianza più bassa, anche se ha una expected reward più bassa.

    Soluzione Ammissibile

    • Una soluzione a un problema di ottimizzazione è ammissibile se soddisfa tutti i vincoli del problema.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Teoria 1° Esonero PA PDF

    Description

    Esplora i fondamenti dei sistemi di pianificazione automatica, inclusi i tipi goal based e utility based. Scopri come modellare un problema di pianificazione come una ricerca su grafo, con stati rappresentati come nodi e transizioni come archi. Impara a trovare la soluzione ottimale nel contesto della pianificazione automatica.

    More Like This

    Use Quizgecko on...
    Browser
    Browser