Sistemi di Pianificazione Automatica e Grafi

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Qual è lo scopo principale di un sistema di pianificazione basato su obiettivi?

  • Minimizzare i costi
  • Raggiungere un obiettivo predefinito (correct)
  • Scegliere il piano più complesso
  • Massimizzare la performance

Come si rappresentano le transizioni di stato in un grafo per un problema di planning?

  • Attraverso nodi che puntano agli altri nodi
  • Con archi che collegano nodi (correct)
  • Con cerchi concentrici intorno ai nodi
  • Utilizzando linee tratteggiate tra i nodi

Qual è la differenza principale tra ricerca informata e ricerca non informata?

  • La ricerca informata utilizza conoscenza per una ricerca più efficiente (correct)
  • La ricerca non informata è sempre più veloce della ricerca informata
  • La ricerca informata esplora casualmente il grafo
  • La ricerca non informata basata su una funzione euristica

Quale algoritmo è un esempio di ricerca non informata?

<p>Depth-First Search (DFS) (B)</p> Signup and view all the answers

Cosa rappresenta un nodo finale in un grafo di planning?

<p>Lo stato obiettivo (C)</p> Signup and view all the answers

Qual è un vantaggio degli algoritmi di ricerca informata rispetto a quelli non informati?

<p>Possono ridurre il tempo di ricerca (C)</p> Signup and view all the answers

Qual è il risultato di un problema di planning risolto tramite ricerca su grafo?

<p>Una sequenza di azioni dal nodo iniziale al nodo finale (A)</p> Signup and view all the answers

Cosa caratterizza un sistema di pianificazione utility based?

<p>Utilizza una funzione di utilità per ottimizzare performance e costi (B)</p> Signup and view all the answers

Quale delle seguenti affermazioni rappresenta una caratteristica dell'algoritmo A*?

<p>L'algoritmo trova una soluzione ottimale quando essa esiste. (A)</p> Signup and view all the answers

Quale funzione euristica fornisce una stima migliore del costo nel problema del puzzle a 8 tasselli?

<p>h2(s) che utilizza la Manhattan Distance. (D)</p> Signup and view all the answers

Cosa implica il concetto di 'mondo chiuso' nella modellazione dei problemi?

<p>Tutte le precondizioni per le azioni devono essere vere. (D)</p> Signup and view all the answers

Qual è la funzione euristica che stima il numero di literali che mancano in un obiettivo nel modello STRIPS?

<p>Una stima del numero di literali mancanti. (B)</p> Signup and view all the answers

Quale delle seguenti affermazioni è vera riguardo le funzioni euristiche nel contesto dell'algoritmo A*?

<p>Entrambe forniscono una sottostima del costo reale. (D)</p> Signup and view all the answers

In quale situazione uno stato non viene considerato eseguibile secondo il concetto di mondo chiuso?

<p>Quando mancano alcune precondizioni necessarie. (A)</p> Signup and view all the answers

Quale delle seguenti affermazioni meglio descrive la funzione h2(s) nel contesto del puzzle a 8 tasselli?

<p>Calcola le distanze manhattan per una migliore stima. (D)</p> Signup and view all the answers

Nel contesto dell'algoritmo A*, qual è una conseguenza negativa di utilizzare una funzione euristica che è una sovrastima?

<p>L'algoritmo diventa inefficiente. (D)</p> Signup and view all the answers

Qual è la decisione ottimale in condizioni di incertezza stretta utilizzando un approccio ottimistico nella matrice di ricompensa fornita?

<p>10.00 (C)</p> Signup and view all the answers

Con un indice di Hurwicz di 0.5, quale decisione selezioneresti utilizzando il criterio ponderato?

<p>9.00 (D)</p> Signup and view all the answers

Cosa si intende per 'informazione perfetta' in un contesto di decisione?

<p>Quando si conosce con certezza lo stato di natura che si verificherà. (B)</p> Signup and view all the answers

Qual è la principale differenza tra l'ERPI e l'EVPI?

<p>L'ERPI è una somma di ricompense, mentre l'EVPI è una differenza. (C)</p> Signup and view all the answers

Quale affermazione descrive correttamente l'Expected Reward under perfect information?

<p>La ricompensa massima che si potrebbe ottenere senza incertezze. (A)</p> Signup and view all the answers

Qual è lo scopo principale dell'Expected Value of Perfect Information (EVPI)?

<p>Determinare quanto vale avere conoscenza perfetta in un contesto decisionale. (A)</p> Signup and view all the answers

Nel problema di Newsboy, quale metodo utilizzarebbe una persona per minimizzare il rammarico?

<p>Applicare il criterio di Savage per valutare le perdite relative. (C)</p> Signup and view all the answers

Qual è una conseguenza di avere informazioni perfette nel processo decisionale?

<p>La precisione delle previsioni aumenta. (C)</p> Signup and view all the answers

Qual è l'uso principale della tabella delle decisioni nella gestione degli stati e delle conseguenze?

<p>Rappresentare l'interazione tra stati e conseguenze. (D)</p> Signup and view all the answers

Quali delle seguenti affermazioni descrive meglio una decisione in condizioni di incertezza stretta?

<p>L'agente conosce i possibili stati ma non le probabilità. (B)</p> Signup and view all the answers

Qual è la differenza principale tra decisioni in condizioni di rischio e incertezza stretta?

<p>In condizioni di rischio, l'agente può calcolare le probabilità degli esiti. (D)</p> Signup and view all the answers

Qual è il criterio di Bayes utilizzato per selezionare un'azione nel contesto delle decisioni in condizioni di rischio?

<p>Scegliere l'azione che massimizza il reward. (B)</p> Signup and view all the answers

Che cosa rappresenta la distanza di Manhattan nel contesto dell'8-puzzle?

<p>La somma dei movimenti orizzontali e verticali richiesti. (A)</p> Signup and view all the answers

Quali precondizioni devono essere soddisfatte per eseguire l'azione Move(C, Table, A)?

<p>On(C, Table), Clear(A), Clear(C). (A)</p> Signup and view all the answers

Qual è la rappresentazione dello stato successore per l'azione Move(C, Table, A)?

<p>On(B,Table), On(A,Table), On(C,A), ¬Clear(A), ¬On(C,Table). (B)</p> Signup and view all the answers

Qual è l'output della funzione di valutazione F() per uno stato nello scenario dell'8-puzzle quando h() è 2 e il costo del passo è 1?

<p>$3$ (C)</p> Signup and view all the answers

Qual è la differenza principale tra le informazioni nel caso ideale e nel caso reale?

<p>Nel caso ideale si ottengono informazioni perfette, mentre nel caso reale si ricevono informazioni accurate ma non certe. (B)</p> Signup and view all the answers

Cosa si intende per ESI?

<p>Efficienza di un’informazione campione che misura il valore delle informazioni ottenute rispetto all'ideale. (A)</p> Signup and view all the answers

Qual è il valore dell'Expected Value of Sample Information (EVSI)?

<p>È la differenza tra il guadagno massimo con il sondaggio e il guadagno massimo senza il sondaggio. (A)</p> Signup and view all the answers

Qual è la caratteristica principale di un decisore incline al rischio?

<p>Scelgono azioni con il massimo guadagno atteso, indipendentemente dalla varianza. (C)</p> Signup and view all the answers

Come si definisce una soluzione ammissibile in un problema di ottimizzazione?

<p>È una soluzione che soddisfa tutti i vincoli del problema. (A)</p> Signup and view all the answers

Qual è un indicatore dell’efficienza di un sondaggio secondo l'ESI?

<p>Un valore di ESI vicino a 1 indica informazioni quasi perfette. (D)</p> Signup and view all the answers

Cosa determina una strategia nel contesto decisionale sequenziale?

<p>Le probabilità delle condizioni che si potrebbero verificare. (A)</p> Signup and view all the answers

Perché un'azienda potrebbe investire in un sondaggio?

<p>Per ottenere informazioni supplementari che migliorano la decisione. (B)</p> Signup and view all the answers

Flashcards are hidden until you start studying

Study Notes

Sistemi di Pianificazione Automatica

  • I sistemi di pianificazione automatica possono essere classificati in due tipi: goal based e utility based.
  • I sistemi goal based mirano a raggiungere un obiettivo predefinito.
  • I sistemi utility based mirano a raggiungere l'obiettivo con il piano che massimizza la performance o minimizza i costi.
  • I sistemi utility based agiscono sulla base di una funzione di utilità.

Modellazione di un Problema di Pianificazione come un Problema di Ricerca su Grafo

  • Un problema di pianificazione può essere modellato come un problema di ricerca su grafo.
  • Ogni stato dell'ambiente è rappresentato come un nodo del grafo.
  • Il nodo di partenza rappresenta lo stato iniziale e il nodo finale rappresenta lo stato obiettivo.
  • Le transizioni di stato sono rappresentate come archi che collegano i nodi.
  • La soluzione è trovata cercando la sequenza di azioni che conduce dal nodo iniziale al nodo finale attraverso il percorso con il minor costo.
  • Ogni azione ha un esito deterministico.

Algoritmi di Ricerca su Grafo

  • Esistono due tipi di algoritmi di ricerca su grafo: Uninformed Search e Informed Search.
  • Uninformed Search esplora lo spazio delle possibili soluzioni senza alcuna conoscenza riguardo al percorso migliore.
  • Esempi di Uninformed Search includono BFS e DFS.
  • Informed Search utilizza la conoscenza impressa dallo sviluppatore per ricercare la soluzione in modo più efficiente.
  • Esempi di Informed Search includono Greedy Algorithm e A*.

Proprietà dell’algoritmo A*

  • L'algoritmo A* è completo, ottimale ed efficiente quando la funzione euristica h utilizzata è una sottostima.
  • Completo: trova una soluzione quando ne esiste una.
  • Ottimale: trova la soluzione ottimale, se questa esiste.
  • Efficiente: non ci sono altri algoritmi con la stessa funzione euristica che ottengono performance migliori.

Funzioni Euristiche del Puzzle a 8 Tasselli

  • Nel puzzle a 8 tasselli, due principali funzioni euristiche sono utilizzate dall'algoritmo A*:
    • h1(s): conta il numero di tasselli fuori posto.
    • h2(s) (Manhattan Distance): stima il numero di mosse necessarie per posizionare ogni tassello nella posizione corretta.
  • h2(s) fornisce una stima migliore rispetto a h1(s) e guida la ricerca in modo più efficace.

Concetto di Mondo Chiuso

  • In un approccio dichiarativo, il mondo è descritto attraverso predicati (logica del primo ordine).
  • Le azioni sono eseguibili solo se soddisfano delle precondizioni.
  • Il concetto di mondo chiuso afferma che qualsiasi condizione non dichiarata nella descrizione dello stato è considerata falsa.

Funzione Euristica basata sul modello STRIPS

  • Nel modello STRIPS, il dominio è rappresentato utilizzando la logica del primo ordine, attraverso i letterali.
  • Una funzione euristica può essere una stima del numero di letterali nell'obiettivo che mancano nello stato attuale.

Stato Successore per un Agente che Manipola Blocchi

  • L'azione Move(C, Table, A) è applicabile se le precondizioni On(C, Table), Clear(A) e Clear(C) sono soddisfatte.
  • Lo stato successore è rappresentato da:
    • On(B,Table)
    • On(A,Table)
    • On(C,A)
    • ¬Clear(A)
    • ¬On(C,Table)
    • Clear(B)
    • Clear(C)

Matrice di Ricompensa o Tabella delle Decisioni

  • La tabella delle decisioni rappresenta l'interazione tra gli stati e le conseguenze di ogni azione.
  • Ogni azione ha una conseguenza che varia a seconda dello stato della natura.

Decisioni sotto Incertezza

  • In condizioni di incertezza stretta, l'agente conosce i possibili stati della natura, ma non può quantificarne la probabilità.
  • In condizioni di rischio, l'agente può caratterizzare gli stati della natura con una distribuzione probabilistica.

Criterio di Bayes

  • Il criterio di Bayes seleziona l'azione che fornisce il massimo reward in condizioni di rischio.

Approcci alla Decisione in condizioni di Incertezza Stretta

  • Approccio conservativo (Wald): sceglie l'azione con la minima ricompensa peggiore.
  • Approccio ottimistico (Max reward): sceglie l'azione con la massima ricompensa migliore.
  • Approccio ponderato (Hurwicz): combina il minimo e il massimo reward con un indice di ponderazione.
  • Criterio di regret / rammarico (Savage): sceglie l'azione che minimizza il massimo rammarico.

Informazione Perfetta

  • L'informazione perfetta si ha quando lo stato della natura che si verificherà è noto con certezza.
  • Expected Reward under Perfect Information (ERPI) è la somma dei massimi reward per ogni azione moltiplicate per la distribuzione di probabilità.
  • Expected Value of Perfect Information (EVPI) è la differenza tra ERPI e la ricompensa attesa senza informazione perfetta.

Valore della Sample Information

  • Expected Value of Sample Information (EVSI) è il valore che un'azienda attribuisce a informazioni supplementari che possono migliorare la decisione.
  • Efficienza dell'informazione campione (ESI) misura l'accuratezza di un sondaggio rispetto all'informazione perfetta.

Decisore Incline al Rischio

  • Un decision-maker incline al rischio sceglie l'azione con la più alta expected reward, anche se ha una varianza alta.
  • Un decision-maker non incline al rischio sceglie l'azione con la varianza più bassa, anche se ha una expected reward più bassa.

Soluzione Ammissibile

  • Una soluzione a un problema di ottimizzazione è ammissibile se soddisfa tutti i vincoli del problema.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Teoria 1° Esonero PA PDF

More Like This

Use Quizgecko on...
Browser
Browser