Podcast
Questions and Answers
Qual è lo scopo principale di un sistema di pianificazione basato su obiettivi?
Qual è lo scopo principale di un sistema di pianificazione basato su obiettivi?
Come si rappresentano le transizioni di stato in un grafo per un problema di planning?
Come si rappresentano le transizioni di stato in un grafo per un problema di planning?
Qual è la differenza principale tra ricerca informata e ricerca non informata?
Qual è la differenza principale tra ricerca informata e ricerca non informata?
Quale algoritmo è un esempio di ricerca non informata?
Quale algoritmo è un esempio di ricerca non informata?
Signup and view all the answers
Cosa rappresenta un nodo finale in un grafo di planning?
Cosa rappresenta un nodo finale in un grafo di planning?
Signup and view all the answers
Qual è un vantaggio degli algoritmi di ricerca informata rispetto a quelli non informati?
Qual è un vantaggio degli algoritmi di ricerca informata rispetto a quelli non informati?
Signup and view all the answers
Qual è il risultato di un problema di planning risolto tramite ricerca su grafo?
Qual è il risultato di un problema di planning risolto tramite ricerca su grafo?
Signup and view all the answers
Cosa caratterizza un sistema di pianificazione utility based?
Cosa caratterizza un sistema di pianificazione utility based?
Signup and view all the answers
Quale delle seguenti affermazioni rappresenta una caratteristica dell'algoritmo A*?
Quale delle seguenti affermazioni rappresenta una caratteristica dell'algoritmo A*?
Signup and view all the answers
Quale funzione euristica fornisce una stima migliore del costo nel problema del puzzle a 8 tasselli?
Quale funzione euristica fornisce una stima migliore del costo nel problema del puzzle a 8 tasselli?
Signup and view all the answers
Cosa implica il concetto di 'mondo chiuso' nella modellazione dei problemi?
Cosa implica il concetto di 'mondo chiuso' nella modellazione dei problemi?
Signup and view all the answers
Qual è la funzione euristica che stima il numero di literali che mancano in un obiettivo nel modello STRIPS?
Qual è la funzione euristica che stima il numero di literali che mancano in un obiettivo nel modello STRIPS?
Signup and view all the answers
Quale delle seguenti affermazioni è vera riguardo le funzioni euristiche nel contesto dell'algoritmo A*?
Quale delle seguenti affermazioni è vera riguardo le funzioni euristiche nel contesto dell'algoritmo A*?
Signup and view all the answers
In quale situazione uno stato non viene considerato eseguibile secondo il concetto di mondo chiuso?
In quale situazione uno stato non viene considerato eseguibile secondo il concetto di mondo chiuso?
Signup and view all the answers
Quale delle seguenti affermazioni meglio descrive la funzione h2(s) nel contesto del puzzle a 8 tasselli?
Quale delle seguenti affermazioni meglio descrive la funzione h2(s) nel contesto del puzzle a 8 tasselli?
Signup and view all the answers
Nel contesto dell'algoritmo A*, qual è una conseguenza negativa di utilizzare una funzione euristica che è una sovrastima?
Nel contesto dell'algoritmo A*, qual è una conseguenza negativa di utilizzare una funzione euristica che è una sovrastima?
Signup and view all the answers
Qual è la decisione ottimale in condizioni di incertezza stretta utilizzando un approccio ottimistico nella matrice di ricompensa fornita?
Qual è la decisione ottimale in condizioni di incertezza stretta utilizzando un approccio ottimistico nella matrice di ricompensa fornita?
Signup and view all the answers
Con un indice di Hurwicz di 0.5, quale decisione selezioneresti utilizzando il criterio ponderato?
Con un indice di Hurwicz di 0.5, quale decisione selezioneresti utilizzando il criterio ponderato?
Signup and view all the answers
Cosa si intende per 'informazione perfetta' in un contesto di decisione?
Cosa si intende per 'informazione perfetta' in un contesto di decisione?
Signup and view all the answers
Qual è la principale differenza tra l'ERPI e l'EVPI?
Qual è la principale differenza tra l'ERPI e l'EVPI?
Signup and view all the answers
Quale affermazione descrive correttamente l'Expected Reward under perfect information?
Quale affermazione descrive correttamente l'Expected Reward under perfect information?
Signup and view all the answers
Qual è lo scopo principale dell'Expected Value of Perfect Information (EVPI)?
Qual è lo scopo principale dell'Expected Value of Perfect Information (EVPI)?
Signup and view all the answers
Nel problema di Newsboy, quale metodo utilizzarebbe una persona per minimizzare il rammarico?
Nel problema di Newsboy, quale metodo utilizzarebbe una persona per minimizzare il rammarico?
Signup and view all the answers
Qual è una conseguenza di avere informazioni perfette nel processo decisionale?
Qual è una conseguenza di avere informazioni perfette nel processo decisionale?
Signup and view all the answers
Qual è l'uso principale della tabella delle decisioni nella gestione degli stati e delle conseguenze?
Qual è l'uso principale della tabella delle decisioni nella gestione degli stati e delle conseguenze?
Signup and view all the answers
Quali delle seguenti affermazioni descrive meglio una decisione in condizioni di incertezza stretta?
Quali delle seguenti affermazioni descrive meglio una decisione in condizioni di incertezza stretta?
Signup and view all the answers
Qual è la differenza principale tra decisioni in condizioni di rischio e incertezza stretta?
Qual è la differenza principale tra decisioni in condizioni di rischio e incertezza stretta?
Signup and view all the answers
Qual è il criterio di Bayes utilizzato per selezionare un'azione nel contesto delle decisioni in condizioni di rischio?
Qual è il criterio di Bayes utilizzato per selezionare un'azione nel contesto delle decisioni in condizioni di rischio?
Signup and view all the answers
Che cosa rappresenta la distanza di Manhattan nel contesto dell'8-puzzle?
Che cosa rappresenta la distanza di Manhattan nel contesto dell'8-puzzle?
Signup and view all the answers
Quali precondizioni devono essere soddisfatte per eseguire l'azione Move(C, Table, A)?
Quali precondizioni devono essere soddisfatte per eseguire l'azione Move(C, Table, A)?
Signup and view all the answers
Qual è la rappresentazione dello stato successore per l'azione Move(C, Table, A)?
Qual è la rappresentazione dello stato successore per l'azione Move(C, Table, A)?
Signup and view all the answers
Qual è l'output della funzione di valutazione F() per uno stato nello scenario dell'8-puzzle quando h() è 2 e il costo del passo è 1?
Qual è l'output della funzione di valutazione F() per uno stato nello scenario dell'8-puzzle quando h() è 2 e il costo del passo è 1?
Signup and view all the answers
Qual è la differenza principale tra le informazioni nel caso ideale e nel caso reale?
Qual è la differenza principale tra le informazioni nel caso ideale e nel caso reale?
Signup and view all the answers
Cosa si intende per ESI?
Cosa si intende per ESI?
Signup and view all the answers
Qual è il valore dell'Expected Value of Sample Information (EVSI)?
Qual è il valore dell'Expected Value of Sample Information (EVSI)?
Signup and view all the answers
Qual è la caratteristica principale di un decisore incline al rischio?
Qual è la caratteristica principale di un decisore incline al rischio?
Signup and view all the answers
Come si definisce una soluzione ammissibile in un problema di ottimizzazione?
Come si definisce una soluzione ammissibile in un problema di ottimizzazione?
Signup and view all the answers
Qual è un indicatore dell’efficienza di un sondaggio secondo l'ESI?
Qual è un indicatore dell’efficienza di un sondaggio secondo l'ESI?
Signup and view all the answers
Cosa determina una strategia nel contesto decisionale sequenziale?
Cosa determina una strategia nel contesto decisionale sequenziale?
Signup and view all the answers
Perché un'azienda potrebbe investire in un sondaggio?
Perché un'azienda potrebbe investire in un sondaggio?
Signup and view all the answers
Study Notes
Sistemi di Pianificazione Automatica
- I sistemi di pianificazione automatica possono essere classificati in due tipi: goal based e utility based.
- I sistemi goal based mirano a raggiungere un obiettivo predefinito.
- I sistemi utility based mirano a raggiungere l'obiettivo con il piano che massimizza la performance o minimizza i costi.
- I sistemi utility based agiscono sulla base di una funzione di utilità.
Modellazione di un Problema di Pianificazione come un Problema di Ricerca su Grafo
- Un problema di pianificazione può essere modellato come un problema di ricerca su grafo.
- Ogni stato dell'ambiente è rappresentato come un nodo del grafo.
- Il nodo di partenza rappresenta lo stato iniziale e il nodo finale rappresenta lo stato obiettivo.
- Le transizioni di stato sono rappresentate come archi che collegano i nodi.
- La soluzione è trovata cercando la sequenza di azioni che conduce dal nodo iniziale al nodo finale attraverso il percorso con il minor costo.
- Ogni azione ha un esito deterministico.
Algoritmi di Ricerca su Grafo
- Esistono due tipi di algoritmi di ricerca su grafo: Uninformed Search e Informed Search.
- Uninformed Search esplora lo spazio delle possibili soluzioni senza alcuna conoscenza riguardo al percorso migliore.
- Esempi di Uninformed Search includono BFS e DFS.
- Informed Search utilizza la conoscenza impressa dallo sviluppatore per ricercare la soluzione in modo più efficiente.
- Esempi di Informed Search includono Greedy Algorithm e A*.
Proprietà dell’algoritmo A*
- L'algoritmo A* è completo, ottimale ed efficiente quando la funzione euristica h utilizzata è una sottostima.
- Completo: trova una soluzione quando ne esiste una.
- Ottimale: trova la soluzione ottimale, se questa esiste.
- Efficiente: non ci sono altri algoritmi con la stessa funzione euristica che ottengono performance migliori.
Funzioni Euristiche del Puzzle a 8 Tasselli
- Nel puzzle a 8 tasselli, due principali funzioni euristiche sono utilizzate dall'algoritmo A*:
- h1(s): conta il numero di tasselli fuori posto.
- h2(s) (Manhattan Distance): stima il numero di mosse necessarie per posizionare ogni tassello nella posizione corretta.
- h2(s) fornisce una stima migliore rispetto a h1(s) e guida la ricerca in modo più efficace.
Concetto di Mondo Chiuso
- In un approccio dichiarativo, il mondo è descritto attraverso predicati (logica del primo ordine).
- Le azioni sono eseguibili solo se soddisfano delle precondizioni.
- Il concetto di mondo chiuso afferma che qualsiasi condizione non dichiarata nella descrizione dello stato è considerata falsa.
Funzione Euristica basata sul modello STRIPS
- Nel modello STRIPS, il dominio è rappresentato utilizzando la logica del primo ordine, attraverso i letterali.
- Una funzione euristica può essere una stima del numero di letterali nell'obiettivo che mancano nello stato attuale.
Stato Successore per un Agente che Manipola Blocchi
- L'azione Move(C, Table, A) è applicabile se le precondizioni On(C, Table), Clear(A) e Clear(C) sono soddisfatte.
- Lo stato successore è rappresentato da:
- On(B,Table)
- On(A,Table)
- On(C,A)
- ¬Clear(A)
- ¬On(C,Table)
- Clear(B)
- Clear(C)
Matrice di Ricompensa o Tabella delle Decisioni
- La tabella delle decisioni rappresenta l'interazione tra gli stati e le conseguenze di ogni azione.
- Ogni azione ha una conseguenza che varia a seconda dello stato della natura.
Decisioni sotto Incertezza
- In condizioni di incertezza stretta, l'agente conosce i possibili stati della natura, ma non può quantificarne la probabilità.
- In condizioni di rischio, l'agente può caratterizzare gli stati della natura con una distribuzione probabilistica.
Criterio di Bayes
- Il criterio di Bayes seleziona l'azione che fornisce il massimo reward in condizioni di rischio.
Approcci alla Decisione in condizioni di Incertezza Stretta
- Approccio conservativo (Wald): sceglie l'azione con la minima ricompensa peggiore.
- Approccio ottimistico (Max reward): sceglie l'azione con la massima ricompensa migliore.
- Approccio ponderato (Hurwicz): combina il minimo e il massimo reward con un indice di ponderazione.
- Criterio di regret / rammarico (Savage): sceglie l'azione che minimizza il massimo rammarico.
Informazione Perfetta
- L'informazione perfetta si ha quando lo stato della natura che si verificherà è noto con certezza.
- Expected Reward under Perfect Information (ERPI) è la somma dei massimi reward per ogni azione moltiplicate per la distribuzione di probabilità.
- Expected Value of Perfect Information (EVPI) è la differenza tra ERPI e la ricompensa attesa senza informazione perfetta.
Valore della Sample Information
- Expected Value of Sample Information (EVSI) è il valore che un'azienda attribuisce a informazioni supplementari che possono migliorare la decisione.
- Efficienza dell'informazione campione (ESI) misura l'accuratezza di un sondaggio rispetto all'informazione perfetta.
Decisore Incline al Rischio
- Un decision-maker incline al rischio sceglie l'azione con la più alta expected reward, anche se ha una varianza alta.
- Un decision-maker non incline al rischio sceglie l'azione con la varianza più bassa, anche se ha una expected reward più bassa.
Soluzione Ammissibile
- Una soluzione a un problema di ottimizzazione è ammissibile se soddisfa tutti i vincoli del problema.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Esplora i fondamenti dei sistemi di pianificazione automatica, inclusi i tipi goal based e utility based. Scopri come modellare un problema di pianificazione come una ricerca su grafo, con stati rappresentati come nodi e transizioni come archi. Impara a trovare la soluzione ottimale nel contesto della pianificazione automatica.