Spațiul Stărilor Problemei

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Care dintre următoarele afirmații descrie cel mai bine spațiul stărilor problemei?

  • Un graf care reprezintă toate stările posibile ale problemei și tranzițiile dintre ele. (correct)
  • Un set de reguli și acțiuni care transformă starea inițială în starea finală.
  • Un algoritm de căutare care găsește drumul optim de la starea inițială la starea finală.
  • O funcție euristică folosită pentru a estima costul drumului de la starea curentă la starea finală.

În contextul problemelor de căutare, ce înseamnă că un mediu este "parțial observabil"?

  • Agentul nu are nicio informație despre mediu.
  • Toate aspectele mediului sunt vizibile agentului în orice moment.
  • Mediul se schimbă independent de acțiunile agentului.
  • Agentul percepe doar o parte din informațiile relevante despre mediu. (correct)

Care dintre următoarele afirmații descrie cel mai bine proprietatea de "completitudine" a unui algoritm de căutare?

  • Algoritmul găsește o soluție, dacă aceasta există, într-un timp finit. (correct)
  • Algoritmul găsește întotdeauna soluția optimă, dacă aceasta există.
  • Algoritmul găsește o soluție în timp util, indiferent de complexitatea problemei.
  • Algoritmul utilizează o funcție euristică pentru a ghida căutarea către soluție.

Care este diferența principală dintre căutarea neinformata (oarba) și căutarea informată?

<p>Căutarea informată utilizează funcții euristice pentru a ghida căutarea, în timp ce căutarea neinformata nu utilizează informații suplimentare despre problemă. (A)</p> Signup and view all the answers

Ce implicații are factorul de ramificare (branching factor) al unui spațiu de căutare asupra complexității unui algoritm?

<p>Un factor de ramificare mai mare crește exponențial numărul de stări de explorat și, implicit, complexitatea. (D)</p> Signup and view all the answers

În contextul algoritmului A*, ce reprezintă funcția $f(s) = g(s) + h(s)$?

<p>Estimarea costului total al drumului de la starea inițială la starea finală, trecând prin starea curentă $s$. (D)</p> Signup and view all the answers

Ce proprietate trebuie să aibă o euristică admisibilă $h(s)$ pentru a garanta că algoritmul A* găsește soluția optimă?

<p>$h(s)$ trebuie sa fie mai mic sau egal cu costul real al drumului de la starea $s$ la starea finală. (B)</p> Signup and view all the answers

Care este relația dintre două euristici $h_1(s)$ și $h_2(s)$, dacă $h_1(s)$ este mai informată decât $h_2(s)$ pentru toate stările $s$?

<p>$h_1(s) \geq h_2(s)$ pentru toate stările $s$. (A)</p> Signup and view all the answers

Ce înseamnă că o funcție euristică este "consistentă" (sau "monotonică")?

<p>Funcția euristică este admisibilă și, în plus, estimează costuri similare pentru stări vecine. (B)</p> Signup and view all the answers

În ce constă diferența principală dintre algoritmul A* și algoritmul A* ponderat?

<p>A* ponderat favorizează estimarea euristică, oferind prioritate atingerii scopului, posibil cu un cost mai mare. (C)</p> Signup and view all the answers

Ce avantaj oferă algoritmul Iterative Deepening A* (IDA*) față de algoritmul A* standard în termeni de utilizare a memoriei?

<p>IDA* utilizează o cantitate liniară de memorie, evitând problema epuizării memoriei întâlnită la A*. (C)</p> Signup and view all the answers

Ce este Beam Search și cum gestionează problema explorării unui spațiu de stări foarte mare?

<p>Beam Search menține doar un număr limitat de stări (bârnă) la fiecare pas, selectate pe baza unei euristici. (C)</p> Signup and view all the answers

Care dintre următoarele metode de căutare este cel mai probabil să fie eficientă într-un mediu cu un factor de ramificare foarte mare și o euristică slabă?

<p>Simulated Annealing. (D)</p> Signup and view all the answers

Ce tip de probleme face ca Simulated Annealing să fie o alegere bună?

<p>Probleme în care găsirea unei soluții fezabile este mai importantă decât găsirea soluției optime. (D)</p> Signup and view all the answers

Cum diferă Stochastic Local Beam Search de Beam Search standard?

<p>Stochastic Local Beam Search alege stările de păstrat în funcție de o probabilitate stochastică proportionala cu calitatea stărilor (D)</p> Signup and view all the answers

Care dintre următoarele este o provocare în utilizarea căutării locale în spații continue?

<p>Existența &quot;culmilor&quot; (ridges) nealiniate cu axele, care necesită mutări simultane pe mai multe direcții. (A)</p> Signup and view all the answers

Ce distinge căutarea "on-line" de căutarea "off-line" în planificarea agentului?

<p>În căutarea on-line, agentul ia decizii și acționează simultan, în timp ce în căutarea off-line agentul planifică complet înainte de a acționa. (C)</p> Signup and view all the answers

De ce algoritmul Hill Climbing nu poate fi folosit în conjuncție cu Random Restart într-o problemă de căutare on-line?

<p>Căutarea on-line necesită ca succesorul să fie similar (sau bazat) pe starea curentă în mediul fizic, cosa ce nu se întâmplă cu Random Restart HC. (D)</p> Signup and view all the answers

Care este dezavantajul principal al utilizării algoritmului DFS în căutarea on-line?

<p>Revenirea înapoi (backtracking) adaugă costuri suplimentare (DFS necesită deplasare fizică ce adaugă costuri). (A)</p> Signup and view all the answers

Ce presupune utilizarea tabelelor cu valori estimate $H[s]$ în algoritmul LRTA*?

<p>Estimarea euristică a costului drumului de la fiecare stare la starea finală și actualizarea acestor estimări pe măsură ce agentul explorează. (C)</p> Signup and view all the answers

Ce condiții garantează că algoritmul LRTA* este complet?

<p>Toate costurile sunt pozitive, există o cale de la orice stare la starea finală, iar funcția euristică este admisibilă. (B)</p> Signup and view all the answers

În contextul funcțiilor euristice utilizate în jocul 8-puzzle, de ce numărul de pătrate care nu sunt în poziția lor finală este o euristică admisibilă?

<p>Pentru ca este mai mic sau egala cu numarul minim de mutari necesare pentru a rezolva puzzle-ul. (C)</p> Signup and view all the answers

Ce reprezintă "pattern databases" (baze de date de șabloane) în contextul euristicii și cum sunt ele utilizate?

<p>O colecție de soluții pre-calculate pentru subprobleme ale problemei originale, utilizate pentru a estima distanța până la starea finală. (A)</p> Signup and view all the answers

Cum se potrivesc algoritmii de căutare locală, cum este Hill Climbing, cu tipurile de probleme care implică satisfacerea constrângerilor (CSP)?

<p>Funcționarii de căutare locală pot fi adaptate pentru a CSP (D)</p> Signup and view all the answers

Cum se poate utiliza abordarea programării dinamice asincrone (ADP) în contextul agentului care rezolvă probleme de căutare?

<p>Folosind iterativ o stimare a costurilor rămase către țintă pornind de la estimări brute. (C)</p> Signup and view all the answers

Ce limitări inerente posedă algoritmul de căutare Hill Climbing, și cum se pot gestiona aceste limitări?

<p>Nefind întotdeauna o gasire a minimului (C)</p> Signup and view all the answers

Cum influențează diametrul spațiului stărilor eficacitatea algoritmului Simulated Annealing, și de ce?

<p>Dacă diametrul spațiului stărilor este relativ scurt (orice stare poate fi atinsă relativ repede). (A)</p> Signup and view all the answers

Ce rol joacă "energia" ca concept în Simulated Annealing, și cum se relaționează aceasta cu procesul de căutare?

<p>Stările au o cantitate specifică de energie, cautand starea cu energie minimă(optimă). (B)</p> Signup and view all the answers

În Beam Search, cum afectează stabilitatea celor B stări menținute în “beam” procesul de căutare ?

<p>Dacă valorile converg in mod optim. (D)</p> Signup and view all the answers

Ce factori influențează eficacitatea algoritmului LRTA*, și cum pot acești factori să afecteze rezultatele?

<p>Acesteia fiind corectă va favoriza soluțiile. (A)</p> Signup and view all the answers

Flashcards

Spațiul stărilor problemei

Reprezentarea problemei printr-un graf al stărilor posibile în procesul de rezolvare.

Căutare

Procesul de identificare a unei soluții dintr-un spațiu de stări, pornind de la o configurație inițială.

Căutare informată

Căutarea folosește informații suplimentare despre calitatea stărilor pentru a ghida procesul de căutare.

Funcții euristice

O căutare asistată de informații euristice despre costul sau distanța până la scop.

Signup and view all the flashcards

Informare

Metodă de prioritizare a vecinilor de explorat dintr-o stare curentă s.

Signup and view all the flashcards

Frontiera / OPEN

Structură pentru nodurile/stările pe care vrem să le vizităm.

Signup and view all the flashcards

Domeniu / CLOSED

Structură pentru nodurile/stările vizitate deja.

Signup and view all the flashcards

BFS (Breadth-First Search)

Algoritm de căutare care explorează pe lățime.

Signup and view all the flashcards

DFS (Depth-First Search)

Algoritm de căutare care explorează în adâncime.

Signup and view all the flashcards

Iterative Deepening

Algoritm ce combină explorarea în adâncime cu o limită, oprindu-se dacă limita este atinsă

Signup and view all the flashcards

Factorul de ramificare

Măsura numărului mediu de opțiuni (stări) generate dintr-o stare tipică.

Signup and view all the flashcards

Adâncimea soluției

Măsura distanței de la starea inițială la starea finală.

Signup and view all the flashcards

Lungime maximă a căii

Lungimea celei mai lungi căi posibile în spațiul de căutare.

Signup and view all the flashcards

Optimalitate

Proprietatea unui algoritm de a găsi soluția optimă.

Signup and view all the flashcards

Completitudine

Proprietatea unui algoritm de a găsi o soluție dacă există.

Signup and view all the flashcards

Best-First Search

Algoritm de căutare informată care minimizează o funcție de cost estimată.

Signup and view all the flashcards

Funcția euristică h(s)

Estimarea costului drumului de la o stare dată la starea finală.

Signup and view all the flashcards

Algoritmul A*

Căutare best-first cu funcția de evaluare f(s) = g(s) + h(s).

Signup and view all the flashcards

Euristică admisibilă

O euristică care nu supraestimează costul real al drumului către scop.

Signup and view all the flashcards

Euristică consistentă

O euristică în care estimarea costului satisface inegalitatea triunghiulară.

Signup and view all the flashcards

Algoritmi A* ponderați

Algoritmi care prioritizează stările apropiate de scop, ajustând influența euristicii.

Signup and view all the flashcards

Memorie limitată

Strategie de căutare care limitează numărul de stări memorate.

Signup and view all the flashcards

Beam Search

Caută doar pe un fascicul de drumuri promițătoare.

Signup and view all the flashcards

IDA*

Algoritmul limitează adâncimea explorării.

Signup and view all the flashcards

Pattern databases

Utilizarea bazelor de date cu funcții euristice pentru subprobleme.

Signup and view all the flashcards

Căutare locală

Strategie de căutare bazată pe starea vecină. Este utilă când spațiul este mare sau memoria este limitată.

Signup and view all the flashcards

Hill Climbing

Strategie de căutare locală ce alege întotdeauna starea vecină care îmbunătățește funcția de evaluare.

Signup and view all the flashcards

Simulated annealing

Se mută și la stări mai proaste pentru a evita blocajele.

Signup and view all the flashcards

Local Beam Search

Combinația Beam Search și mutarea la stările cu probabilitate proporțională cu calitatea stărilor.

Signup and view all the flashcards

Căutarea on-line

Permite luarea deciziilor în timp ce se acționează în mediu.

Signup and view all the flashcards

On-line DFS

Backtracking iterativ unde revenirea înapoi se face tot prin acțiuni.

Signup and view all the flashcards

Asynchronous Dynamic Programming

Adaptarea programării dinamice la căutarea on-line.

Signup and view all the flashcards

Real-time A*

Rezolvarea problemelor prin estimarea costului căilor și actualizarea lor.

Signup and view all the flashcards

Study Notes

  • Voi genera notițe de studiu detaliate din textul furnizat.

Spațiul Stărilor Problemei

  • O metodă de a rezolva o problemă pleacă de la o configurație inițială pentru a obține o soluție cu anumite proprietăți
  • Exemple de astfel de probleme includ labirinturi, satisfacerea restricțiilor, jocuri și construirea unui plan.
  • Reprezentarea implică un graf al stărilor posibile în procesul de rezolvare, unde starea se schimbă prin acțiuni/mutări.
  • O soluție este o cale din starea inițială la cea finală.
  • Spațiul stărilor este un graf care poate fi reprezentat explicit sau implicit.
  • Rezolvarea problemei înseamnă o căutare în acest graf.

Mediul Problemei

  • Mediul problemei poate fi observabil sau parțial observabil, discret sau continuu, finit sau infinit, determinist sau nedeterminist, static sau dinamic.
  • Observabilitatea se referă la perceperea completă a mediului.
  • Caracterul discret/continuu se referă la distincția clară între stări.
  • Finitudinea/infinitudinea se referă la natura grafului de stări.
  • Determinismul/nedeterminismul se referă la consecvența acțiunilor, iar statismul/dinamismul se referă la influența agenților asupra stării mediului.

Căutare

  • Soluția este starea finală sau drumul de la starea inițială la starea finală.
  • Se poate cunoaște sau nu starea inițială.
  • Se poate cunoaște sau nu starea finală dar doar proprietățile ei.
  • Poate interesa drumul către starea finală sau doar starea finală în sine.

Caracteristici ale Strategiilor de Căutare

  • Completitudinea garantează găsirea unei soluții în timp finit, dacă există una.
  • Optimalitatea asigură găsirea celei mai bune soluții într-un timp finit.
  • Complexitatea se referă la dependența de timp și spațiu față de dimensiunea intrărilor.
  • Capacitatea de revenire permite revizitarea stărilor anterioare.
  • Informarea utilizează metode pentru a prioritiza explorarea stărilor.
  • Se pot avea informații despre calitatea stărilor.

Algoritmi de Căutare

  • Pentru grafuri explicit reprezentate, se pot folosi Dijkstra și Bellman-Ford.
  • Pentru grafuri implicit reprezentate, se folosesc căutarea pe lățime/adâncime (BFS/DFS), Iterative Deepening, Backtracking și Bidirectional search.
  • Frontiera/OPEN: structura pentru nodurile/stările ce urmează a fi vizitate.
  • Domeniu/CLOSED: structura pentru nodurile/stările vizitate deja, cărora le-am calculat vecinii.
  • La alegerea unui nod de explorat, sunt calculați vecinii/succesorii săi, accesibili prin acțiuni din starea respectivă.
  • Adâncimea unei stări s (Ad(s)) este lungimea celui mai scurt drum de la starea inițială si până în starea s.
  • Vectorul de părinți p ∈ S × (S ∪ {⊥}) indică părintele unei stări s ca fiind p[s], cu p[s0] = ⊥.
  • Soluția este reprezentată ca o cale de la starea inițială (s0) la starea finală (sf).
  • Funcția cale(s, p) obține calea de la s0 la s.

Algoritmi de Căutare: BFS/DFS

  • BFS/DFS: Algoritmi de căutare în graf.
  • OPEN: Mulțimea nodurilor de vizitat.
  • CLOSED: Mulțimea nodurilor vizitate.
  • Intrare: Starea inițială (si), AdMax (pentru DFS).
  • Ieșire: Soluția sau INSUCCES.
  • Algoritmul extrage primul nod din OPEN.
  • Dacă nodul este deja în CLOSED, se trece la următorul nod.
  • Se calculează succesorii nodului curent.
  • Pentru fiecare succesor, se setează părintele și se verifică dacă este starea finală.
  • Dacă se folosește BFS, succesorii sunt inserați în OPEN la sfârșit.
  • Dacă se folosește DFS, succesorii sunt inserați în OPEN la început.

Algoritmul Iterative Deepening DFS

  • Algoritmul efectuează căutări DFS iterative cu adâncime limitată.
  • Intrare: Starea inițială (s¡).
  • Ieșire: Soluția sau INSUCCES.
  • Se incrementează limita de adâncime (AdMax) de la 0 la infinit.
  • Se apelează DFS cu limita de adâncime curentă.
  • Când funcția DFS returnează o valoare diferită de INSUCCES, acea valoare este întoarsă.

Complexitatea Algoritmilor

  • B este factorul de ramificare al spațiului de căutare.
  • d este adâncimea soluției optime.
  • m este lungimea maximă a unei căi în spațiul de căutare.
  • Un algoritm este complet dacă găsește întotdeauna soluția, dacă aceasta există.
  • Optimitatea se referă la lungimea căii până la soluție.

Căutare Informata

  • Informarea utilizează o funcție w(s, cale) pentru calitatea unei stări s și a drumului din s0 până în s.
  • Scopul e găsirea unei stări cât mai aproape de soluție.
  • Căutarea de tip best-first alege din frontieră starea s cu w(s) minim.

Algoritmul Best-First

  • Intrare: Starea inițială si și funcția w(s, cale).
  • Ieșire: Soluția sau INSUCCES.
  • Algoritmul menține o listă deschisă (OPEN) și una închisă (CLOSED) cu stările vizitate.
  • Se extrage starea s din OPEN cu cea mai mică valoare w(s, cale(s, p)).
  • Dacă s este starea finală, se returnează soluția.
  • Se calculează succesorii stării s.
  • Dacă un succesor sj este în CLOSED sau OPEN și are o valoare w mai mică, se actualizează părintele, starea sj fiind adăugată în OPEN.
  • În caz contrar, starea sj este adăugată în OPEN cu părintele s.

Căutarea Best-First, Cazuri Particulare

  • Best-first cu w(s) = Ad(s) este BFS.
  • Best-first cu w(s) = -Ad(s) este DFS.
  • Best-first cu w(sj) = suma costurilor arcelor este Dijkstra.
  • Best-first cu w(s) = f(s) este A*.

Algoritmul A*

  • În algoritmul A*, starea de explorat este aleasă pe baza funcției f(s) = g(s) + h(s), unde:

    • f(s) este costul total estimat al celui mai bun drum de la starea inițială la o stare finală, trecând prin s.
    • g(s) este costul celui mai bun drum de la starea inițială la s.
    • h(s) este costul estimat al celui mai bun drum de la s la o stare finală.
  • Dacă algoritmul este consistent, atunci g(s) = g*(s) este costul real al celui mai bun drum de la s0 la s.

  • Dacă algoritmul este admisibil, atunci g(s) = g*(s) pentru stările de pe drumul optim către starea finală.

  • Funcția heuristică h(s) estimează h*(s).

Proprietățile Funcției Heuristice h(s)

  • h(s) este admisibilă dacă h(s) este mereu mai mică sau egală cu distanța reală până la scop h*(s).
  • h(sf) = 0, costul până la starea finală e zero.
  • algoritmul A* este admisibil - este garantat că primul drum găsit de la și la este și cel optim (din punct de vedere al costului).
  • Un algoritm A1 este mai informat decât A2 dacă ∀s ∈ S, h1(s) ≥ h2(s).
  • O funcție euristică este consistentă dacă h(s') ≤ h(s'') + cost_arc(s', s'') pentru ∀s', s'' ∈ S.

Admisibilitatea funcției h

  • h (s) ≤ h* (s) - (h este o euristică optimistă).
  • h (sf) = 0.
  • funct ,ia h (s) este admisibilă, s ,i cost (s′, s″) > 0, ∀s′, s″ ∈ S.
  • algoritmul A* este admisibil garantat că primul drum găsit de la si la sf este s, i cel optim (din punct de vedere al costului).

Algoritmul A*: Intrare și Ieșire

  • Intrare: si, functia h(s).
  • Ies, ire: solut ,ia, sau I NSUCCES.
  • H[sprev ] ← minb∈actiuni(sprev ){c(sprev ,s') + H[s']
  • Dacă există s' = Rezultat[sprev , b], altfel h(sprev ).

Algoritmi A* și Variații

  • A* este mai eficient dacă este folosită o euristică mai bine informată.
  • Dacă h(s) = 0, ∀s ∈ S, A* devine Dijkstra.
  • Un algoritm A* este ponderat dacă favorizează euristica.
  • Algoritmițele A* ponderate va favoriza stările (estimate ca fiind) mai apropiate de scop.
  • O funcție h este ɛ-admisibilă,algoritmul găsește o soluție cu cel mult ɛ peste optim.

Memorie Limitată în Algoritmii de Căutare

  • A* poate necesita o cantitate mare de memorie.
  • Strategii care explorează un număr mai mic de stări: Beam search, Iterative deepening A* (IDA*), Memory-bound A* (MA*), Simplified MA* (SMA*).
  • Combină BFS cu o abordare greedy folosind o euristică.
  • Se păstrează în frontieră doar un număr limitat de stări (B).
  • Se adaugă succesorii la frontieră.
  • Apoi se selectează cele mai bune stări din frontieră menținânduse limita B.
  • B este lățimea fasciculului.
  • Algoritmul nu este optimal sau complet, dar este utilizat în traducerea automată.
  • Poate deveni complet dacă este combinat cu DFS, beam stack search sau limited discrepancy search.
  • Primeste ca input: starea de inceput (start), latimea benzii (B), functia euristica (h), limita de iteratii (limita)
  • Initializeaza: setul de stari curente (beam) cu starea de inceput si setul de stari vizitate (vizitat) tot cu starea de inceput
  • Algoritmul continua atata timp cat exista stari in beam si numarul de stari vizitate e mai mic decat limita impusa
  • Calculeaza succesorii pentru fiecare stare din beam si ii adauga in setul succ
  • Daca exista un succesor care e stare finala, algoritmul s-a terminat cu succes
  • Altfel, selecteaza cele mai bune B stari din succ, pe baza functiei euristice h
  • Aceste stari selectate sunt adaugate in setul de stari vizitate si devin noul set de stari curente (beam)

IDA

  • Combină ID-DFS cu A*, limitând adâncimea explorării.
  • Explorarea se face doar până la o adâncime fixată, initial f (s0).
  • Când această limită este atinsă, se extinde până la f (s*), cu s* cea mai bună stare găsită până acum.
  • Algoritmul explorează mai mult în direcția soluției decât DFS.
  • Consumă mai puțină memorie decât A*, nu menține structurile OPEN și CLOSED.

Căutare Locală

  • Se bazează pe mutarea dintr-o stare curentă într-o stare vecină utilă când spațiul de căutare este mare sau memoria este limitată.
  • Se concentrează pe starea finală, nu pe drumul până la soluție.
  • E folosită în probleme de tip CSP.

Algoritmul Hill Climbing (HC)

  • Alege întotdeauna o stare vecină pentru care funcția de evaluare este mai bună.
  • Algoritmul se oprește dacă atinge o stare finală sau nu găsește o stare vecină mai bună.
  • Acesta poate fi implementat cu first-choice sau steepest ascent.
  • Alte variante de Hill Climbing: stochastic HC (alegere aleatorie), first-choice HC (alegere primul cu eval mai bun).
  • Hill climbing găsește soluția doar dacă funcția eval este convexă pe spațiul stărilor.
  • Problema celor 8 regine e un exemplu.

Probleme ale Hill Climbing

  • Poate rămâne blocat în maxime locale.
  • Nu poate trece de platouri.

Random Restart Hill Climbing

  • Se repetă Hill Climbing de mai multe ori(N) cu stări inițiale aleatorii.
  • Dacă HC are o probabilitate de reușită p, se poate alege N = 1/p.

Simulated Annealing

  • Inspirat de procesul de călire din metalurgie.
  • Se consideră că stările au o anumită energie.
  • Se caută starea de energie minimă globală.
  • Se poate merge într-o stare vecină mai proastă cu o anumită probabilitate.
  • Probabilitatea de a alege o stare mai proastă scade pe măsură ce algoritmul progresează.
  • Pentru generarea succesorilor, este util ca stările să fie de energie apropiată cu starea curentă.

Vulnerabilități

  • Algoritmul este vulnerabil la seturi mari de stări cu energie foarte mică față de vecinii lor, dar nu global minimă (spații de stări numite "bazine").
  • Se pot folosi reporniri - reveniri la stări de energie mică obținute în trecut, dacă au trecut un număr de pași în stări cu energie semnificativ mai mare decât minima găsită.
  • Graful stărilor trebuie să aibă un diametru redus.
  • Se începe cu B stări generate aleator.
  • Stochastic Local Beam Search – alege stochastic cele B stări de păstrat în beam , cu o probabilitate proporțională cu calitatea stărilor ajută la evitarea maximelor locale.

Căutarea în Spații Continue

  • Discretizarea spațiului.
  • Realizarea de mutări cu un pas fix (sau cu un pas preogresiv mai mic).
  • O problemă suplimentară apare când există "culmi" (ridges) nealiniate cu una dintre axe.
  • Pentru urmat directia cu cel mai mare beneficiu se poate deriva local functia de evaluare.

Căutarea OnLine vs. OffLine

  • Agentul are acces la informații în timpul căutării
  • Căutarea "off-line": agentul are acces la toate stările problemei.
  • Căutarea "on-line": agentul poate alege ca stare următoare doar o stare vecină cu starea curentă.

Particularitățile Căutării On-Line

  • Într-o problemă de căutare online, Hill Climbing nu poate fi folosit în conjuncție cu Random Restart.
  • Simulated Annealing funcționează doar dacă alege_succesor alege o stare vecină.
  • BFS nu se poate aplica.
  • La DFS, revenirea aduce un cost.
  • La A*, nu putem alege orice nod pentru a fi explorat la următoarea iterație.

Căutarea On-Line: On-Line DFS

  • Varianta de backtracking iterativ unde revenirea se face tot prin acțiuni care trebuie realizate în mediu.
  • Utilizează tabele pentru a memora rezultatele acțiunilor întreprinse deja:

Căutarea On-Line: Asynchronous Dynamic Programming (ADP)

  • Se lucrează prin obținerea soluției la diverse sub-probleme.
  • Se poate obține drumul optim dacă am cunoas, te h pentru fiecare nod.
  • Putem actualiza asincron estimarea h[s] pentru fiecare stare astfel.
  • ADP e baza pentru Real-time A*.
  • Obținem convergență pentru costuri pozitive.
  • Este nepractică spațiile de stări mari.

Căutare On-Line: Real-time A* (LRTA*)

  • Folosește o tabelă cu valorile estimate H[s] pentru fiecare stare.
  • Actualizăm valorile pe măsură ce explorăm.
  • Trebuie să considerăm costul pentru orice revenire.
  • Revenim doar dacă costul estimat pe calea curentă depășește costul implicat de revenire.
  • LRTA* se apropie de soluția optimă la parcurgeri succesive.
  • Este completă dacă avem: toate costurile pozitive, există o cale de la orice stare la starea finală și funcția h este admisibilă.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser