Podcast
Questions and Answers
Care este exemplul de clasificare multiclasă prezentat în conținut?
Care este exemplul de clasificare multiclasă prezentat în conținut?
- Clasificarea animalelor în funcție de culoarea blănii
- Clasificarea automobilelor în funcție de marcă
- Clasificarea produselor alimentare în funcție de preț
- Clasificarea animalelor ca fiind reptile sau nu, pe baza unor caracteristici (correct)
Care caracteristici sunt folosite pentru a clasifica animalele în exemplul dat?
Care caracteristici sunt folosite pentru a clasifica animalele în exemplul dat?
- Depune ouă, are solzi, este cu sânge rece, otrăvitor, numărul de picioare (correct)
- Tipul de hrană, habitatul, comportamentul
- Culoarea blănii, greutatea, dimensiunea
- Numărul de aripioare, prezența branhiilor, dimensiunea aripilor
Care animal este clasificat ca Reptilă?
Care animal este clasificat ca Reptilă?
- Câine
- Rață
- Cobra (correct)
- Fluture
Care din următoarele caracteristici nu este prezentă la Cobra?
Care din următoarele caracteristici nu este prezentă la Cobra?
Care animal are picioare?
Care animal are picioare?
Ce algoritm este folosit pentru a realiza clasificarea multiclasă?
Ce algoritm este folosit pentru a realiza clasificarea multiclasă?
Care dintre următoarele afirmații este adevărată în legătură cu Boa Constrictor?
Care dintre următoarele afirmații este adevărată în legătură cu Boa Constrictor?
Ce caracteristici sunt folosite pentru a identifica o reptilă?
Ce caracteristici sunt folosite pentru a identifica o reptilă?
Ce implică regularizarea funcţiei cost?
Ce implică regularizarea funcţiei cost?
Ce se întâmplă dacă parametrul de penalizare λ este prea mare?
Ce se întâmplă dacă parametrul de penalizare λ este prea mare?
Cum influențează gradul polinomului hθ (x) complexitatea modelului?
Cum influențează gradul polinomului hθ (x) complexitatea modelului?
Ce se întâmplă dacă λ este prea mic?
Ce se întâmplă dacă λ este prea mic?
Ce rol joacă parametrul θ0 în regularizare?
Ce rol joacă parametrul θ0 în regularizare?
Ce caracteristică lipsește la Piton în comparație cu Dart Frog?
Ce caracteristică lipsește la Piton în comparație cu Dart Frog?
Care dintre aceste animale are un număr de picioare diferit față de celelalte?
Care dintre aceste animale are un număr de picioare diferit față de celelalte?
Pe ce bază nu putem distinge între un Piton și un Somon?
Pe ce bază nu putem distinge între un Piton și un Somon?
Care este eticheta corectă pentru Somon bazându-ne pe caracteristicile date?
Care este eticheta corectă pentru Somon bazându-ne pe caracteristicile date?
Ce caracteristică comună au Pitonul și Somonul?
Ce caracteristică comună au Pitonul și Somonul?
Ce tip de animal este Dart Frog conform caracteristicilor prezentate?
Ce tip de animal este Dart Frog conform caracteristicilor prezentate?
Care dintre afirmațiile de mai jos este adevărată despre Piton?
Care dintre afirmațiile de mai jos este adevărată despre Piton?
Care afirmație este incorectă cu privire la piton și somon?
Care afirmație este incorectă cu privire la piton și somon?
Care dintre următoarele expresii reprezintă probabilitatea ca ieșirea y, condiționată de instanța x, parametrizată de θ, să fie 1?
Care dintre următoarele expresii reprezintă probabilitatea ca ieșirea y, condiționată de instanța x, parametrizată de θ, să fie 1?
În ce interval se află probabilitatea ca ieșirea y, condiționată de instanța x, parametrizată de θ, să fie 1?
În ce interval se află probabilitatea ca ieșirea y, condiționată de instanța x, parametrizată de θ, să fie 1?
Care dintre următoarele expresii reprezintă funcția de verosimilitate?
Care dintre următoarele expresii reprezintă funcția de verosimilitate?
Ce este ℓ(θ)?
Ce este ℓ(θ)?
Care este scopul utilizării gradientului ascendent în regresia logistică?
Care este scopul utilizării gradientului ascendent în regresia logistică?
Ce reprezintă θ în contextul regresiei logistice?
Ce reprezintă θ în contextul regresiei logistice?
Care este regula de actualizare a parametrilor θ în gradientul ascendent?
Care este regula de actualizare a parametrilor θ în gradientul ascendent?
Conform textului, ce se poate spune despre funcția ℓ(θ)?
Conform textului, ce se poate spune despre funcția ℓ(θ)?
Ce reprezintă $y(i)$ în contextul clasificatorului cu margine optimală?
Ce reprezintă $y(i)$ în contextul clasificatorului cu margine optimală?
Ce indică constrângerea $y(i) (w^T x(i) + b)
eq γ∥w∥$?
Ce indică constrângerea $y(i) (w^T x(i) + b) eq γ∥w∥$?
Care este dificultatea principală a problemei de optimizare declarate în contextul algoritmilor cu vectori suport?
Care este dificultatea principală a problemei de optimizare declarate în contextul algoritmilor cu vectori suport?
Cum influenţează mărimea vectorului $w$ constrângerea din problema de optimizare?
Cum influenţează mărimea vectorului $w$ constrângerea din problema de optimizare?
Ce reprezintă norma Euclidiană a vectorului $w$?
Ce reprezintă norma Euclidiană a vectorului $w$?
De ce este preferată o constrângere liniară în locul uneia neliniare?
De ce este preferată o constrângere liniară în locul uneia neliniare?
Care este rolul termenului de bias $b$ în clasificatorul cu margine optimală?
Care este rolul termenului de bias $b$ în clasificatorul cu margine optimală?
Ce problemă apare în optimizarea marginii datorită interacțiunii dintre $w$ și $γ$?
Ce problemă apare în optimizarea marginii datorită interacțiunii dintre $w$ și $γ$?
De ce este o constrângere de inegalitate neconvexă?
De ce este o constrângere de inegalitate neconvexă?
Care este definiția unei funcții convexe?
Care este definiția unei funcții convexe?
Ce reprezintă o mulțime convexă?
Ce reprezintă o mulțime convexă?
Care este problematică principală a optimizării neconvexe?
Care este problematică principală a optimizării neconvexe?
Ce se realizează prin normalizarea vectorului w în contextul clasificatorului cu margine optimă?
Ce se realizează prin normalizarea vectorului w în contextul clasificatorului cu margine optimă?
Cum influențează funcția normă asupra constrângerii γ · ∥w∥ ≤ y(i)?
Cum influențează funcția normă asupra constrângerii γ · ∥w∥ ≤ y(i)?
Ce algoritmi sunt utilizați pentru a aborda problemele de optimizare neconvexă?
Ce algoritmi sunt utilizați pentru a aborda problemele de optimizare neconvexă?
De ce este importantă optimizarea în contextul clasificatorilor cu margine optimă?
De ce este importantă optimizarea în contextul clasificatorilor cu margine optimă?
Flashcards
Regresie logistică
Regresie logistică
Un model statistic ce estimează probabilitatea ca o ieșire binară să fie 1.
hθ(x)
hθ(x)
Funcția logistică care estimază P(y=1|x;θ).
Funcția de verosimilitate
Funcția de verosimilitate
O funcție care calculează probabilitatea datelor observate sub un model statistic.
Estimation of Maximum Likelihood
Estimation of Maximum Likelihood
Signup and view all the flashcards
λ(θ)
λ(θ)
Signup and view all the flashcards
Gradientul ascendent
Gradientul ascendent
Signup and view all the flashcards
Maximul global
Maximul global
Signup and view all the flashcards
Formă normală
Formă normală
Signup and view all the flashcards
Clasificare multiclasă
Clasificare multiclasă
Signup and view all the flashcards
Caracteristici cheie
Caracteristici cheie
Signup and view all the flashcards
Reptile
Reptile
Signup and view all the flashcards
Cobra
Cobra
Signup and view all the flashcards
Rattlesnake
Rattlesnake
Signup and view all the flashcards
Boa Constrictor
Boa Constrictor
Signup and view all the flashcards
Otrăvitor
Otrăvitor
Signup and view all the flashcards
Număr de picioare
Număr de picioare
Signup and view all the flashcards
Regularizare
Regularizare
Signup and view all the flashcards
Overfitting
Overfitting
Signup and view all the flashcards
Coeficientul λ
Coeficientul λ
Signup and view all the flashcards
Funcția cost penalizată
Funcția cost penalizată
Signup and view all the flashcards
Underfitting
Underfitting
Signup and view all the flashcards
Provocări în clasificare
Provocări în clasificare
Signup and view all the flashcards
Piton
Piton
Signup and view all the flashcards
Somon
Somon
Signup and view all the flashcards
Dart Frog
Dart Frog
Signup and view all the flashcards
Caracteristici ale animalelor
Caracteristici ale animalelor
Signup and view all the flashcards
Dificultate de clasificare
Dificultate de clasificare
Signup and view all the flashcards
Eticheta animalelor
Eticheta animalelor
Signup and view all the flashcards
Clasificator cu margine optimală
Clasificator cu margine optimală
Signup and view all the flashcards
Norma Euclidiană
Norma Euclidiană
Signup and view all the flashcards
Constrângerea optimizării
Constrângerea optimizării
Signup and view all the flashcards
Nelinearitate în optimizare
Nelinearitate în optimizare
Signup and view all the flashcards
Scalarea vectorului w
Scalarea vectorului w
Signup and view all the flashcards
Parametrii modelului (w, b)
Parametrii modelului (w, b)
Signup and view all the flashcards
Problema de optimizare
Problema de optimizare
Signup and view all the flashcards
Marjă consistentă față de hiperplan
Marjă consistentă față de hiperplan
Signup and view all the flashcards
Neconvexitate
Neconvexitate
Signup and view all the flashcards
Funcție convexă
Funcție convexă
Signup and view all the flashcards
Mulțime convexă
Mulțime convexă
Signup and view all the flashcards
Margine funcțională
Margine funcțională
Signup and view all the flashcards
Normalizare
Normalizare
Signup and view all the flashcards
Maximizare γ/∥w∥
Maximizare γ/∥w∥
Signup and view all the flashcards
Probleme neconvexe
Probleme neconvexe
Signup and view all the flashcards
Proprietăți de optimizare convexă
Proprietăți de optimizare convexă
Signup and view all the flashcards
Study Notes
Curs 1. Introducere
- Tehnicile de învățare automată sunt utilizate pentru a învăța un calculator prin input disponibil
- Învățarea presupune conversia experienței în expertiză sau cunoștințe
- Inputul unui algoritm de învățare sunt datele de antrenare (experiența)
- Outputul este expertiza, sub formă de program care realizează sarcini specifice
- Învățarea automată este domeniul care dă calculatoarelor abilitate de a învăța fără a fi programate explicit.
- Problemă de învățare „bine-pusă”: un program învață din experiență (E) raportată la o sarcină (T) și o măsură de performanță (P), dacă performanța (P) la sarcină (T) măsurată se îmbunătățește odată cu experiența (E).
Cuprins
- Generalități
- Tematică și definiții
- Ce este învățarea?
- Utilitate
- Tipuri de învățare
- Algoritm de învățare
- Învățare supervizată
Exemplu
- Program ce monitorizează mail-urile ca spam și învață să le filtreze
- Sarcina: clasificarea mail-urilor ca spam sau non-spam.
- Experiența: etichetarea mail-urilor ca spam sau non-spam.
- Măsura performanței: numărul (sau procentul) de mail-uri corect clasificate ca spam/non-spam.
Ce este învățarea?
- Şobolanii învață să evite mâncarea otrăvită.
- consumul ulterior depinde de gust și de efectele fiziologice
- dacă hrana produce stări de rău, consumul ulterior va fi evitat.
Raționament inductiv
- Abilitatea de a eticheta mail-urile pe care algoritmul nu le-a mai întâlnit.
- Un algoritm de învățare de succes ar trebui să poată generaliza mai larg.
Superstiția porumbeilor
- Experiment cu porumbei care primesc hrană la intervale fixe de timp.
- A fost observat un comportament de asociere, neexistând o relație cauzala.
Overfitting vs. underfitting
- Overfitting: Modelul învață prea bine detaliile și particularitățile datelor de antrenament, inclusiv zgomotul și anomaliile.
- Underfitting: Modelul este prea simplu pentru a surprinde tiparele datelor.
Utilitate
- Complexitatea problemei
- Sarcini realizate de oameni/animale.
- Sarcini ce depășesc capacitatea umană.
- Nevoia de adaptabilitate
Tipuri de învățare
- Taxonomia paradigmelor de învăţare.
- Învăţare activă vs. pasivă.
- Ajutorul de la instructor
Lot de antrenament vs. învățare online
- Entitatea care învață trebuie să folosească expertiza pe parcursul antrenamentului.
- Entitatea care învață folosește expertiza acumulată abia după ce a procesat un volum mare de date.
Învăţare supervizată vs. nesupervizată
- Supervizată: Experiența conţine informații semnificative absente din exemplele de test
- Nesupervizată: Nu există distincție între datele de antrenament și cele de test.
Componentele unui algoritm de învățare
- Modelul
- Evaluare performanței
- Optimizare
Regresie liniară
- Reprezentarea ipotezei
- Evaluarea performanței
- Optimizarea parametrilor
Regresie logistică
- Evitarea utilizării regresiei liniare
- Valoarea lui y poate fi 0 sau 1
- Funcția sigmoid
- Funcția logistică
Funcția sigmoid
- Reprezentarea grafică a funcției
Asumpții și notații
- Probabilitatea ca ieșirea y, codiționată de instanța x, parametrizată de 0, să fie 1
- Probabilitatea ca ieșirea y, codiționată de instanța x, parametrizată de 0, să fie 0
Estimarea verosimilității maxime
- Maximizarea unei funcții de verosimilitate.
Clasificarea multi-clasă
- Considerăm o problemă de clasificare în care variabila răspuns y poate lua k valori, y ∈ {1, 2, . . ., k}.
- Eticheta este tot discretă, dar poate lua mai mult de două valori.
- Modelăm y ca fiind distribuită în acord cu o distribție multinomială.
- Folosim funcția softmax.
Algoritm de învățare cu perceptron
- Importanță mai degrabă istorică.
- Funcția de decizie
- Actualizarea parametrilor
Provocări ale clasificării
- Dificultatea de a separa clasele.
Probleme de optimizare
- Dificultatea de a găsi soluții optimale.
Recapitulare
- Clasificarea eficientă depinde de alegerea caracteristicilor potrivite.
- Modelul rafinat îmbunătățește acuratețea în identificarea reptilelor.
Curs 4. Overfitting. Regularizarea funcției cost
- Overfitting, care înseamnă că un model devine prea specific pentru setul de date pe care a fost antrenat, nefiind capabil să generalizeze bine pentru date noi.
- Regularizarea funcției cost, care este o abordare pentru reducerea acestui fenomen prin penalizarea coeficienților funcției cost.
Algoritmi cu vectori suport. Support vector machines
- SVM sunt considerați printre cei mai buni algoritmi
- Se mapează setul de caracteristici
- Problema reformulată în noul spațiu de caracteristici
Clasificatori cu margine optimală
- Clasificarea binară
- Corectitudinea și siguranța predicției
Margine geometrică
- Clasificator liniar care separă clasele
- Ne interesează distanțele
Margine funcțională
- Măsoară gradul de încredere cu care se realizează fiecare predicție
Problema de optim
- Scopul este maximizarea marginii geometrice
Convexitate
- O funcție f: R n → IR este convexă dacă
- O mulțime C ∈ R n este convexă dacă
Problema de optimizare duală
- Rescriem problema de optimizare
- Se rezolvă problema de optim și se obțin coeficienții
Funcții kernel
- Scriem algoritmul în termenii produsului scalar
- Considerăm un operator K
Exemple de funcții kernel
- Demonstrăm că funcția kernel
- Demonstrăm că funcția kernel
Proprietăți ale funcţiilor kernel
- Algoritmi nu au nevoie
- Trebuie doar să asigurăm
- Ce fel de funcții K(, ) pot corespude unei anume aplicații Φ?
- Măsura similarității
- Alegem funcția kernel
SVM cu margine nestrictă
- Lagrangianul
Clasificarea multi-clasă
- considerăm o problemă
- eticheta este tot discretă
Rețele neuronale
- Rețea cu mai multe straturi de neuroni
- Neuronii care nu sunt interconectați
- Un strat este un cluster
- Stratul cel mai apropiat de date
Ecuații de propagare
- Propagarea informației în reţea
- Stratul 1
- Stratul 2
Optimizarea parametrilor
- Parametri de optimizat
- Funcția obiectiv
- Actualizarea parametrilor
Propagarea înapoi
- Derivarea este o operație liniară
- Explicităm acești factori
Adaptarea rețelelor
- Normalizarea intrărilor
- Datele de intrare se centrează
- Rețeaua se va satura mai greu
Curs 11. Rețele neuronale convoluționale
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.