Apprendimento Statistico - Note sul Corso

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Qual è la funzione principale di un classificatore nel contesto descritto?

Migliorare la qualità delle istanze in campione
Assegnare correttamente un oggetto a una classe (correct)
Determinare casualmente la classe di appartenenza
Ottimizzare le features osservate

Cosa misura la Loss 0/1 nel contesto della classificazione?

Il miglioramento del classificatore nel tempo
Il numero totale di classi presenti
La perdita ogni volta che una previsione è incorretta (correct)
La distanza tra le classi predette e quelle reali

Qual è l'obiettivo quando si parla di minimizzare la funzione di perdita?

Ridurre le features utilizzate
Aumentare il numero di classi da classificare
Ottimizzare il tempo di elaborazione del classificatore
Migliorare la previsione delle classi attribuite (correct)

In che modo la qualità di un classificatore dipende dalla Loss?

Dipende dalla distribuzione delle Loss e dall'incertezza di Y e X (A) Signup and view all the answers

Cosa rappresenta l'Expected Prediction Error (EPE) in questo contesto?

Il valore atteso della Loss che misura l'accuratezza previsionale (A) Signup and view all the answers

Quale dei seguenti paradigmi è tipico del Machine Learning?

Par. predittivo (C) Signup and view all the answers

Nel contesto della classificazione, cosa rappresentano convenzionalmente le classi 0 e 1?

Positivi e negativi (A) Signup and view all the answers

Quale delle seguenti non è considerata una fonte di conoscenza nel processo di Machine Learning?

Knowledge empirica (C) Signup and view all the answers

Nel problema di classificazione, quale tipo di variabile si prevede?

Variabile categoriale (A) Signup and view all the answers

Qual è il principale obiettivo dell'approccio esplicativo nel Machine Learning?

Comprendere le relazioni tra le variabili (B) Signup and view all the answers

Quale metodo di clustering utilizza iterazioni per migliorare il risultato finale?

K-Means Clustering (C) Signup and view all the answers

Quale delle seguenti affermazioni sul Domain-dependent Knowledge è corretta?

Fornisce visioni generali sul problema (C) Signup and view all the answers

Quale metodo di clustering gerarchico considera la distanza massima tra i punti?

Complete Linkage (D) Signup and view all the answers

Qual è la principale caratteristica della Linear Discriminant Analysis (LDA)?

Maximizza la distanza tra le medie delle classi. (C) Signup and view all the answers

Quale metodo è caratterizzato da un approccio non parametrico nella classificazione?

k-Nearest Neighbours (D) Signup and view all the answers

Qual è l'obiettivo principale della Cross Validation nella selezione del modello?

Valutare la performance del modello su dati non visti. (D) Signup and view all the answers

Qual è la principale differenza tra PCA e LDA?

PCA riduce la dimensionalità basandosi sulla varianza, LDA sui confini delle classi. (D) Signup and view all the answers

Quale metrica è tipicamente utilizzata per il trade-off tra sensibilità e specificità in modelli di classificazione?

Curva ROC (D) Signup and view all the answers

Qual è la funzione principale della distanza di Mahalanobis?

Determinare la distanza tra punti considerando la correlazione tra le variabili. (C) Signup and view all the answers

Cosa si intende per riduzione della dimensionalità mediante PCA?

Mantenere solo le componenti principali che spiegano la maggior parte della varianza. (C) Signup and view all the answers

Quale affermazione riguardante il Quadratic Discriminant Analysis (QDA) è vera?

Intrinsecamente più flessibile di LDA poiché modella le covarianze. (D) Signup and view all the answers

Qual è il concetto centrale del classificatore ottimale di Bayes?

Minimizzare il rischio totale atteso (D) Signup and view all the answers

Quale delle seguenti affermazioni descrive meglio un modello Bernoulliano-logistico?

È utile nel contesto di problemi di classificazione binaria (C) Signup and view all the answers

Quale assunzione è fondamentale nel modello Bernoulliano-logistico per garantire la validità della stima di $β̂$?

L'assenza di multicollinearità tra le variabili predittive (D) Signup and view all the answers

Qual è la funzione di attivazione utilizzata in un modello di regressione logistica?

Funzione logistica (sigmoide) (C) Signup and view all the answers

In un problema di regressione logistica multiclass, quale metodo è utilizzato per affrontare la classificazione One vs All?

Costruzione di classificatori binari per ogni classe (D) Signup and view all the answers

Qual è la principale differenza tra il modello sferico e quello diagonale in un contesto di variabili casuali multivariate?

Il modello sferico non considera la correlazione, il diagonale sì (C) Signup and view all the answers

Quale affermazione è vera riguardo alla linearità della decision boundary in classificazione?

La linearità della decision boundary dipende dal modello scelto e dai dati (B) Signup and view all the answers

Qual è la definizione corretta di errore rate in-sample?

La percentuale di errori commessi sulla stessa porzione di dati utilizzata per l'allenamento (A) Signup and view all the answers

Qual è il valore atteso del rischio condizionato di un classificatore ottimale di Bayes?

E[L(Y, Y ∗ (X))] = E[min{η(X), 1 − η(X)}] (B) Signup and view all the answers

In che condizioni si ha Y ∗ = 0?

Quando η(X) < 1/2 (C) Signup and view all the answers

Quale tra le seguenti espressioni rappresenta il rischio incondizionato?

E[L(Y, Y ∗ (X))] (B) Signup and view all the answers

Come si calcola l'error rate ottimale globale?

Utilizzando E[L(Y, Y ∗ (X))] (C) Signup and view all the answers

Che cos'è η(X) nella discussione del rischio?

La probabilità condizionata di Y = 1 dato X (A) Signup and view all the answers

In un problema multiclass, dove si trova il classificatore ottimale di Bayes?

In corrispondenza di Y ∗ (X) = argmax η(Y)(X) (C) Signup and view all the answers

Qual è l'espressione corretta per calcolare E[L(Y, Y ∗ )|X]?

η(X)I{Y ∗ (X) = 0} + [1 − η(X)]I{Y ∗ (X) = 1} (D) Signup and view all the answers

Cosa indica un error rate di tipo 0/1?

La probabilità di classificazione errata (A) Signup and view all the answers

Qual è la condizione necessaria affinché il classificatore Y* sia considerato ottimale?

E[L(Y, Y*(x))| X = x] deve essere minore o uguale a E[L(Y, Ŷ (x))| X = x] per ogni x. (A) Signup and view all the answers

Cosa rappresentano le probabilità posteriori P(Y = 1|X) e P(Y = 0|X) nel contesto del classificatore bayesiano?

Probabilità che un'osservazione appartenga a una data classe dato X. (D) Signup and view all the answers

Qual è la definizione di Error MCR nel contesto dei classificatori?

Il numero di punti misclassificati in rapporto ai punti di tutte le classi. (C) Signup and view all the answers

Qual è il valore critico di η(X) che determina l'assegnazione di classe nel classificatore bayesiano?

0.5, poiché se η(X) < 0.5 si assegna 0, altrimenti 1. (D) Signup and view all the answers

Che cosa indica la frontiera di decisione nel contesto di un classificatore?

La linea di separazione che divide i classi positive da quelle negative. (C) Signup and view all the answers

Qual è il principale vantaggio del Classificatore Ottimale di Bayes?

Ottimizza il rischio atteso localmente e quindi globalmente. (D) Signup and view all the answers

Qual è la rappresentazione della Loss nel caso di un classificatore?

Indica il costo associato alla classificazione errata tra classi. (A) Signup and view all the answers

In che modo la legge dei valori attesi iterati influisce sul classificatore Y*?

Assicura che Y* minimizza il rischio condizionato per ogni punto x. (C) Signup and view all the answers

Flashcards

Classificatore

Un classificatore è una funzione che assegna un'etichetta di classe a un oggetto in base alle sue caratteristiche osservate. In altre parole, si cerca di determinare a quale categoria un oggetto appartiene.

Loss

La Loss è una funzione che misura la differenza tra la previsione fatta dal classificatore e la classe reale dell'oggetto. Maggiore è la differenza, maggiore è la perdita.

Loss 0/1

La Loss 0/1 è una funzione che restituisce 1 se la previsione del classificatore è errata e 0 se la previsione è corretta. In sostanza, conta il numero di errori del classificatore.

Expected Prediction Error (EP E)

L'Expected Prediction Error (EP E) è il valore atteso della Loss. Rappresenta la qualità complessiva del classificatore, tenendo conto della distribuzione delle possibili perdite.