Machine Learning: KNN e LDA

Podcast

Play an AI-generated podcast conversation about this lesson

Download our mobile app to listen on the go

Get App

Questions and Answers

Quali sono i principali vantaggi del metodo KNN?

Riduce il bias e si adatta bene ai confini decisionali non lineari. (correct)
È un metodo semplice da implementare e comprendere. (correct)
Ha una bassa varianza, il che lo rende robusto all'overfitting.
È un algoritmo parametrico, il che lo rende flessibile per diverse forme di dati.

Quale tra questi è uno svantaggio significativo dell'algoritmo KNN?

Non è in grado di gestire dati con un numero elevato di attributi.
È un metodo computazionalmente impegnativo, soprattutto con set di dati grandi.
L'algoritmo è sensibile alla presenza di outliers nel dataset.
Richiede una grande quantità di dati per funzionare correttamente. (correct)

Cosa succede se il numero di predittori $p$ è molto grande rispetto al numero di osservazioni $n$ nell'algoritmo KNN?

L'algoritmo diventa più preciso e affidabile.
L'algoritmo diventa più resistente all'overfitting.
L'algoritmo diventa più sensibile al rumore dei dati. (correct)
L'algoritmo diventa più efficiente in termini di tempo di calcolo.

Quale di queste condizioni è essenziale per l'applicabilità dell'Analisi Discriminante Lineare (LDA)?

Le matrici di varianza-covarianza dei gruppi devono essere uguali tra loro. (A)

Signup and view all the answers

Quale è il principale obiettivo dell'Analisi Discriminante di Fisher (FDA)?

Trovare una rappresentazione dei dati che massimizzi l'informazione discriminante per la classe. (D)

Signup and view all the answers

Quale formula rappresenta la probabilità a posteriori per l'osservazione i nel Naive Bayes?

𝑃(𝜔𝑗 |𝑥𝑖 ) ∝ 𝑃(𝑥1𝑖 |𝜔𝑗 ) ∗ 𝑃(𝑥2𝑖 |𝜔𝑗 ) ∗ 𝑃(𝑥3𝑖 |𝜔𝑗 )𝜋𝑗 (A)

Signup and view all the answers

Come vengono gestiti i dati mancanti per gli input categorici (x) nel Naive Bayes?

L'osservazione con valori mancanti viene esclusa dal calcolo delle frequenze. (C)

Signup and view all the answers

Cosa si intende per 'stime delle densità fk(x)' nell'ambito dell'LDA?

La densità di probabilità della variabile indipendente x nella classe k. (A)

Signup and view all the answers

Quale tipo di analisi è utilizzata per ottenere la migliore discriminazione possibile tra i gruppi nell'LDA?

Analisi discriminante lineare (LDA) (D)

Signup and view all the answers

Quale tecnica viene utilizzata per gestire il problema della frequenza zero nel Naive Bayes?

Correzione di Laplace/smoothing (D)

Signup and view all the answers

Se un input ha un conteggio pari a 0, quale problema si presenta nel Naive Bayes?

Stima della probabilità condizionata impossibile. (C)

Signup and view all the answers

Cosa si intende per 'priors uguali' nel contesto dell'esempio di LDA con un input e un target binario presentato nel testo?

La probabilità a priori di appartenere a una classe è la stessa per entrambe le classi. (C)

Signup and view all the answers

Come viene gestito il problema dei dati mancanti per gli input continui nel Naive Bayes?

Non viene gestito, si procede direttamente alla classificazione. (B)

Signup and view all the answers

Quale tra queste affermazioni riguardo al Naive Bayes è corretta?

Il Naive Bayes è un algoritmo di classificazione supervisionato. (D)

Signup and view all the answers

Nel caso di un'osservazione con un input mancante, quale parte della formula per calcolare la probabilità a posteriori viene omessa nel Naive Bayes?

La probabilità condizionata dell'attributo con il valore mancante. (B)

Signup and view all the answers

Quale tra queste è una delle principali limitazioni del Naive Bayes?

Assume l'indipendenza condizionale tra gli attributi. (C)

Signup and view all the answers

Quale delle seguenti affermazioni è corretta riguardo alla statistica tradizionale?

È un approccio verification-driven, che si basa sulla formulazione di ipotesi da verificare con un modello. (B)

Signup and view all the answers

Quale delle seguenti affermazioni definisce correttamente il Machine Learning (ML)?

È un processo che utilizza metodi computazionali per apprendere dai dati senza modelli predefiniti. (A)

Signup and view all the answers

Cosa distingue l'apprendimento non supervisionato dall'apprendimento supervisionato nel Machine Learning?

L'apprendimento non supervisionato si basa solo sui dati di input per raggruppare e interpretare i dati, mentre l'apprendimento supervisionato utilizza anche dati di output per sviluppare modelli predittivi. (A)

Signup and view all the answers

Quale delle seguenti affermazioni è corretta riguardo alla Knowledge Discovery in Database (KDD)?

KDD è un processo iterativo che identifica pattern validi, nuovi, utili e comprensibili nei dati. (A)

Signup and view all the answers

Quali sono le principali limitazioni della statistica tradizionale?

Tutti i precedenti. (D)

Signup and view all the answers

Quale tra queste è una caratteristica distintiva del Machine Learning rispetto alla statistica tradizionale?

La capacità di apprendere in modo adattivo e migliorare le prestazioni con l'aumento dei dati. (B)

Signup and view all the answers

Quali sono i vantaggi del Data Mining?

Tutti i precedenti. (C)

Signup and view all the answers

Quale tra queste è NON una definizione del Data Mining?

Un processo che si basa su modelli predefiniti per la previsione di eventi futuri. (A)

Signup and view all the answers

Quale dei seguenti è un vantaggio dell'utilizzo di un albero decisionale?

È un modello facilmente comprensibile anche per persone non esperte di statistica (D)

Signup and view all the answers

Qual è il punto di partenza di un albero decisionale?

Il nodo padre o radice (A)

Signup and view all the answers

Come viene suddiviso il dataset nel processo di creazione di un albero decisionale?

In base ai livelli di una specifica variabile (C)

Signup and view all the answers

Qual è l'obiettivo della divisione del dataset in un albero decisionale?

Rendere le foglie il più possibile omogenee (A)

Signup and view all the answers

In che modo viene assegnato il target previsto in un nodo finale di un albero decisionale?

In base alla moda del target nei dati del nodo (A)

Signup and view all the answers

Un albero decisionale è considerato un modello:

Non parametrico (C)

Signup and view all the answers

In un nodo finale con una probabilità di iscrizione al giornale di 0.906, quale sarebbe il valore previsto?

Sì (B)

Signup and view all the answers

Quale delle seguenti affermazioni sull'interpretazione di un albero decisionale è CORRETTA?

La profondità dell'albero decisionale influenza la complessità del modello (A)

Signup and view all the answers

Quale delle seguenti affermazioni è FALSA riguardo al lazy learning?

Ha un costo computazionale basso e rende il processo di apprendimento più veloce. (A)

Signup and view all the answers

Quale delle seguenti è una caratteristica dell'eager learning?

Richiede poco spazio di memoria durante il training. (C)

Signup and view all the answers

Quale dei seguenti è un vantaggio del lazy learning rispetto all'eager learning?

Previene l'overfitting. (A)

Signup and view all the answers

Quale dei seguenti è un svantaggio del lazy learning?

È lento durante la fase di classificazione. (A)

Signup and view all the answers

Quale dei seguenti è un vantaggio dell'eager learning?

È più accurato rispetto al lazy learning. (D)

Signup and view all the answers

Quale affermazione è VERA riguardo ai punteggi discriminanti e alle previsioni come probabilità?

I punteggi discriminanti possono essere negativi o positivi, mentre le previsioni come probabilità devono essere comprese tra 0 e 1. (B)

Signup and view all the answers

Quale delle seguenti affermazioni descrive correttamente l'errore di classificazione di Bayes?

È l'errore minimo che può commettere un classificatore ideale. (D)

Signup and view all the answers

Il teorema di Bayes permette di calcolare:

Tutte le precedenti. (A)

Signup and view all the answers

Cosa rappresenta P(x|y=j) nel teorema di Bayes?

La probabilità condizionata di osservare x data la classe j. (D)

Signup and view all the answers

Quale criterio viene utilizzato dal classificatore di Bayes per assegnare un individuo ad una classe?

Criterio di massima probabilità a posteriori (MAP). (C)

Signup and view all the answers

Il tasso di errore di classificazione bayesiano per X=x0 è dato da:

1 - max P(Y = j|X = x0) (B)

Signup and view all the answers

Come viene utilizzato il likelihood-ratio test nel caso di un target binario con probabilità a priori P[𝜔𝑖 ] = 1⁄2 e funzione di perdita 0/1?

Per stimare la massima verosimiglianza. (B)

Signup and view all the answers

Quale condizione deve essere soddisfatta affinché la probabilità di appartenere a una delle due classi sia P(Y = 1|X = x0 ) >< 0.5?

La verosimiglianza delle due classi deve essere diversa. (C)

Signup and view all the answers

Quale delle seguenti affermazioni è FALSA riguardo al classificatore di Bayes?

È sempre possibile ottenere un classificatore bayesiano ideale nella pratica. (C)

Signup and view all the answers

Flashcards

Statistica Tradizionale

Interpreta dati con variabile target e variabili esplicative con coefficienti.

Data Mining (DM)

Disciplina che ottimizza l'analisi esplorativa dei dati.