Inferenza Causale per Data Science

Podcast

Play an AI-generated podcast conversation about this lesson

Download our mobile app to listen on the go

Get App

Questions and Answers

In che modo l'inferenza causale si differenzia dall'identificazione delle sole correlazioni?

L'inferenza causale si propone di determinare le ragioni alla base delle occorrenze e come i fenomeni possono essere manipolati, al contrario delle correlazioni. (correct)
Le correlazioni identificano le relazioni senza studiarne l'origine; l'inferenza causale si limita a confermare tali relazioni.
L'inferenza causale si concentra esclusivamente sulla previsione, mentre l'identificazione di correlazioni si concentra sulla spiegazione.
Le correlazioni spiegano le ragioni degli eventi, mentre l'inferenza causale si occupa solo di identificare pattern.

Qual è la differenza fondamentale tra statistiche bayesiane e frequentiste?

Le statistiche bayesiane si basano esclusivamente su dati oggettivi, mentre le statistiche frequentiste considerano opinioni soggettive.
Le statistiche frequentiste assegnano un grado di credenza agli eventi, mentre le statistiche bayesiane forniscono solo quantificazioni degli eventi senza credenze.
Le statistiche bayesiane quantificano la probabilità di eventi e ipotesi, mentre le statistiche frequentiste si concentrano solo sugli eventi. (correct)
Le statistiche bayesiane e frequentiste sono intercambiabili in ogni contesto.

Quale dei seguenti elementi è un componente chiave dei Modelli Grafici Probabilistici (PGM)?

Funzioni di costo lineari.
Algoritmi di clustering gerarchico.
Reti neurali ricorrenti.
Distribuzioni di probabilità multivariate. (correct)

Quale dei seguenti concetti è essenziale per comprendere i dati delle serie temporali in un'analisi avanzata?

Stazionarietà. (A) Signup and view all the answers

In che modo le LSTM e le GRU affrontano il problema della scomparsa del gradiente nelle RNN?

Implementando meccanismi di gating e celle di memoria. (A) Signup and view all the answers

In che modo il gradient clipping aiuta nell'addestramento delle RNN?

Prevenendo l'esplosione dei gradienti. (A) Signup and view all the answers

Quali sono le componenti fondamentali dell'apprendimento per rinforzo (RL)?

Agente, ambiente, stato, azione, ricompensa e politica. (B) Signup and view all the answers

Qual è il compromesso tra esplorazione e sfruttamento nell'RL?

Esplorare azioni sconosciute vs sfruttare azioni già note per massimizzare le ricompense immediate. (B) Signup and view all the answers

In che modo le Deep Q-Networks (DQN) estendono il Q-learning?

Utilizzando reti neurali profonde per approssimare la funzione Q. (D) Signup and view all the answers

Quali sono le "5 V" dei Big Data?

Valore, Varietà, Velocità, Veridicità e Volume. (A) Signup and view all the answers

Cosa sono i Resilient Distributed Datasets (RDD) in Apache Spark?

Raccolte distribuite immutabili di oggetti che possono essere elaborate in parallelo. (A) Signup and view all the answers

In che modo Spark differisce da Hadoop in termini di elaborazione dei dati?

Spark offre l'elaborazione in memoria, mentre Hadoop utilizza l'elaborazione basata su disco. (B) Signup and view all the answers

Qual è la differenza principale tra database operativi (OLTP) e data warehouse (OLAP)?

OLTP gestiscono le transazioni in tempo reale, mentre i data warehouse (OLAP) sono ottimizzati per l'analisi dei dati storici. (C) Signup and view all the answers

Qual è lo scopo degli schemi denormalizzati come lo schema a stella o a fiocco di neve nei data warehouse?

Ottimizzare le interrogazioni analitiche. (D) Signup and view all the answers

Quali sono le principali piattaforme cloud per l'implementazione di modelli di machine learning?

AWS, Azure e GCP. (C) Signup and view all the answers

Qual è il ruolo della containerizzazione con Docker e Kubernetes nell'implementazione di modelli di machine learning su piattaforme cloud?

Semplificare lo sviluppo e il rollback delle implementazioni di modelli. (A) Signup and view all the answers

Quali sono le strategie di implementazione per i modelli di machine learning?

Test A/B, implementazioni canary e implementazioni shadow. (D) Signup and view all the answers

In che modo lo scaling orizzontale differisce dallo scaling verticale nell'infrastruttura di machine learning?

Lo scaling orizzontale aggiunge più macchine, mentre lo scaling verticale aggiunge più risorse a una singola macchina. (D) Signup and view all the answers

Qual è lo scopo dell'uso delle window function in SQL?

Eseguire calcoli su un set di righe di tabella correlate alla riga corrente. (A) Signup and view all the answers

Qual è il ruolo delle Common Table Expressions (CTE) in SQL?

Semplificare query complesse, migliorando la leggibilità e consentendo una logica più modulare. (A) Signup and view all the answers

In che modo le strategie di indicizzazione del database influiscono sulle prestazioni delle query?

Indici mal implementati possono rallentare operazioni di scrittura e richiedere molto archiviazione. (A) Signup and view all the answers

Che cosa comporta l'analisi dei piani di esecuzione delle query?

Identificare colli di bottiglia e ottimizzare le prestazioni delle query. (C) Signup and view all the answers

Qual è l'importanza dei sistemi di controllo di versione come Git nello sviluppo collaborativo di data science?

Tenere traccia delle modifiche al codice, collaborare in modo efficace e gestire diverse versioni di progetti. (A) Signup and view all the answers

Perché la revisione del codice è essenziale nei progetti di data science?

La revisione del codice rileva bug, migliora leggibilità condividendo la conoscenza. (D) Signup and view all the answers

Cosa sono le pipeline di Continuous Integration/Continuous Deployment (CI/CD)?

Processo automatizzato per test, integrazione e distribuzione dei modelli Machine Learning dall'ambiente di sviluppo alla produzione. (A) Signup and view all the answers

Come affrontare i dilemmi etici nei progetti di AI?

Richiedere a esperti legali e di etica, impegnarsi in un processo decisionale ponderato. (D) Signup and view all the answers

Spiega come i bias algoritmici possono influire?

Creano risultati distorti, derivanti dalla progettazione dell'algoritmo stesso o dal modo in cui viene addestrato. (D) Signup and view all the answers

Cos'è la trasparenza nell'AI?

Si riferisce alla comprensibilità dell'AI. (A) Signup and view all the answers

Tecniche e vantaggi che riguardano il tuning per ottimizzare gli iperparametri degli algoritmi?

Ottimizzazione iperparametri per una migliore accuratezza e efficienza di training. (C) Signup and view all the answers

Il bagging usa sottocampionamenti per riadattare e fare previsioni. Invece, il boosting, come Gradient Boosting, come viene implementato?

Addestrando i modelli in sequenza, ogni volta con l'obiettivo di correggere gli errori di quello precedente. (C) Signup and view all the answers

Algoritmi di rilevamento anomalie spesso sono utilizzati per frodi, intrusioni o comportamenti insoliti. Le anomalie puntuali a cosa si riferiscono?

Singoli dati che si discostano dal resto dei dati. (C) Signup and view all the answers

Quali sono le basi delle GNN (reti neurali grafiche) rispetto le reti neurali convuluzionali (CNN) o quelle ricorrenti (RNN)?

Grafici composti da nodi e archi. (D) Signup and view all the answers

Signup and view all the answers

Flashcards

Cos'è l'inferenza causale?

Aiuta a interpretare pattern e spiegare perché si verificano determinati eventi, determinando le ragioni alla base delle occorrenze.

Cos'è l'Effetto Medio del Trattamento (ATE)?

Misura la differenza media negli esiti tra un gruppo trattato e uno non trattato in modelli di intelligenza artificiale causale.

Cosa sono i grafici aciclici diretti (DAG)?

Rappresentano scenari di ragionamento causale, delineando relazioni causa-effetto tra variabili in un quadro probabilistico.

Cos'è il "do-calculus"?

Un metodo sistematico per identificare e misurare l'effetto causale di specifiche politiche o azioni.