Capitolo 15: Sequenze con RNN e CNN

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quale impostazione deve essere utilizzata in tutti i livelli ricorrenti di un RNN profondo, eccetto l'ultimo?

return_sequences=False
return_sequences=Keep
return_sequences=Never
return_sequences=True (correct)

Qual è l'MSE del modello RNN quando prevede solo il valore successivo?

0.003
0.0188
0.029 (correct)
0.223

Come si può migliorare l'accuratezza nella previsione di più passi temporali?

Prevedere tutti i 10 valori consecutivamente alla fine.
Prevedere solo il valore immediatamente successivo.
Prevedere i 10 valori a ciascun passo temporale. (correct)
Usare un modello lineare per la previsione.

Qual è la funzione principale delle celle LSTM?

Controllare se gli stati devono essere memorizzati o scartati (A) Signup and view all the answers

Qual è il vantaggio principale dell'uso di un modello sequenza-a-sequenza rispetto a uno sequenza-a-vettore?

Incorpora il pagamento del termine di output ad ogni passo. (A) Signup and view all the answers

Cosa rappresenta h(t) in una cella LSTM?

Lo stato a breve termine (D) Signup and view all the answers

Quale gate controlla quali parti dello stato a lungo termine devono essere cancellate?

Gate di dimenticanza (D) Signup and view all the answers

Qual è l'MSE finale per il modello sequenza-a-sequenza?

0.006 (C) Signup and view all the answers

Cosa deve essere applicato a ogni passo temporale in un modello sequenza-a-sequenza?

Strato Denso (B) Signup and view all the answers

Quali matrici di pesi sono associate al gate di output in una cella LSTM?

Whi e Who (B) Signup and view all the answers

Qual è il range della funzione di attivazione logistica utilizzata nei gate delle celle LSTM?

0 a 1 (C) Signup and view all the answers

Qual è il problema principale quando si utilizza il metodo di previsione passo dopo passo?

Gli errori possono accumularsi nel tempo. (D) Signup and view all the answers

Quale livello Keras è consigliato per trasformare gli input per il modello sequenza-a-sequenza?

TimeDistributed (A) Signup and view all the answers

Cosa controlla il gate di input in una cella LSTM?

La quantità di informazioni da aggiungere allo stato a lungo termine (D) Signup and view all the answers

Quale operazione viene utilizzata per generare h(t) da c(t-1)?

Passaggio attraverso la funzione tanh (A) Signup and view all the answers

Qual è uno dei principali vantaggi di utilizzare celle LSTM?

Gestione efficace delle dipendenze a lungo termine (A) Signup and view all the answers

Qual è la funzione principale delle reti neurali ricorrenti (RNN)?

Prevedere il futuro basandosi su dati temporali (D) Signup and view all the answers

Cosa rappresenta h(t) in una rete neurale ricorrente?

Lo stato nascosto al passo temporale t (A) Signup and view all the answers

Quale di queste affermazioni è vera riguardo ai neuroni ricorrenti?

Hanno pesi separati per input e output del passo precedente (C) Signup and view all the answers

Qual è il ruolo di una cella di memoria in una rete neurale ricorrente?

Preservare uno stato attraverso i passi temporali (B) Signup and view all the answers

Qual è una limitazione delle reti neurali ricorrenti tradizionali?

Hanno memoria a lungo termine limitata (D) Signup and view all the answers

In che modo il modello WaveNet si differenzia dalle RNN tradizionali?

Elabora i dati temporali in modo simile ma con una struttura diversa (C) Signup and view all the answers

Qual è il problema principale affrontato durante l'addestramento delle RNN?

Gradienti instabili (C) Signup and view all the answers

Come si calcola l'output y(t) al passo temporale t in una RNN?

Come funzione degli input attuali e dello stato precedente (B) Signup and view all the answers

Quale funzione di attivazione si consiglia di utilizzare per le RNN per evitare problemi di instabilità?

Tangente iperbolica (B) Signup and view all the answers

Quando si osservano gradienti instabili durante l'addestramento, quale metodo dovrebbe essere utilizzato per affrontare questo problema?

Clipping dei gradienti (B) Signup and view all the answers

Qual è un vantaggio principale della Normalizzazione a livello di strato rispetto alla Normalizzazione del batch nelle RNN?

Può calcolare le statistiche su richiesta per ogni istanza (B) Signup and view all the answers

Quale metodo può essere utilizzato per monitorare la dimensione dei gradienti durante l'addestramento delle RNN?

Con TensorBoard (D) Signup and view all the answers

Quale affermazione è vera riguardo alla perdita di informazioni in una RNN?

Le informazioni vengono perse costantemente ad ogni passo temporale. (A) Signup and view all the answers

Quale tipo di rete è progettato per prevedere sequenze di dati come i prezzi delle azioni?

Rete sequenza-a-sequenza (D) Signup and view all the answers

Quale delle seguenti affermazioni è falsa riguardo alla Normalizzazione del batch nelle RNN?

Funziona infallibilmente per ogni tipo di rete. (A) Signup and view all the answers

Cos'è un'autoregresione in relazione all'imputazione dei valori mancanti?

Prevedere valori futuri in base ai dati passati (A) Signup and view all the answers

Che effetto può avere l'uso di attivazioni non saturanti nelle RNN durante l'addestramento?

Può causare un'esplosione dei gradienti. (D) Signup and view all the answers

Quale metodo è utilizzato per aggiornare i parametri del modello durante l'addestramento delle reti neurali ricorrenti?

Retropropagazione attraverso il tempo (BPTT) (D) Signup and view all the answers

Qual è il formato della serie temporale univariata?

Una sequenza di dati contenente solo un valore per intervallo di tempo (C) Signup and view all the answers

Quali hyperparametri possono essere utilizzati per aggiungere dropout nei livelli ricorrenti forniti da Keras?

dropout e recurrent_dropout (C) Signup and view all the answers

Come è rappresentato un insieme di input in una rete neurale per serie temporali?

Array 3D (C) Signup and view all the answers

Quale elemento viene utilizzato nella fase di valutazione dell'output nella retropropagazione attraverso il tempo?

Funzione di costo (D) Signup and view all the answers

Cosa caratterizza una rete vettore-a-sequenza?

L'input è costituito da un'immagine e l'output è un testo (A) Signup and view all the answers

Quali sono le dimensioni tipiche di un array per una serie temporale univariata?

[batch size, time steps, 1] (D) Signup and view all the answers

Qual è il valore medio dell'errore quadratico (MSE) per il metodo di previsione naive?

0.020 (A) Signup and view all the answers

Qual è la principale differenza tra un RNN semplice e un modello lineare semplice in termini di numero di parametri?

Il modello lineare ha più parametri dell'RNN. (C) Signup and view all the answers

Cosa accade se il parametro return_sequences è impostato su True in un layer RNN di Keras?

Restituisce un output per ogni passaggio temporale. (B) Signup and view all the answers

Qual è il valore dell'MSE raggiunto dal semplice RNN dopo l'addestramento?

0.014 (C) Signup and view all the answers

Perché potrebbe essere vantaggioso rimuovere trend e stagionalità prima di addestrare alcuni modelli di previsione?

Per migliorare la capacità del modello di apprendere i dati. (B) Signup and view all the answers

Qual è l'errore quadratico medio (MSE) stimato per il modello lineare semplice?

0.004 (D) Signup and view all the answers

Quale attivazione utilizza di default il layer SimpleRNN?

Funzione tangente iperbolica. (C) Signup and view all the answers

Perchè potrebbe essere non necessario rimuovere trend e stagionalità quando si utilizzano RNN?

Perché gli RNN possono includere direttamente questi fattori nel loro modello. (A) Signup and view all the answers

Flashcards

Rete Sequenza-a-Sequenza

Una rete neurale che accetta una sequenza di input e produce una sequenza di output.

Rete Sequenza-a-Vettore

Una rete neurale che accetta una sequenza di input e produce un singolo valore di output.

Rete Vettore-a-Sequenza

Una rete neurale che accetta un singolo valore di input e produce una sequenza di output.

Codificatore-Decodificatore

Una rete neurale costituita da un encoder e un decoder. L'encoder converte l'input in una rappresentazione vettoriale, mentre il decoder decodifica il vettore in output.