Modelli di Regressione LinPare: Capitolo 2
46 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Qual è il rischio principale nel confondere il contesto della scoperta con quello della giustificazione?

  • Stabilire relazioni di dipendenza corrette.
  • Formulare spiegazioni valide.
  • Creare spiegazioni ad hoc che possono essere smentite. (correct)
  • Utilizzare variabili indipendenti in modo efficace.

Un modello predittivo deve essere caratterizzato da quale delle seguenti qualità?

  • Includere solo variabili contingenti.
  • Esporre relazioni non lineari tra le variabili.
  • Essere complesso con molte variabili.
  • Essere altamente predittivo, parsimonioso e stabile. (correct)

Quali variabili devono essere omesse nella specificazione di un modello di regressione?

  • Variabili di controllo rilevanti.
  • Variabili esplicative di interesse.
  • Variabili intervenienti.
  • Variabili estranee e susseguenti. (correct)

Cosa misura un coefficiente di regressione parziale nel contesto di un modello lineare?

<p>La variazione di Y dovuta a Xj tenendo costanti le altre variabili. (A)</p> Signup and view all the answers

Quale rappresentazione geometrica si ottiene con due variabili indipendenti in un modello di regressione lineare?

<p>Un piano. (C)</p> Signup and view all the answers

L'inserimento di termini di interazione in un modello di regressione implica che:

<p>Si considerano effetti non lineari tra le variabili. (B)</p> Signup and view all the answers

Qual è la funzione principale della variabile dipendente Y in un modello di regressione?

<p>Rappresentare l'output che vogliamo analizzare. (B)</p> Signup and view all the answers

In un modello di regressione lineare, quale affermazione è corretta riguardo all'intercetta?

<p>Indica il valore di Y quando tutte le variabili indipendenti sono zero. (A)</p> Signup and view all the answers

Qual è l'indice che indica la quota di varianza di una variabile indipendente non spiegata dagli altri regressori?

<p>Indice di tolleranza (B)</p> Signup and view all the answers

Qual è il valore soglia di attenzione del Variance Inflation Index (VIF) considerato allarmante?

<p>Superiore a 10 (C)</p> Signup and view all the answers

Cosa implica una perfetta collinearità nelle stime dei parametri?

<p>Esistono infinite soluzioni (A)</p> Signup and view all the answers

Quale dei seguenti è un rimedio per gestire l'elevata collinearità?

<p>Sintetizzare variabili in un indice (C)</p> Signup and view all the answers

Cosa succede se una variabile non è linearmente indipendente dalle altre in un modello di regressione?

<p>Ci sono infinite soluzioni (C)</p> Signup and view all the answers

Qual è un'indicazione di bassa tolleranza e alta collinearità?

<p>0.15 (B)</p> Signup and view all the answers

Quale affermazione è vera riguardo all'indice di tolleranza e al VIF?

<p>Entrambi forniscono informazioni simili sulla collinearità (D)</p> Signup and view all the answers

Cosa si consiglia di fare quando si ha una situazione di elevata collinearità ma le stime sono comunque determinate?

<p>Rimuovere e modificare le variabili sensate (B)</p> Signup and view all the answers

Cosa rappresenta l'errore nella regressione lineare multipla?

<p>La differenza tra il valore previsto e quello effettivo di Y (D)</p> Signup and view all the answers

Quale delle seguenti affermazioni è vera riguardo alla regressione non lineare?

<p>La funzione che lega Y al predittore è diversa dalla funzione identità. (A)</p> Signup and view all the answers

Cosa definisce il modello di regressione lineare in notazione GLM?

<p>I parametri β relativi alla popolazione. (B)</p> Signup and view all the answers

In quale modo la regressione lineare multipla considera le variabili indipendenti?

<p>La variazione apportata in Y dal cambiamento di una v.i non dipende dalle altre vv.ii. (B)</p> Signup and view all the answers

Qual è la caratteristica principale del modello GLM?

<p>Include sia modelli lineari che non lineari. (A)</p> Signup and view all the answers

Quale delle seguenti affermazioni riguardo alla legge di Moore è corretta in contesto di regressione?

<p>Rappresenta una regressione non lineare nei parametri. (C)</p> Signup and view all the answers

Qual è la differenza principale tra regressione lineare e regressione non lineare?

<p>La non linearità dei parametri è caratteristica della regressione non lineare. (C)</p> Signup and view all the answers

Cosa si intende per predittore lineare nel contesto della regressione?

<p>È un membro a destra dell'equazione denotato da eta. (A)</p> Signup and view all the answers

Quale delle seguenti affermazioni descrive più accuratamente l'impostazione theory-driven nella regressione lineare multipla?

<p>Esamina l'influenza di variabili esplicative sulla variabile dipendente mediante ipotesi derivate da una teoria. (D)</p> Signup and view all the answers

Qual è uno dei principali rischi associati all'uso esplorativo della regressione lineare multipla?

<p>La creazione di falsi positivi e di stime significative ma irrilevanti. (A)</p> Signup and view all the answers

Cosa si intende per perfetta collinearità tra variabili indipendenti?

<p>Una variabile indipendente è una combinazione esatta di altre variabili indipendenti. (D)</p> Signup and view all the answers

Qual è la conseguenza della violazione dell'assunto di assenza di multicollinearità?

<p>Le stime dei parametri sono indeterminate. (D)</p> Signup and view all the answers

Nella procedure di regressione stepwise, quale passo viene eseguito dopo la valutazione della significatività delle nuove variabili?

<p>Le variabili non più significative vengono eliminate. (A)</p> Signup and view all the answers

Cosa indica la presenza di variabili confondenti nella regressione lineare multipla?

<p>Variabili che influenzano contemporaneamente sia la variabile indipendente che quella dipendente. (C)</p> Signup and view all the answers

In che situazione parliamo di elevata collinearità?

<p>Le variabili indipendenti sono linearmente indipendenti, ma con elevata correlazione. (C)</p> Signup and view all the answers

Quale dei seguenti approcci è più comune nel contesto di una regressione di tipo statistico?

<p>Utilizzare un algoritmo per selezionare variabili in base a criteri statistici. (B)</p> Signup and view all the answers

Quale affermazione descrive meglio la situazione di 'quasi-collinearità'?

<p>Gli errori standard risultano molto elevati. (B)</p> Signup and view all the answers

Qual è un'affermazione corretta riguardo alle variabili indipendenti nella regressione lineare multipla?

<p>Possono influenzare la variabile dipendente in modo simultaneo. (D)</p> Signup and view all the answers

Perché è illogico stimare l'impatto di X1 su Y tenendo costante X2 se X2 è una copia di X1?

<p>Perché non è possibile tenere ferma una variabile e farla variare contemporaneamente. (C)</p> Signup and view all the answers

Cosa comporta la presenza di multicollinearità nel modello di regressione?

<p>Le stime dei parametri diventano meno affidabili. (D)</p> Signup and view all the answers

In che modo si può definire una variabile dipendente in un contesto di regressione lineare multipla?

<p>Una variabile soggetta all'influenza di variabili esplicative. (A)</p> Signup and view all the answers

Quale affermazione descrive meglio l'importanza dell’assimetria nella relazione tra le variabili?

<p>E' necessario che ci sia una sequenza temporale o logica tra le variabili. (A)</p> Signup and view all the answers

Qual è la probabile conseguenza di una corretta applicazione della regressione OLS in assenza di multicollinearità?

<p>Affidabilità nella verifica degli assunti. (C)</p> Signup and view all the answers

Come si può accertare la presenza di multicollinearità?

<p>Analizzando le correlazioni tra le variabili indipendenti. (C)</p> Signup and view all the answers

Cosa s'intende per multicollinearità perfetta in un modello di regressione?

<p>Quando si inseriscono K variabili dummy con l'intercetta nel modello. (B)</p> Signup and view all the answers

Qual è la soluzione suggerita per evitare la trappola delle variabili dummy?

<p>Rimuovere una variabile dummy e mantenere l'intercetta. (A)</p> Signup and view all the answers

Come si interpreta il coefficiente b0 in un modello con variabili dummy?

<p>È il valore previsto per la categoria di riferimento. (B)</p> Signup and view all the answers

Se si rimuove una dummy e si mantiene l'intercetta, quale sarà la categoria di riferimento?

<p>La categoria corrispondente alla dummy rimossa. (D)</p> Signup and view all the answers

Qual è l'effetto di rimuovere l'intercetta in un modello di regressione con variabili dummy?

<p>Il coefficiente della dummy reinserita avrà lo stesso valore di b0. (A)</p> Signup and view all the answers

Quale tecnica si può utilizzare per descrivere un set di K variabili correlate?

<p>Either regression or component analysis. (C)</p> Signup and view all the answers

Flashcards

Regressione lineare multipla

Il modello di regressione lineare multipla è utilizzato per studiare la relazione di dipendenza tra una variabile dipendente Y e una o più variabili indipendenti X. Il modello è basato sull'idea che i cambiamenti nella variabile indipendente influenzino la variabile dipendente.

Approccio theory-driven

L'utilizzo del modello di regressione lineare multipla per testare ipotesi derivate da una teoria. Si analizza il legame tra le variabili basandosi su una teoria preesistente.

Approccio esplorativo

L'utilizzo del modello di regressione lineare multipla con l'obiettivo di identificare un sottogruppo di variabili che hanno un impatto significativo sulla variabile dipendente. Questo approccio non è legato a una teoria predefinita.

Variabili confondenti

Variabili che possono influenzare la relazione tra la variabile indipendente e la variabile dipendente, confondendo la relazione effettiva.

Signup and view all the flashcards

Regressione stepwise

Un processo statistico che aggiunge o rimuove variabili indipendenti dal modello di regressione lineare multipla in base al loro livello di significatività statistica. Questo processo può portare a risultati falsi positivi se non si esegue con attenzione.

Signup and view all the flashcards

Stime significative ma irrilevanti

Un risultato significativo dal punto di vista statistico ma con un impatto irrilevante sulla variabile dipendente. Questo può accadere quando si utilizano procedure di selezione delle variabili automatiche.

Signup and view all the flashcards

Errore nella regressione

La differenza tra il valore effettivo di Y e il valore previsto dal modello di regressione.

Signup and view all the flashcards

Additività nella regressione lineare multipla

La variazione in Y causata da un cambiamento in una variabile indipendente non dipende dal valore delle altre variabili indipendenti.

Signup and view all the flashcards

Modello di regressione lineare

Modello in cui la relazione tra la variabile dipendente e le variabili indipendenti è lineare rispetto ai parametri.

Signup and view all the flashcards

Modello di regressione non lineare

Modello in cui la relazione tra la variabile dipendente e le variabili indipendenti è non lineare rispetto ai parametri.

Signup and view all the flashcards

Generalized Linear Model (GLM)

Famiglia di modelli che include la regressione lineare e altri modelli.

Signup and view all the flashcards

Predittore lineare (η)

Il membro a destra dell'equazione di regressione che contiene le variabili indipendenti e i parametri.

Signup and view all the flashcards

Effetto di una variabile indipendente su Y

Rapporto tra la variazione della variabile dipendente e la variazione di una variabile indipendente.

Signup and view all the flashcards

Variabili indipendenti (X)

Le variabili che utilizziamo per prevedere il valore di Y.

Signup and view all the flashcards

Contesto della scoperta vs. contesto della giustificazione

Il contesto della scoperta riguarda l'identificazione delle relazioni, mentre il contesto della giustificazione riguarda la verifica di tali relazioni. Un modello di regressione esplorativo è una prima stima, non una dimostrazione di dipendenza.

Signup and view all the flashcards

Modello predittivo, parsimonioso e stabile

Un modello di regressione con finalità previsionali/diagnostiche mira a individuare un modello che sia altamente predittivo, parsimonioso e stabile. Il modello deve prevedere la variabile dipendente (v.d.) il più possibile e contenere il minor numero possibile di variabili indipendenti.

Signup and view all the flashcards

Variabili indipendenti estrane

Le variabili indipendenti estrane o che seguono la variabile dipendente (v.d.) non dovrebbero essere incluse nel modello di regressione.

Signup and view all the flashcards

Variabili intervenienti

Variabili che intervengono nel processo che lega le variabili indipendenti (X) e la variabile dipendente (Y).

Signup and view all the flashcards

Termini di interazione e termini al quadrato

Termini che introducono effetti non lineari tra le variabili indipendenti (X) e la variabile dipendente (Y), pur mantenendo il modello lineare nei parametri.

Signup and view all the flashcards

Rappresentazione geometrica del modello di regressione lineare

La rappresentazione geometrica di un modello di regressione lineare con due variabili indipendenti è un piano. Questo piano interpola la nube di punti, e la distanza di ciascun punto dal piano rappresenta l'errore.

Signup and view all the flashcards

Intercetta in un modello di regressione lineare

L'intercetta del modello di regressione lineare, indicata con 0, rappresenta il valore della variabile dipendente quando tutte le variabili indipendenti sono uguali a zero.

Signup and view all the flashcards

Coefficiente di regressione parziale (j)

Il coefficiente di regressione parziale, j, misura la variazione della variabile dipendente (Y) causata da una variazione di un'unità della variabile indipendente Xj, mantenendo costanti le altre variabili indipendenti.

Signup and view all the flashcards

Perfetta Collinearità

La situazione in cui almeno una variabile indipendente nel modello è una combinazione lineare esatta delle altre. Questo significa che le variabili non sono tutte linearmente indipendenti.

Signup and view all the flashcards

Elevata Collinearità

Variabili indipendenti sono linearmente indipendenti ma la correlazione tra due o più di esse è così forte che l'informazione aggiunta da una rispetto alle altre è scarsa, conducendo a risultati incerti e instabili.

Signup and view all the flashcards

Stime Indeterminate

In presenza di perfetta collinearità, le stime dei parametri sono indeterminate, cioè non esiste una soluzione univoca.

Signup and view all the flashcards

Assenza di Multicollinearità

L'assenza di multicollinearità è fondamentale per la corretta applicazione della regressione lineare multipla mediante il metodo OLS.

Signup and view all the flashcards

Problemi di Multicollinearità

La multicollinearità può portare a problemi di interpretazione dei risultati e a stime non attendibili.

Signup and view all the flashcards

Errori Standard Elevati

In caso di elevata collinearità, gli errori standard tendono ad essere molto elevati, portando a risultati meno affidabili.

Signup and view all the flashcards

Soluzioni: Eliminazione o Combinazione

Se la multicollinearità è presente, si può optare per la rimozione di alcune variabili dal modello o per la combinazione di variabili correlate.

Signup and view all the flashcards

Multicollinearità: Un Problema da Non Sottovalutare

La multicollinearità è un problema comune nell'analisi dei dati, e la sua identificazione e gestione sono cruciali per ottenere risultati validi e attendibili.

Signup and view all the flashcards

Multicollinearità perfetta

Si verifica quando le variabili indipendenti (X) sono linearmente dipendenti tra loro, ovvero una variabile può essere espressa come combinazione lineare delle altre. Questo problema rende impossibile ottenere stime significative dei coefficienti di regressione.

Signup and view all the flashcards

Trappola delle variabili dummy

Quando si usano variabili dummy per codificare variabili categoriali, se si includono tutte le dummy nel modello e l'intercetta, si crea una situazione di perfetta collinearità. Per risolvere il problema, è necessario rimuovere o l'intercetta o una dummy.

Signup and view all the flashcards

Codifica disgiuntiva completa

Un metodo per risolvere il problema della multicollinearità perfetta quando si utilizzano variabili dummy. Consiste nel rimuovere una delle dummy dal modello, rendendo la modalità omessa la categoria di riferimento.

Signup and view all the flashcards

V.I. qualitativa politomica

Si riferisce all'utilizzo di un'unica variabile categoriale per modellare l'effetto di più categorie. Le categorie vengono codificate come dummy (0 o 1), e il modello assume un effetto lineare tra le diverse categorie.

Signup and view all the flashcards

Interpretazione dei coefficienti in un modello con V.I. qualitativa politomica

Il coefficiente b0 rappresenta il valore medio della variabile dipendente (Y) per la categoria di riferimento. I coefficienti b1, b2, ecc. rappresentano le differenze tra il valore medio della variabile dipendente per ciascuna categoria e il valore medio della categoria di riferimento.

Signup and view all the flashcards

Indice di tolleranza (tolleranza)

L'indice di tolleranza misura la quota di varianza di una variabile indipendente non spiegata dalle altre variabili indipendenti nel modello. Un valore basso (es. 0.15) indica un'elevata collinearità tra le variabili.

Signup and view all the flashcards

Variance Inflation Factor (VIF)

Il Variance Inflation Factor (VIF) è il reciproco dell'indice di tolleranza. Un VIF elevato (sopra 10) indica un'elevata collinearità e suggerisce che la variabile indipendente è influenzata dalle altre variabili nel modello.

Signup and view all the flashcards

Rimozione di variabili

Rimuovere una o più variabili indipendenti dal modello di regressione. Questa è un'opzione quando la multicollinearità è elevata e le variabili sono altamente correlate.

Signup and view all the flashcards

Sintesi di variabili

Combinare due o più variabili indipendenti che misurano lo stesso concetto in un unico indice. Questo può aiutare a ridurre la multicollinearità e a migliorare la comprensione del modello.

Signup and view all the flashcards

Assegnazione di varianza

Assegnare la varianza comune tra due o più variabili indipendenti a una sola variabile. Questo può aiutare a ridurre la multicollinearità e a semplificare il modello.

Signup and view all the flashcards

Controllo della multicollinearità

La multicollinearità può essere monitorata mediante indici diagnostici appositi. Tra i più utilizzati nella pratica della ricerca troviamo l'indice di tolleranza e il Variance Inflation Factor (VIF).

Signup and view all the flashcards

Study Notes

Modello di regressione lineare

  • La regressione lineare multipla serve a testare relazioni di dipendenza tra variabili, controllando l'influenza di altre variabili terze.
  • Si può usare per scopi esplorativi, identificando variabili indipendenti significative su una dipendente.
  • Oppure per previsione o diagnosi, creando modelli preditivi e parsimoniosi.

Specificazione del modello

  • La variabile dipendente è la variabile da prevedere.
  • Le variabili indipendenti (o esplicative) sono le variabili utilizzate per prevedere la dipendente.
  • Le variabili di controllo sono variabili antecedenti o concomitanti estranee alla relazione principale.

Linearità e additività

  • La relazione tra le variabili deve essere lineare e additiva, cioè la variazione di una variabile indipendente non deve dipendere dal valore delle altre.

Multicollinearità

  • La presenza di elevata correlazione tra variabili indipendenti crea problemi nella stima.
  • La multicollinearità produce stime instabili, con elevata incertezza e ampi intervalli di confidenza per i parametri.
  • Se la multicollinearità è perfetta, le stime diventano indeterminate.

Regressori qualitativi

  • Variabili qualitative (con più di due categorie) possono essere inserite usando regressori indicatori (dummy variables).
  • La categoria di riferimento determina i valori base per le altre categorie.

Modelli non lineari

  • I modelli possono essere non lineari nei parametri, ma la relazione funzionale può comunque essere lineare nelle variabili.
  • I modelli non lineari non possono essere stimati con l'OLS.

Valutazione del modello

  • Indice di tolleranza e VIF (Variance Inflation Factor) misurano l'influenza di multicollinearità sulle stime. I valori devono essere superiori a 0.15, ed inferiori a 10 come valori appropriati.
  • Il modello corretto è parsimonioso (con meno variabili possibile) e predittivo.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Description

Questo quiz esplora concetti chiave sui modelli di regressione, inclusi i coefficienti di regressione parziale e i rischi della confusione tra scoperta e giustificazione. I partecipanti testeranno la loro comprensione delle variabili indipendenti e dell'intercetta in modelli lineari. Perfetto per chi studia statistica e analisi dei dati.

More Like This

Modèles de régression simple
37 questions
Modelo de Regresión Lineal Múltiple
52 questions

Modelo de Regresión Lineal Múltiple

HarmoniousNourishment9636 avatar
HarmoniousNourishment9636
Modelli di Regressione Lineare
44 questions
Use Quizgecko on...
Browser
Browser