Tecniche Multivariate Correlazionali nella Ricerca Psicosociale PDF

Document Details

AdvancedUnity9579

Uploaded by AdvancedUnity9579

Università degli Studi di Padova

Andrea Bobbio

Tags

analisi multivariata tecniche statistiche ricerca psicosociale statistica

Summary

Questi appunti forniscono una panoramica sulle tecniche multivariate correlazionali nella ricerca psicosociale. Il documento spiega concetti chiave come l'analisi bivariata e multivariata, fornendo esempi e formule di riferimento.

Full Transcript

Materiale ad esclusivo fine didattico e a circolazione controllata. Insegnamento di "Tecn. Multiv. Corr. nella Ric. Psicosoc.", M3 - UniPD, a.a. 2024/2025 - © Prof. A. Bobbio Tecniche multivariate correlazionali nella ricerca psicosociale Analisi bivariata...

Materiale ad esclusivo fine didattico e a circolazione controllata. Insegnamento di "Tecn. Multiv. Corr. nella Ric. Psicosoc.", M3 - UniPD, a.a. 2024/2025 - © Prof. A. Bobbio Tecniche multivariate correlazionali nella ricerca psicosociale Analisi bivariata Riguarda lo studio della relazione fra 2 variabili Tecniche statistiche per l’analisi delle Quando le variabili sono continue e misurate a livello relazioni tra variabili di scala a intervalli (assunta tale o quasi-cardinale) la forza e la direzione di tale relazione è espressa dal coefficiente di correlazione prodotto-momento di Pearson, o coefficiente di correlazione lineare Tale coefficiente può assumere il valore di qualsiasi A cura di Andrea Bobbio numero reale compreso tra –1.00 e +1.00. a.a. 2024-2025 1 2 Nota Analisi multivariata In matematica, i NUMERI REALI (NR) sono numeri ai quali Riguarda lo studio delle relazioni fra più di è possibile attribuire uno sviluppo decimale finito o infinito, due variabili. Esempi sono: come nel caso di “Pi greco”, π = 3,141592... I NR possono essere positivi, negativi o nulli e comprendono, Correlazione parziale come casi particolari, i numeri interi (come 74), i numeri razionali (ossia quelli ottenibili da una frazione, come 25/9) ed Correlazione multipla i numeri irrazionali algebrici (come la radice quadrata di 2) e trascendenti (come π ed e). Regressione multipla I NR possono essere messi in corrispondenza biunivoca con i punti di una retta, detta numerica o reale → R 3 4 La correlazione bivariata E’ una misura della relazione (o associazione) lineare tra Varianza (s2x) 2 variabili Per decidere se 2 variabili sono associate dobbiamo vedere prima di tutto se covariano: = se i cambiamenti in una variabile si associano a cambiamenti nell’altra variabile → in dettaglio, se quando una variabile devia dalla sua media, anche Covarianza (sxy) l’altra devia dalla propria in modo simile Ricordiamo alcune formule: 5 6 1 Materiale ad esclusivo fine didattico e a circolazione controllata. Insegnamento di "Tecn. Multiv. Corr. nella Ric. Psicosoc.", M3 - UniPD, a.a. 2024/2025 - © Prof. A. Bobbio Tabella di dati Esempio (Tratto da: Field, 2000) X = N° spot Y = N° _ _ _ _ Soggetti (xi - X) (yi - Y) (xi - X) (yi - Y) pubblicitari pacchetti dolci 1 5 8 ESERCIZIO 0 2 4 9 3 4 10 Consideriamo un gruppo di 5 persone e 4 6 13 rileviamo quanti spot pubblicitari che 5 8 15 promuovono dei dolci guardano in una settimana; quindi rileviamo quanti pacchetti di Media questi dolci ogni persona compra la settimana Varianza successiva d.s. 7 8 Tabella di dati Alcuni passaggi X = N° spot Y = N° _ _ _ _ Soggetti (xi - X) (yi - Y) (xi - X) (yi - Y) pubblicitari pacchetti dolci Calcolo della covarianza con la formula: 1 5 8 - 0.4 -3 1.2  (X )( ) 2 4 9 - 1.4 -2 2.8 n 3 4 10 - 1.4 -1 1.4 i − X  Yi − Y s xy = 4 6 13 0.6 2 1.2 i =1 = 4.25 n −1 5 8 15 2.6 4 10.4 =0 =0  = 17 N Equivalente a → codevianza / (n-1), ossia alla Media 5.4 11.0 (X i − X )2 Codevianza ponderazione (= media) della codevianza sulla numerosità s x2 = i =1 (somma dei prodotti Varianza 2.8 8.5 degli scarti dalle campionaria (17/4 = 4,25) d.s. 1.67 2.92 n −1 medie di X e Y) n-1 è una correzione indicativa dell’operazione di stima di Deviazione standard, sx o sy 9 dati della popolazione a partire da dati di un campione10 Alcuni passaggi Limite → La covarianza è una misura non  Xi − X   Yi − Y  standardizzata; il suo valore assoluto e il suo range di variazione dipendono dalle scale di      s   s xy  sx   y  misura usate della due variabili rxy = = Unità di n −1 sx s y Per superare questo problema dobbiamo misura: d.s. standardizzare la covarianza (usando come unità di misura la deviazione standard) e 4.25 4.25 ottenere così il coefficiente di correlazione (rxy). rxy = = =.87 1.67  2.92 4.876 11 12 2 Materiale ad esclusivo fine didattico e a circolazione controllata. Insegnamento di "Tecn. Multiv. Corr. nella Ric. Psicosoc.", M3 - UniPD, a.a. 2024/2025 - © Prof. A. Bobbio Approfondimento → Correlazione fra Punti z Inoltre, poiché: Se standardizziamo due variabili X e Y, trasformandole in Punti Z (Zx e Zy; M = 0; d.s. = 1), la correlazione si può esprimere nel modo seguente: Il coefficiente di correlazione può essere espresso in termini di variabili standardizzate come: Dunque, la correlazione fra due variabili standardizzate equivale, come atteso, alla loro covarianza 13 14 x− Proprietà del coefficiente di correlazione (rxy o r) Nota z=  1. Esprime la direzione e l’intensità della relazione lineare esistente tra due variabili La «standardizzazione statistica» è un procedimento che 2. Può assumere qualsiasi valore reale compreso tra +1.00 riconduce una variabile aleatoria, distribuita secondo una (correlazione positiva perfetta) e –1.00 (correlazione negativa media μ e varianza σ2, ad una nuova variabile aleatoria ma perfetta) con distribuzione «standard», con media 0 e varianza 1. 3. Quando rxy = 0 (o molto prossimo a 0) le due variabili È particolarmente utile nel caso della variabile casuale possono essere ritenute linearmente indipendenti “normale” 4. Quanto più rxy si avvicina a |1.00| (in valore assoluto), tanto Il procedimento prevede di sottrarre alla variabile aleatoria più forte è la relazione tra le due variabili 5. Il valore numerico di rxy non è proporzionale al grado della la sua media e dividere il risultato ottenuto per la relazione tra le due variabili; cioè, rxy =.60 non indica una deviazione standard della variabile (per σ e non per σ2) relazione positiva di intensità doppia rispetto a quella indicata La standardizzazione è applicabile come trasformazione da rxy =.30 (rxy quindi è fondamentalmente una variabile lineare di un insieme di dati in statistica descrittiva 15 ordinale) 16 La legge di Yerkes & Dodson (1908) Diagrammi di dispersione e coefficienti di correlazione (de Lillo et al., 2007) rxy = ? → Descrive il rapporto curvilineo tra l'insorgenza di un’emozione (ansia / stress) e la prestazione → L’ansia adattativa aiuta le persone a prepararsi, allenarsi e provare, così da migliorare il proprio funzionamento e stimolare atteggiamenti adeguatamente prudenti in situazioni potenzialmente pericolose. 17 L’ansia disadattativa causa sofferenza e disfunzionalità 18 3 Materiale ad esclusivo fine didattico e a circolazione controllata. Insegnamento di "Tecn. Multiv. Corr. nella Ric. Psicosoc.", M3 - UniPD, a.a. 2024/2025 - © Prof. A. Bobbio Il coefficiente di determinazione L’area che si sovrappone, o area in comune fra i due Fornisce una stima della proporzione di “variazione cerchi, rappresenta graficamente la forza condivisa” da due misure correlate dell'associazione: quanto maggiore è l'area di intersezione tanto più forte è l'associazione fra le due Si ottiene elevando al quadrato rxy e si indica con r2xy variabili X ed Y Possiamo rappresentare la variabilità di due variabili mediante un diagramma di Venn (Figura, r =.40): Nell’esempio, i due cerchi hanno un’area in comune del 16%, poiché r =.40 ed r2 =.16 Due variabili non correlate sarebbero rappresentate da due cerchi che non si sovrappongono Quando r2XY = 1.00 (la correlazione è perfetta, i due cerchi sono sovrapposti) la variazione condivisa è il 19 100% (Figura) 20 Si può esprimere il grado in cui due variabili non sono associate calcolando una proporzione che si chiama varianza residua; questa è data da 1 - r2xy Esempio. Se la correlazione fra rendimento medio alla scuola superiore e media dei voti agli esami universitari è r =.40, abbiamo un coefficiente di determinazione pari a.16 e una quota di varianza comune fra le due variabili del 16% La porzione di varianza non spiegata è invece pari a: varianza residua → 1 - (.4)² = 1- (.16) =.84 Quindi, ben l'84% (!) della varianza delle votazioni medie all’università non è legata alla prestazione Fonte: Bohrnstedt & Knoke, 1998, p. 223 avuta dal soggetto alle scuole superiori 21 22 …e nell’Esercizio 0? Correlazione parziale Due variabili possono essere correlate non perché una Coefficiente di influenza l’altra, ma perché entrambe sono determinate da rxy =.87 r 2 =.76 determinazione una terza variabile (relazione spuria)  = (rxy)2 Z Diagramma di Venn X Y X Y X = Livello di istruzione; Z = Status sociale della Varianza residua = 1 famiglia di provenienza; Y = Reddito -.76 =.24% Varianza comune 76% rxz =.60; rzy =.50; rxy =.30 → rxy.z =.00 23 24 4 Materiale ad esclusivo fine didattico e a circolazione controllata. Insegnamento di "Tecn. Multiv. Corr. nella Ric. Psicosoc.", M3 - UniPD, a.a. 2024/2025 - © Prof. A. Bobbio Lo status sociale è all’origine della relazione tra scolarità e La correlazione parziale è quindi la correlazione lineare reddito? Dobbiamo studiare questa relazione dopo aver tra due variabili dopo che sia stato statisticamente rimosso gli effetti dello status sociale familiare: come? sottratto (rimosso, controllato, tenuto costante o parzializzato) l’effetto lineare di una o più altre variabili a) Un modo è quello di suddividere il campione in gruppi con lo stesso valore sulla variabile status (es. alto, medio, basso) e Parzializzare gli effetti delle variabili di controllo → quindi esaminare la relazione tra scolarità e reddito in ogni stimare la correlazione tra le variabili come se tutti i casi gruppo (controllo) avessero esattamente gli stessi punteggi sulle variabili di controllo, cioè mantenendo costanti i valori delle b) Possiamo calcolare la correlazione tra istruzione e reddito variabili di controllo dopo aver rimosso gli effetti di una variabile di controllo (o covariata) (lo status, nell’esempio) da entrambe le variabili Se la variabile da controllare è una (Z), il coefficiente (depurazione) → correlazione parziale rxy.z è detto parziale di 1° ordine e si calcola nel modo 25 seguente: 26 Correlazione parziale (1) Al numeratore di questa formula abbiamo la differenza tra la correlazione totale (detta di ordine zero) e un fattore di correzione (prodotto delle correlazioni di ordine zero tra z, x e Correlazione Correlazione y) “totale” tra x e y, “totale” tra Al denominatore abbiamo 2 fattori di correzione: la varianza detta di ordine “0” xez rxy − (rxz )  (ryz ) residua di X, dopo aver eliminato il contributo di Z, e la varianza residua di Y, dopo aver eliminato il contributo di Z rxy. z = La correlazione parziale è, sostanzialmente, un coefficiente di Correlazione correlazione di Pearson e viene interpretato in modo del tutto 1 − rxz2  1 − ryz2 “totale” tra simile (varia tra + 1.00 e –1.00) yez Il coefficiente di correlazione parziale elevato al quadrato esprime la quantità di varianza che X e Y condividono quando Z è sotto controllo Varianza comune r2 xy.z = se Y è la variabile dipendente, l’r parziale al quadrato tra x e z indica la quota di varianza di Y spiegata da X, quando Z viene Varianza comune tra y e z 27 mantenuta costante 28 Il coefficiente di correlazione parziale tra 3 variabili La formula per il calcolo del coefficiente di correlazione non è unico, ma dipende da quale variabile vogliamo parziale di II ordine (es. correlazione tra v1 e v2, parzializzare: con tre variabili i coefficienti possibili parzializzando v3 e v4) è la seguente (2), che implica sono tre, che si ottengono eliminando di volta in volta coefficienti di correlazione parziale di I ordine: l’influenza di ciascuna variabile dalla correlazione tra le altre due (la scelta è dettata da precise ipotesi) r12.3 − r14.3  r24.3 Possiamo calcolare r parziali di ordine superiore rimuovendo gli effetti di due o più variabili da una r12.34 = relazione → Esempio 1 − r142.3  1 − r242.3 29 30 5 Materiale ad esclusivo fine didattico e a circolazione controllata. Insegnamento di "Tecn. Multiv. Corr. nella Ric. Psicosoc.", M3 - UniPD, a.a. 2024/2025 - © Prof. A. Bobbio Capire la correlazione parziale MEDIAZIONE → le variabili X e Y sono correlate La correlazione parziale è un tentativo di comprendere perché X causa Y attraverso una o più variabili perché 2 variabili sono correlate mediatrici Due sono le possibili spiegazioni: Anche in questo caso, se l’ipotesi è corretta, la Ipotesi della “causa comune” correlazione tra X e Y dovrebbe essere diversa da zero, ma parzializzando gli effetti della variabile di Ipotesi di mediazione mediazione dovrebbe essere zero o quasi CAUSA COMUNE → sostiene che le variabili X e Y Quale delle 2 ipotesi rappresenti la migliore sono correlate perché condividono la stessa/e spiegazione della relazione tra X e Y è un problema variabile/i causale/i (relazione spuria) → se l’ipotesi teorico e una questione di indagini successive è corretta, la correlazione tra X e Y dovrebbe essere diversa da zero, ma parzializzando gli effetti della Inoltre, per testare l’ipotesi di mediazione sono causa comune dovrebbe essere uguale o molto necessarie altre tecniche e verifiche (regressione), la prossima a zero 31 sola correlazione parziale non è sufficiente! 32 La significatività del coefficiente di correlazione parziale Normale univariata Il test di significatività di una correlazione parziale valuta se, nella popolazione, la correlazione parziale è diversa da zero (H0: rxy.z = 0; H1: rxy.z ≠ 0) Assunzioni generali 1) Le variabili devono avere una distribuzione normale multivariata (Barbaranelli 2002, p. 34), cioè: a) tutte le distribuzioni univariate delle variabili sono normali (Figura) b) le distribuzioni congiunte di tutte le coppie di variabili seguono la distribuzione normale bivariata (Figura) 33 Normale bivariata 34 2) I casi esprimono un campione rappresentativo di una popolazione. Per ogni caso i punteggi delle variabili in relazione sono indipendenti La significatività del coefficiente di correlazione parziale si trova mediante la seguente trasformazione in punti t (3) : rxy. z  N − 3 t N −3 = 1 − rxy2. z 35 36 6 Materiale ad esclusivo fine didattico e a circolazione controllata. Insegnamento di "Tecn. Multiv. Corr. nella Ric. Psicosoc.", M3 - UniPD, a.a. 2024/2025 - © Prof. A. Bobbio Esempio (Esercizio 0.1) Quindi, sulle tavole della distribuzione t di Student, Supponiamo di aver trovato che la riuscita agli esami individuiamo il valore di t critico, con N-3 gradi di (R) sia correlata negativamente con l’ansia da esame libertà (g.l.), e per il livello di probabilità fissato (es. (A) (r = -.441) ma positivamente con il tempo dedicato p

Use Quizgecko on...
Browser
Browser