Appunti di Statistica 2 PDF

Document Details

Uploaded by Deleted User

Tags

statistica statistica descrittiva statistica inferenziale matematica

Summary

Questi appunti forniscono un riepilogo della statistica descrittiva e della statistica inferenziale, inclusa la spiegazione delle scale di misura. Gli appunti coprono anche i concetti di variabili, popolazione e campione, oltre che le distribuzioni campionarie.

Full Transcript

STATISTICA II Lezione 1: RIPASSO DI STATISTICA 1 Matrice dei dati Si chiama unità statistica il caso individuale componente del collettivo statistico. In psicologia spesso sono i soggetti o partecipanti alla ricerca. Si chiama carattere ogni aspetto elementare oggetto di rilevazione nelle unità s...

STATISTICA II Lezione 1: RIPASSO DI STATISTICA 1 Matrice dei dati Si chiama unità statistica il caso individuale componente del collettivo statistico. In psicologia spesso sono i soggetti o partecipanti alla ricerca. Si chiama carattere ogni aspetto elementare oggetto di rilevazione nelle unità statistiche del collettivo. Spesso vi si riferisce utilizzando il termine variabili, in senso generale. Nel caso di variabili within (misure ripetute) ci sono due modalità: - Una modalità “wide” che è quella classica di SPSS e in cui immettere i dati in Excel o in qualsiasi foglio di calcolo; - Una modalità “long” che è quella da Access e da altri software per la gestione dei database e da R per le ANOVA within. Scale di misura SCALA NOMINALE: viene utilizzata solo la proprietà di simbolo del sistema numerico, per “categorizzare” gli oggetti o i soggetti che interessano. “Consente soltanto di classificare le unità del collettivo statistico in tanti gruppi distinti quante sono le modalità del carattere”. Proprietà: equivalenza tra tutti i membri di ciascuna categoria; non equivalenza tra i membri di categorie diverse. Esempio: “Maschio” = 1; “Femmina” = 2 SCALA ORDINALE: è la prima scala “quantitativa”, viene introdotto il concetto di ordine tra le ripartizioni che vengono effettuate. “Consente, come nel caso precedente, di classificare le unità statistiche in gruppi omogenei; in più permette di ‘graduare’ i gruppi in base all’ordine che le modalità presentano”. I soggetti a cui viene assegnato il numero “1” presentano una quantità della caratteristica misurata inferiore rispetto ai soggetti a cui viene assegnato “2”. SCALA A INTERVALLI EQUIVALENTI: utilizza un’unità di misura costante ed è dotata, però, di uno “zero” arbitrario. Proprietà: Le differenze tra i valori sono equivalenti, ossia tra 5 e 10 c’è la stessa differenza che tra 15 e 20. Esempio: i gradi Celsius (può fare più freddo di 0°). SCALA A RAPPORTI: utilizza un’unità di misura costante, dotata di uno “zero” assoluto. Proprietà: I rapporti tra valori sono equivalenti: 20 è il doppio di 10. Esempio: il conto della spesa. Stnaley Smith Sevens è il primo a porre il problema delle scale di misura, ma non tutti sono d’accordo. Dal punto di vista pratico: - I test parametrici hanno dei prerequisiti, la violazione di questi assunti può essere più o meno grave; - Spesso i risultati di test parametrici e non parametrici non sono così diversi. 1 LA STATISTICA ù STATISTICA DESCRITTIVA: si occupa di descrivere i fenomeni FREQUENZE (assolute, relative, cumulate, relative cumulate) INDICI DI TENDENZA CENTRALE (media, moda, mediana): ci danno indicazioni sull’ordine di grandezza del fenomeno. INDICI DI POSIZIONE (mediana, quartili, decili, centili) INDICI DI DISPERSIONE (differenza interquartilica, devianza, varianza, deviazione standard): ci dicono di quanto i dati differiscono tra loro. Se usati in statistica inferenziale, come stimatori di parametri, divido per i gradi di libertà (n-1). INDICI DI FORMA (curtosi e asimmetria): ci dicono quanto la distribuzione dei dati assomiglia ad una normale. La curva normale Gaussiana: si presta a essere utilizzata come modello che approssima le distribuzioni reali relative a caratteristiche antropometriche di popolazioni omogenee (es. peso, altezza, ecc.). 2 STATISTICA INFERENZIALE: si occupa di fare inferenze sulla popolazione partendo dal campione VARIABILE CASUALE: è una funzione che associa un numero reale ad ogni evento elementare. LA FUNZIONE DI PROBABILITÀ: è una funzione che associa ad ogni valore della variabile casuale la sua probabilità. LA STANDARDIZZAZIONE: una variabile si dice normale se ha media uguale a 0 e varianza 1. POPOLAZIONE (l’insieme degli elementi cui si rivolge l’interesse del ricercatore) ≠ CAMPIONE CASUALE (un insieme di n ≠ 0 elementi estratti casualmente dalla popolazione). PARAMETRO (caratteristica (quantità) di una variabile in una popolazione) ≠ STATISTICA o indicatore (la stessa caratteristica riferita ad un campione) STIMA DI PARAMETRI: Usare statistiche del campione per stimare i parametri della popolazione. DISTRIBUZIONE CAMPIONARIA DI UNA STATISTICA: Non è altro che la distribuzione di quella statistica (es. media) in tutti i campioni di numerosità n estratti dalla stessa popolazione. Conoscere la distribuzione campionaria della statistica significa poter calcolare la probabilità che la statistica assuma valori all’interno di un intervallo [a, b] qualsiasi. DISTRIBUZIONE CAMPIONARIA DELLA MEDIA (DCM): Lo studio della DCM ha come scopo quello di poter calcolare la probabilità che una variabile casuale assuma una valore nell’intervallo [a,b], per una coppia qualsiasi di numeri a e b. Verifica di ipotesi L’ipotesi statistica è un’affermazione o una congettura che riguarda un parametro. L’ipotesi sottoposta a verifica va sotto il nome di ipotesi nulla e si indica con H0. Si chiama ipotesi alternativa l’affermazione o la congettura opposta e si indica con H1. L’elaborazione dei dati consiste, tipicamente, nel calcolare una stima campionaria del parametro e nel “misurare la distanza” fra questa stima e il valore assegnato al parametro con l’ipotesi nulla: Statistica test. La decisione di rifiutare o meno l’ipotesi nulla viene presa se la distanza supera certi limiti che vengono fissati in modo che sia controllato il rischio di errore. L’IPOTESI NULLA assegna un valore al parametro in popolazione (es. la differenza tra maschi e femmine è uguale a zero): - Se i dati del campione sono compatibili con questa -> Accetto H0 - Se i dati del campione non sono compatibili con questa -> Rifiuto H0 Come convenzione si scegli di rifiutare l’ipotesi nulla quando la probabilità di estrarre un campione con le caratteristiche di quello valutato da una popolazione in cui H0 è inferiore a 0,05, ossia al 5%. 3 Gli ERRORI: i valori critici che vengono presi in considerazione sono pY)=0.5; H1: P(X>Y)≠0.5 I test non parametrici si basano sulla trasformazione del dato numerico in un rango ordinato, dal più piccolo al più grande. Nel caso del test di Mann - Whitney si ordinano i ranghi dei punteggi dei due gruppi come se fossero un gruppo solo. Nel caso di punteggi pari merito (tie) a ciascuno di essi viene attribuito il rango medio dei ranghi che sarebbero stati attribuiti a quei punteggi. Il t test per campioni indipendenti Utilizza la distribuzione di probabilità t. La logica del test è quella di confrontare la variabilità dovuta alle differenze previste nei punteggi tra i due gruppi con la variabilità totale dei punteggi dei soggetti. Le differenze previste sono calcolate come differenze tra le medie dei punteggi dei due gruppi, confrontate con con l'errore standard della differenza tra due medie. Se esistessero solo delle differenze casuali tra i gruppi (H0) la varianza dovuta alle differenze previste in base all’azione della variabile indipendente dovrebbe essere piccola, rispetto alla varianza totale di tutti i punteggi. H0: non esiste una differenza tra il punteggio medio dei due gruppi H1: esiste una differenza tra il punteggio medio dei due gruppi 5 LA REGRESSIONE LINEARE SEMPLICE Due variabili continue È possibile valutare la loro correlazione: esiste una relazione lineare tra le due variabili? è positiva o negativa? di quale intensità? è statisticamente significativa? Di quante deviazioni standard cresce o decresce una al crescere di una deviazione standard dell’altra. È possibile calcolare una regressione lineare: esiste una relazione lineare tra le due variabili? è positiva o negativa? di quale intensità? è statisticamente significativa? Di quante unità cresce o decresce una (y) al crescere di un’unità dell’altra (x). IL COEFICIENTE ANGOLARE B DICE DI QUANTE UNITA’ Y CRESCE ALL’AUMENTARE DI X. La verifica delle ipotesi H0: le due variabili X e Y sono tra loro indipendenti. Tra le due variabili non esiste una relazione lineare: conoscendo il valore di xj non posso predire il corrispettivo valore di yj. H1: le due variabili X e Y sono tra loro dipendenti. Esiste una relazione di predittività: al variare di una variabile (variabile indipendente o predittore X), l’altra variabile (variabile dipendente o criterio Y) varia in maniera predicibile. La funzione che descrive questa relazione si chiama equazione di regressione o funzione di regressione della variabile Y sulla variabile X. 6 Lezione 2: TEST PER DATI DIPENDENTI I TEST PER DATI APPAIATI: - 1 variabile indipendente, within, 2 livelli - 1 variabile dipendente continua 1 variabile indipendente, within, 2 livelli Nel caso di un disegno entro i soggetti, le ipotesi a cui i test inferenziali devono rispondere sono: H0: Gli indicatori di tendenza centrale (media, o mediana per i test non parametrici) nelle due condizioni sono identici → nessun effetto della variabile indipendente. NON C’E’ UNA DIFFERENZA H1: Gli indicatori di tendenza centrale (media, o mediana per i test non parametrici) nelle due condizioni sono diversi -> effetto significativo della variabile indipendente. Il t test per dati appaiati Utilizza la distribuzione di probabilità t La logica del test è che, poiché ogni soggetto è sottoposto ad entrambe le condizioni, è possibile confrontare le coppie di punteggi ottenute da ogni soggetto, calcolando le differenze tra i punteggi relativi nelle due condizioni. La somma di queste differenze viene divisa per la deviazione standard. I gradi di libertà sono N-1: visto che c’è una somma di differenze sono il numero dei soggetti meno 1. Se ho la somma il numero di parametri che può variare liberamente si ottiene sempre così i gradi di libertà. 7 ESERCIZIO Esempio: Vogliamo sapere se il numero di parole rievocato dopo 10 minuti dalla lettura di un testo sia diverso a seconda della difficoltà del test stesso. L’anno scorso avevamo diviso i soggetti in due gruppi: variabile beetween+ quindi t test per indipendenti, cioè 10 soggetti leggono un testo semplice e 10 soggetti leggono un testo difficile. Quest’anno: Nulla ci vieta di pensarlo anche così: Dieci soggetti leggono sia un testo semplice (a1), sia un testo complesso (a2) e, 10 minuti dopo ogni lettura, si contano il numero delle parole rievocate. Soggetto A: 10 in una prova 2 nell’altra fa 8 (…) La somma da 27= 27 parole ricordate nella condizione testo facile rispetto alla condizione testo difficile Il valore t di 2,898 Quanti gradi di libertà abbiamo? gdl = 9 La nostra ipotesi è mono- o bidirezionale? Posso rifiutare H0 per pX2) ≠0.5 Ad esempio: Vogliamo sapere se ascoltare musica (A) facilita l’apprendimento di una lista di parole: un gruppo di 10 soggetti legge una lista di parole durante l’ascolto (a1) di una musica e un’altra lista di parole senza ascoltare (a2) la musica (anche qui andrebbero controllati gli effetti di ordine). Si vede i ranghi con segno positivo e i ranghi con segno negativo. Secondo l’ipotesi nulla le somme dovrebbero essere uguali (con la stessa intensità). 9 ESERCIZIO 1 Un campione casualmente estratto dalla popolazione di 10 soggetti con malattia di Alzheimer viene diviso casualmente in due gruppi. Il primo gruppo esegue un trattamento di stimolazione cognitiva (Gruppo Sperimentale - 1), mentre il secondo gruppo riceve l’assistenza normale (Gruppo di Controllo - 2). Dopo due mesi, i 10 soggetti vengono valutati con un test di valutazione cognitiva (ADAS-COG, punteggi più alti indicano un maggior numero di errori) e si rilevano i seguenti dati: 5 persone gruppo sperimentale e 5 persone gruppo di controllo A. Che tipo di disegno è? Matrice dei dati Il disegno è between (ogni soggetto esposto al trattamento) B. Qual è la V.I? Il tipo di trattamento ricevuto: il gruppo qui C. Qual è la V.D? ADAS D. Come facciamo a valutare se il trattamento è stato efficace? Si Avendo valutato come efficace il trattamento, i ricercatori reclutano 8 nuovi soggetti e valutano la prestazione ad un test di denominazione prima (T0) e dopo (T1) il trattamento di stimolazione cognitiva, ricavando i seguenti dati: A. Che tipo di disegno è? Matrice dei dati corretto perché nelle righe ci sono soggetti e nelle colonne le variabili. With-in perché misuriamo gli stessi soggetti a t0 e a t1 B. Qual è la V.I? C. Qual è la V.D? Test di denominazione D. Come facciamo a valutare se il trattamento è stato efficace? 10 Lezione 3: REGRESSIONE LINEARE MULTIPLA (parte prima) Un passo indietro: REGRESSIONE LINEARE SEMPLICE → y= a + bx Si usa per verificare la relazione lineare tra una variabile indipendente x e una variabile dipendente y. Per esempio, se voglio valutare se il peso di una persona può essere predetto dalla sua altezza. Qualsiasi siano due variabili continue si può calcolare la retta di regressione. SI hanno dei test di verifica di ipotesi che dicono se è un modello che va bene per descrivere la relazione tra le due variabili. Si hanno due ipotesi nulle che dice che tra le variabili non vi è una relazione lineare. Se non vi è relazione tra le due variabili vuol dire che: - Il test t che valuta l’ipotesi nulla b = 0 → coefficiente angolare è zero - Il test F che valuta il rapporto tra la Varianza di Regressione e la Varianza d’Errore FORMULE: le y predetti dalla retta hanno la formula della retta i desideri dei soggetti hanno la formula della retta + componente di errore del soggetto 11 La regressione multipla Cosa fa? Valuta se e quanto le diverse variabile predittive xi, insieme, riescono a stimare il valore di y e quale sia il contributo di ciascuna xi, indipendentemente dalle altre. Ad esempio: Sono interessato a valutare se anche il numero di calorie consumate, insieme all’altezza, possano prevedere il peso. Se nel caso della regressione lineare semplice potevamo rappresentare i nostri soggetti come dei punti su un piano, definiti da due variabili, x e … qui siamo in presenza di tre variabili (altezza, calorie e peso!) Il modello di regressione, geometricamente, non sarà più una retta, ma un piano! b1 è il coefficiente angolare della prima retta b2 dice di quanti kg aumenta peso all’aumenta di 1 kcal Diranno aumento unitario di y rispetto x1 e x2 a parità dell’altra x 12 Quello che dobbiamo fare è: a) Calcolare i coefficienti a, b1 e b2 b) Effettuarega i t test per verificare le ipotesi nulle β1 = 0 e β2 = 0. c) Effettuare il test F per verificare se il modello, nel suo complesso, predice y. Quali sono i test che ci interessano? A. (Intercept). H0: a = 0; B. Altezza. H0: β1 = 0; C. `Kcal die`. H0: β2 = 0; Ci dicono se i singoli regressori presentano una relazione lineare con la Y. Sotto la tabella dei coefficienti, di solito ci sono le statistiche del modello, nel suo complesso… Per esempio in R. Multiple R-squared: 0.9746 Adjusted R-squared: 0.9619 F-statistic: 76.64 on 2 and 4 DF p-value: 0.0006468 Osserviamo che nel nostro modello la statistica F con 2 e 4 gradi di libertà è pari a 76.64 ed è significativa per: p m2 e m2>m3 allora inevitabilmente m1>m3. Questo aumenta indebitamente il livello di signicatività. La potenza del test diminuisce: aumenta la probabilità di commettere un errore di primo tipo, rifiutando H0 quando dovremmo accettarla. Quindi se rifiuto l’ipotesi nulla e la V.I. ha 3 o più livelli si fanno: - confronti post-hoc: ogni livello (gruppo) della V.I. è confrontato con tutti gli altri. Esistono numerosi metodi diversi: Bonferroni, Tuckey, Scheffé, Benjamini-Hochberg… - confronti a priori o pianificati: sono decisi indipendentemente dal risultato dell’ANOVA e solo sulla base dell’ipotesi: sono confrontate a coppie due medie, individuali o accorpate. ESEMPIO DI CONFRONTI PIANIFICATI: Abbiamo un gruppo di soggetti non clinici (G1) un gruppo di soggetti clinici con disturbo d’ansia generalizzato (G2) e un gruppo di soggetti clinici con Depressione maggiore (G3), posso decidere di: - Confrontare G1 con ciascuno degli altri gruppi, facendo confronti a coppie (G1 vs G2 e G1 vs G3); - Confrontare G1 con i gruppi G2 e G3 accorpati (G1 vs G2-G3), per vericare se i soggetti non clinici siano cumulativamente differenti dai soggetti clinici. 32 Condizioni di applicabilità dell’ANOVA Per poter applicare un’Analisi della Varianza parametrica, occorre rispettare alcuni presupposti, a carico sia degli ei sia degli yi. Per verificare questi assunti: Ricordiamo, infine, che il modello dell’equazione lineare fra X e Y prevede che gli effetti della variabile indipendente sulla dipendente siano additivi. Questo significa che l’esposizione alla variabile indipendente aggiunge alla misura di ogni soggetto un “tot” di effetto uguale per tutti i componenti di ciascun gruppo o livello. Questo non è sempre vero: ad esempio l’effetto della stessa dose di un farmaco cambia in ragione del peso di chi la assume. Potrebbe diminuire di 10 punti la pressione di un soggetto di 60 kg e di soli 6 punti in un soggetto di 80 kg. Nel caso di non additività aumenta, anche se non drammaticamente, la possibilità di errore di secondo tipo: è più probabile rifiutare H0 scorrettamente. 33 IL TEST DI KRUSKAL – WALLIS Equivalente non parametrico dell’ANOVA between Che cos’è? Utilizza la distribuzione di probabilità χ². È il test non parametrico, per più di due campioni indipendenti e variabile dipendente non parametrica (es. ordinale): analizza le differenze tra i gruppi. Lo scopo del test è determinare se i punteggi di tre o più gruppi di soggetti siano signicativamente diversi (equivalente non parametrico dell’ANOVA between). Come nel caso del test di Mann-Whitney, i punteggi dei soggetti devono essere ordinati per rango come se facessero parte di un unico insieme. IPOTESI NULLA: Per l’ipotesi nulla i gruppi dovrebbero avere un ugual numero di ranghi alti e bassi: se in un gruppo ci fosse una prevalenza di ranghi alti o bassi (ipotesi alternativa) sarebbe probabile che questo rispecchiasse differenze dovute alla variabile indipendente (o di raggruppamento). Per individuare quale ipotesi alternativa monodirezionale sia corretta, si usa il metodo di Ryan del confronto step-wise a posteriori, che consiste in confronti a coppie tra i gruppi (si parte dai gruppi con i due ranghi medi più estremi, e così via), applicando per ogni confronto il test di Mann-Whitney (campioni indipendenti, due condizioni). 34 Lezione 7: ANOVA A UNA VIA A MISURE RIPETUTE Anova univariata entro i soggetti L’equazione generale della relazione lineare che intercorre tra V.I. e V.D. è: La scomposizione della devianza Come nella ANOVA between, anche nell’ANOVA within si devono ricavare le varianze tra le prove e la varianza residua, dividendo le devianze per i rispettivi gdl e, successivamente, calcolare il rapporto F da confrontare con il valore F critico per la probabilità e i gdl appropriati.ì 35 ESEMPIO: Un medico tratta 7 bambini con un disturbo della coordinazione motoria nel seguente modo. 1. Un mese senza alcuna terapia (x1) 2. Un mese di trattamento tradizionale (x2) 3. Un mese di trattamento con musica (x3) Al termine di ogni mese il medico rileva il numero di azioni motorie complesse correttamente eseguite in una prova ad hoc standardizzata. Anche in questo caso si posso usare delle formule semplificate per il calcolo. 36 ESEMPIO: Una ricerca longitudinale ha seguito per 4 anni 10 bambini per valutare l’evoluzione del loro pensiero formale. A cadenza annuale, un test di ragionamento astratto ha portato i seguenti risultati. Si vuole verificare l’effettiva evoluzione lineare del pensiero astratto in questo arco temporale. Come nel caso dell’ANOVA tra i soggetti, se rifiuto H0 so che esiste una qualche differenza signicativa tra le varie condizioni. Non so però tra quali condizioni la differenza sia signicativa. Anche in questo caso dovrò servirmi di confronti post-hoc e confronti a priori. 37 IL TEST DI FRIEDMAN Equivalente NON PARAMETRICO dell’Anova within Che cos’è? Utilizza la distribuzione di probabilità χ². È il test non parametrico per più di due campioni dipendenti e variabile dipendente non parametrica (es. ordinale): analizza le differenze tra le condizioni. Lo scopo del test è determinare se i punteggi di tre o più condizioni siano signicativamente diversi (equivalente non parametrico dell’ANOVA within). Come nel test di Wilcoxon, i punteggi ottenuti da uno stesso soggetto in tutte le condizioni devono essere ordinati per rango. I ranghi di ciascuna condizione vengono poi sommati. Il totale dei ranghi di ciascuna condizione è poi elevato al quadrato. Anche in questo caso abbiamo solo vericato vericato l’esistenza di una generica differenza nel gradimento espresso per le illustrazioni (H1 bidirezionale), MA non abbiamo dimostrato quale gura sia signicativamente più gradita di un’altra. Per individuare quale ipotesi alternativa monodirezionale sia corretta, si usa il confronto step-wise a posteriori, che consiste in confronti a coppie applicando per ogni confronto il test di Wilkoxon (campioni dipendenti, due condizioni). 38 Lezione 8: DISEGNI FATTOTORIALI Disegni con pi V.I. o disegni fattoriali I piani di ricerca che abbiamo visto no ad ora consentono di valutare l’effetto di una sola V.I. sulla V.D. Quando analizziamo l’effetto di due o più V.I. sulla V.D. siamo in presenza di un disegno fattoriale. Caratteristiche dei disegni fattoriali Presenza di due o più V.I. (fattori): ciascuna V.I. è composta da due o più livelli (es. trattamento e controllo/i). Effetto principale: è l’effetto esclusivo di ciascuna V.I. Effetto di interazione: è l’effetto dovuto contemporaneamente alle due o più V.I. Ad esempio: Pensiamo al classico disegno per valutare l’efficacia di un trattamento. Esempio: Un gruppo di ricercatori vuole indagare la paura del buio nei bambini. Decide di prendere in considerazione due variabili: - la luminosità della stanza (buio, poca luce, luce piena) - le immagini viste dai bambini prima di dormire (paurose, neutre, divertenti) Misureranno il tempo impiegato dai bambini ad addormentarsi. 39 IL SISTEMA DI NOTAZIONE DEI DISEGNI FATTORIALI I disegni possono essere anche più complessi e avere più di due V.I. ESEMPIO 1: Si pensi di voler introdurre nel disegno di prima anche la variabile within genitore che accompagna a letto il bambino (madre/padre). Avremo un ipotesi nulla per ognuno degli effetti principali e per ogni interazione: Non esiste una differenza tra le diverse condizioni di luce; Non esiste una differenza tra le diverse immagini; Non esiste una differenza tra i diversi genitori; Non esiste un’interazione tra condizioni di luce e immagini.. Per un totale di 7 H0. 40 ESEMPIO 2: Un altro esempio di disegno fattoriale: Vogliamo scoprire le caratteristiche di una persona che influenzano il giudizio di colpevolezza dato da un giudice quanto una persona è accusata di un crimine. Le ipotesi sono che la piacevolezza dell’aspetto e l’espressione facciale sorridente possano influenzare il giudice. Abbiamo, quindi due V.I.: A. Espressione facciale (2 livelli): neutra; sorridente B. Piacevolezza dell’aspetto (2 livelli): attraente; non attraente 4 combinazioni delle condizioni: attraente/sorridente; attraente/ neutra; non attraente/sorridente; non attraente/neutra. La Variabile Dipendente sarà il giudizio di colpevolezza: i soggetti giudicheranno la faccia - stimolo esprimendo un giudizio di colpevolezza su una scala da 1 a 100. EFFETTI PRINCIPALI Le espressioni neutre sono giudicate più colpevoli di quelle sorridenti. I volti non attraenti sono giudicati più colpevoli di quelli attraenti. Effetti principali e interazioni Per effetto principale si intende l’effetto medio di una variabile in tutti i valori di un’altra variabile. Si parla di interazione tra variabili quando l’effetto di una variabile indipendente sulla dipendente risulta diverso nei differenti livelli dell’altra (o delle altre) V.I. Il sorriso riduce il giudizio di consapevolezza? Nelle facce attraenti sì, ma lo fa aumentare nelle facce non attraenti! Il giudizio di colpevolezza può essere rappresentato come: A - funzione dell’espressione facciale con la piacevolezza come parametro o B – viceversa. Stiamo valutando i numeri così come si presentano, ovviamente per valutare la signicatività degli effetti principali e delle interazioni è sempre necessaria un’analisi statistica! 41 Si può avere interazione senza effetti principali? Se si pensa a un altro disegno: - La lontananza rafforza l’amore… - … lontano dagli occhi, lontano dal cuore? Studiamo il grado di attrazione tra membri di coppie in base alla distanza (A1 - vicino; A2 - lontano) e al “tipo di amore” (B1 - vero amore; B2 - non vero amore). La distanza (effetto principale di A) non ha effetto sull’attrazione, ma c’è un’interazione: la distanza fa aumentare l’attrazione per le coppie innamorate, mentre diminuisce per i irt. Esiste invece un effetto principale di B) per cui il vero amore fa aumentare l’attrazione. 42 INTERAZIONE SENZA EFFETTO PRINCIPALE … E DIVERSI TIPI DI INTERAZIONE. Interazione antagonista Le due variabili indipendenti tendono ad invertire gli effetti l’una dell’altra: una V.I. ha un effetto per un livello dell’altra variabile e l’effetto opposto per l’altro livello. Interazione sinergica Il livello più alto di una variabile potenzia l’effetto dell’altra e viceversa. Questa relazione è evidenziata dalla maggior pendenza della linea che collega la V.D. ad una V.I. (es. A) quando l’altra (B) ha valore più elevato. Interazione con effetto tetto Il livello più elevato di una variabile (es. B) riduce l’effetto differenziale dell’altra variabile (A) sulla V.D. quando è associata ad un più alto livello della prima (B). 43 Lezione 9: ANOVA FATTORIALI Analisi della varianza fattoriale: valutare l’effetto di due o più V.I. su una V.D. Due ricercatori somministrano un nuovo strumento, la Scala per l’esercizio reale delle Opportunità in una serie di strutture per persone con disabilità intellettiva e disturbi del neurosviluppo. Le persone sono classicate per Livello di Disabilità (Lieve, Moderato, Grave, Profondo) e le strutture per tipologia di servizio (CDD - diurno, CSS - residenziale). Valutiamo la dimensione del Benessere Emotivo (una delle dimensioni della Qualità di Vita), che rappresenterà la nostra Variabile Dipendente. 1. E’ un vero esperimento? Possiamo sperimentalmente decidere se una persona ha un livello di disabilità più o meno grave o se frequenta un centro diurno o residenziale? 2. Come sono le variabili indipendenti? Le persone o sono gravi o sono lievi o frequentano un centro diurno, o sono in una struttura residenziale. Si tratta di due variabili between e siamo, quindi, in un disegno fattoriale between. Quanti gruppi? Quante condizioni? Quanti effetti principali? Quante interazioni? Quali sono le ipotesi nulle? L’ANOVA FATTORIALE VALUTA QUESTE IPOTESI NULLE. 44 ANOVA fattoriale between Rappresenta il più semplice disegno fattoriale. Vogliamo vericare l’effetto di due o più variabili indipendenti between congiuntamente ad una variabile dipendente. Se si fa un passo indietro alla all’ANOVA a una via si parla di una relazione che intercorre tra V.D. e una solo V.I. Come cambia con più di una V.I. ? A sx anova a una via a destra cambia con più di una V.I. LE IPOTESI NULLE Dovremo accettare o falsicare tre ipotesi nulle: 1. Quella relativa all’effetto principale di A 2. Quella relativa all’effetto principale di B 3. Quella relativa all’interazione tra A e B LA SCOMPOSIZIONE DELLA DEVIANZA Come nel caso della one-way ANOVA dovremo scomporre la devianza, in questo caso in: - Devianza dovuta all’effetto principale di A - Devianza dovuta all’effetto principale di B - Devianza dovuta all’interazione tra A e B - Devianza d’errore 45 LA DIMENSIONE DELL’EFFETTO Come possiamo stabilire quale sia il fattore / V.I. che ha il maggior impatto sulla dipendente, se tutti gli effetti principali e le interazioni sono signicative? Anche qui possiamo calcolare il coeficiente n2 oppure il coeficiente n2 parziale, definito come la proporzione di variabilità attribuita al fattore una volta esclusi (parzializzati) gli altri fattori. Come dicevamo all’inizio, si avranno 3 F: 46 ANOVA fattoriale mista Si applica ai disegni fattoriali in cui vi sia almeno un fattore tra (between) e almeno un fattore entro (within). IPOTESI NULLE Anche in questo caso avremo almeno tre ipotesi nulle: 1. Quella relativa all’effetto principale di A 2. Quella relativa all’effetto principale di B 3. Quella relativa all’interazione tra A e B Facciamo un passo indietro, all’ANOVA a una via. Nell’ANOVA entro i soggetti, a devianza totale viene divisa in 3 componenti Nell’ANOVA fattoriale mista, la variabilità dei dati viene scomposta in due “rami”, uno per il fattore between, l’altro per il fattore within: p = numero dei gruppi (numero dei livelli della V.I. between) q = numero delle prove ripetute (numero dei livelli della V.I. within) n = numero dei soggetti in ogni gruppo 47 ANOVA fattoriali within Si applica ai disegni fattoriali in cui tutti i fattori sono entro i soggetti (within). IPOTESI NULLE Anche in questo caso avremo almeno tre ipotesi nulle. 1. Quella relativa all’effetto principale di A 2. Quella relativa all’effetto principale di B 3. Quella relativa all’interazione tra A e B Nell’ANOVA fattoriale within, la variabilità dei dati viene scomposta in due “rami”, uno relativo alla variabilità dovuta alle differenze individuali (devianza tra i soggetti), l’altra per i fattori entro i soggetti: a = numero dei livelli del fattore A b = numero dei livelli del fattore B n = numero dei soggetti 48 ESEMPIO: Vogliamo valutare l’ansia di stato e l’ansia di tratto, misurate attraverso lo STAI, prima di andare a lavorare, durante la pausa pranzo e all’uscita dal lavoro. L’ipotesi è che il momento della giornata determini una differenza solo per l’ansia di stato e non per quella di tratto. Vogliamo valutare l’ansia di stato e l’ansia di tratto (A: A1=Stato; A2=Tratto), misurate attraverso lo STAI, prima di andare a lavorare, durante la pausa pranzo e all’uscita dal lavoro (B: B1=Prima; B2=Pausa; B3=Dopo). L’ipotesi è che il momento della giornata determini una differenza solo per l’ansia di stato e non per quella di tratto. - Effetto principale di A - Effetto principale di B - Interazione tra A e B 49

Use Quizgecko on...
Browser
Browser