Statistica2 Domande Esame Riepilogo PDF
Document Details
Uploaded by WellRunParody7977
University of Modena and Reggio Emilia
Tags
Related
Summary
Questo documento contiene domande sull'analisi dei dati e la statistica, coprendo argomenti come analisi dei dati, statistiche descrittive, grafici statistici, analisi della correlazione e concetti correlati.
Full Transcript
Strumenti e modelli di analisi dei dati nella ricerca psicobiologica DOMANDE ESAME (riassunto vari files) Slides 1/2: Guardare i dati – introduzione ai grafici Istogramma – Diagramma: a scatola (box plot) – a punti (dot plot) – a barre (bar plot) – a linee – a nuvola di punt...
Strumenti e modelli di analisi dei dati nella ricerca psicobiologica DOMANDE ESAME (riassunto vari files) Slides 1/2: Guardare i dati – introduzione ai grafici Istogramma – Diagramma: a scatola (box plot) – a punti (dot plot) – a barre (bar plot) – a linee – a nuvola di punti (scatter plot) Che tipo di grafico è rappresentato nella figura seguente? Box plot (a scatola) Che tipo di grafico è rappresentato in figura? Diagramma a barre o bar plot Nel box plot è possibile visualizzare anche le seguenti caratteristiche: campo di variazione dei valori, la mediana, i quartili inferiore e superiore, la simmetria della distribuzione (grafico a barre) Che tipo di grafico è rappresentato in figura? Due barre con le barrette di errore bar plot Quali dei seguenti grafici illustra visivamente dove cade il 50% centrale dei dati (scarto interquartile)? Diagramma boxplot Nel box plot rappresentato, che valore è indicato dalla freccia? Mediana Negli istogrammi: l’altezza dei rettangoli è uguale al numero (o alla frequenza) dei dati con valori compresi nell’intervallo corrispondente alla base del rettangolo Quali caratteristiche distribuzionali sono facilmente discernibili da un istogramma? Asimmetria, curtosi (allontanamento da normalità distributiva) e multimodalità Formato wide diverso da formato long: Contiene le variabili nelle colonne e le osservazioni nelle righe (wide= in ogni riga più osservazioni, long = una osservazione per ogni riga) Dot plot diverso da scatter plot: 1 sono puntini incolonnati (per pochi dati), 2 sono puntini distribuiti in una nuvola 1 Formato Tydy in R: ogni variabile ha una colonna, ogni osservazione è nella propria riga, ogni valore nella sua cella formato ottimale Slides 2bis – La probabilità dei dati osservati Distribuzione campionaria e errore (deviazione) standard – Intervalli di confidenza – Ipotesi nulla (p-value) – Significatività dell’effetto/Test statistic=quanto il modello spiega i dati (t, F, chiquadro) - Test a una/due code - Errore tipo I (alfa) e II (beta) – Dimensioni (rilevanza/grandezza) dell’effetto (effect size): d Cohen, r Pearson (% Rquadro), rischio relativo (odds ratio) – Power analysis/Potenza del test (statistica) – Zscore La grandezza di un effetto statistico può essere valutata tramite i seguenti test: d di Cohen, r di Pearson, odds ratio Misurando le dimensioni di un effetto statistico con coefficiente di Pearson e ottenendo un valore di r = 0.21 posso dire che l’effetto rilevato è: da piccolo a medio 0.1 effetto piccolo = 1% della varianza 0.3 effetto medio = 9% della varianza 0.5 effetto grande = 25 % della varianza La correlazione: si misura con il coefficiente di correlazione di Pearson Indice di correlazione di Pearson: varia sempre tra -1 e +1 Un valore r =.5 corrisponde a una correlazione: di grandi dimensioni Forte linearità tra due variabili: r = 0.9 Se r =.55 che dimensioni ha l’effetto? Grandi Dal seguente output di R relativo a un’analisi di correlazione si può inferire che: per rilevare un effetto di grandi dimensioni r =.5 utilizzando una potenza di 0.8 e un livello di p = 0.05 è sufficiente utilizzare un campione di 28 partecipanti (per effetto medio 0.3 occorrono 85 pex) Per rilevare un effetto di correlazione semplice r =.1 con un livello di significatività α =.05 e una potenza statistica di 0.8 quanti soggetti devo reclutare in uno studio approssimativamente? circa 760 - 800 (quando un effetto è piccolo ci vogliono tanti soggetti) Output di R: Pwr.r. test (Potenza statistica) L’errore standard: è la deviazione standard della distribuzione campionaria media La distribuzione campionaria delle medie: per campioni sufficientemente grandi (N > 30) è approssimativamente normale, con media pari a quella della popolazione ES/SE = DS della distribuzione campionaria della media: DS/radice quadrata di N Gli intervalli di confidenza al 95% per la media µ (mu) in un campione sufficientemente grande N > 30, con errore standard SE, sono dati da: 95% µ +/- 1.96 x SE Quale delle seguenti interpretazioni del concetto di intervallo di confidenza CI al 95% per la media di un campione è corretta? Se prendiamo 100 campioni dalla stessa popolazione e calcoliamo media e CI per ciascuno di essi, ci aspettiamo che la media della popolazione cada all’interno di 95 CI su 100 Quale dei seguenti non rappresenta un buon metodo per trattare gli outliers: escludere dall’analisi i casi con valori che distano più di 1.5 di deviazione standard dalla media (anche Slides3) 2 🡪 🡪 Se il punteggio medio in un test di apprendimento è 26 e la deviazione standard è 4, quale è la z-score corrispondente a un punteggio pari a 16? – 2.5 (16-26)/4)) Z score: calcolare punteggio normale, il punteggio medio e il totale/deviazione standard. La formula: z = (Xi – X)/DS Il punteggio medio di un test di memoria è 32 e la deviazione standard è 8. A quanto è lo z- score corrispondente al punteggio 18? - 1.75 (18-32)/8)) L’ipotesi nulla testata in un esperimento: viene indicata con Ho e suppone che non vi sia un effetto significativo associato ai gruppi o al trattamento sperimentale Tipico esperimento: generare un’hp sperimentale e nulla, raccogliere i dati, rifiutare l’hp nulla se la probabilità associata al test è < 0.05 Cos’è la significatività di p? Probabilità con cui un modello spiegherebbe al meglio i dati se provenissero da una popolazione per cui è vera Ho. Quindi se p < 0.05 allora l’effetto è significativo e si rifiuta Ho Cosa esprime la significatività p-value in un test statistico? la probabilità che i risultati non siano dovuti al caso, ovvero la probabilità che l’ipotesi nulla sia falsa Quale delle seguenti affermazioni sul p-value di un test statistico è errata? Corrisponde al valore β (è vero invece che= rappresenta probabilità di falsi positivi, è sempre < 1, per convenzione l’effetto stimato è significativo se il suo valore è < 0,05) Valutare miglioramenti in un campione di pazienti con terapia sperimentale si usa Test a una coda = servono per valutare solo il miglioramento o peggioramento Test a due code = valuta sia miglioramento che peggioramento Bambini imparano più rapidamente dopo i 7 anni Test a 1 coda monodirezionale Cosa si suppone quando abbiamo ipotesi nulla? Che non c’è effetto significativo: se il test risulta significativo l’ipotesi nulla non è verificabile Ipotesi nulla di t-test per campioni appaiati: m1-m2 = 0 (anche Slides6) La frase “la media della statura della popolazione da cui è estratto il campione di italiani è diversa dalla media della popolazione da cui è estratto il campione di norvegesi” esprime: ipotesi alternativa, bidirezionale per il confronto tra medie (quando c’è = o ≠ ipotesi bidirezionale, quando c’è > o < unidirezionale a una coda perché può andare solo in un verso) L’hp nulla nel caso di un test per campioni indipendenti con media mA e mB, rispettivamente, corrisponde a: mA = mB >> perché mA-mB è tipicamente 0 > mA-mB = 0 mA = mB La bontà con cui un modello statistico rappresenta i dati è detta: fit Distinguere: Errore tipo 1: abbiamo effetto nel nostro campione e non nella popolazione Errore tipo 2: effetto nella popolazione (beta) e non nel campione Family wise error rate: Errore tipo 1 che si commette in caso di confronto tra più medie (anche Slides7) Un errore di tipo 1: si verifica quando si rifiuta l’hp nulla sulla base dei dati raccolti, ma in realtà l’effetto sperimentale non è presente nella popolazione Si commette un errore di tipo2 quando: non rifiutando l’hp nulla sulla base dei dati raccolti nel campione quando l’effetto sperimentale è in realtà presente nella popolazione Il family wise error rate corrisponde: al rischio complessivo di errori di tipo 1 (anche Slides7) La potenza (1 - β) a un test: corrisponde alla probabilità del test di rilevare un effetto delle dimensioni specificate se presente nella popolazione (si può visualizzare nei box-plot) 3 🡪 Slides 3 – Requisiti test parametrici (presupposti della validità) a)Normalità (metodo grafico: Istogramma - Grafico Q-Q Plot; metodo numerico: kurt, skew/asimmetria, test Shapiro Wilk) b) Omogeneità della varianza/Omoschedasticità (test Levene – Fmax Hartley/rapporto tra varianze) - c) Scala misura intervalli – d) Indipendenza – Trattamento valori anomali/outliers (rimozione – trasformazione (log, sqrt, reciproco, invers) – sostituzione) – Test non parametrici opp versioni robuste (media troncata – Mestimatore – bootstrapping) Un grafico Q-Q PLOT: indica che la distribuzione è normale se ha approssimativamente la forma di una retta – forma a S o a S invertita indica una deviazione della media diversa da 0 (distribuzione o troppo a punta o troppo appiattita) Come si controlla che i requisiti di omoschedasticità e normalità siano soddisfatti in un modello di regressione? Si esaminano il grafico dei residui in funzione dei valori predetti e il Q-Q plot dei residui (anche Slides5) Grafico per studiare l’asimmetria in una distribuzione: Q-Q plot Q-Q plot normale quando: dati formano una linea retta Un grafico quartile-quartile: indica che la distribuzione normale sia approssimativamente la forma di una linea retta Possiamo in genere considerare una distribuzione come normale se: il test Shapiro Wilk restituisce un valore p > 0.05 perché p < 0,05 indica non normalità Dal seguente output di R si inferisce che: non c’è sufficiente evidenza dei dati per inferire una non normalità, ma il valore è al limite della significatività (output con W = 0.96354= più vicino a 1 più è normale; p-value = 0.05259) Possiamo considerare una distribuzione come normale se: il test di Shapiro – Wilk restituisce valore p > 0.05 Possiamo considerare una distribuzione come normale se: Campione ha numerosità > di 30 Test shapiro-wilk restituisce valore p>0.05 Il test Fmax di Hartley restituisce valore p effetto su una è semi-parziale, se su due è parziale) Tecniche non parametriche per misurare la correlazione tra due variabili sono basate sul calcolo di: P (rho) di Spearman e T (tau) di Kendall La covarianza è Versione non standardizzata del coeff di correlazione Una misura di quanto è stretta la relazione tra due variabili Dipendente dalle unità di misura delle variabili Tutte corrette Correlazione parziale: eliminare l’influenza di una terza variabile Quando usare correlazione biseriale: Quando si cerca l’associazione tra due variabili di cui almeno 1 dicotomica ma che si può considerare continua Quando uso correlazione semi-parziale: Quando voglio analizzare l’effetto tra due variabili tenendo costante l’effetto di altre variabili su solo una delle due Si dice che due variabili covariano quando: a grandi deviazioni della prima variabile dalla sua media corrispondono grandi deviazioni della seconda variabile sulla sua media, con lo stesso segno (covarianza +) o di segno opposto (covarianza -) La correlazione: si misura con il coefficiente di correlazione di Pearson Pairwise case deletion: Tecnica per gestire i dati mancanti che prevede l’eliminazione solo delle correlazioni che contengono il dato mancante Litwise case deletion: Il soggetto con dati mancanti viene escluso da tutte le correlazioni 5 🡪 Slides 5 - Regressione a) y=(B0+B1x)+e = Semplice/lm (altro modo di vedere correlazione, r di Pearson e R2= SSm/ SSt)) – modello lineare (retta) - metodo dei minimi quadrati – 3 tipi di somme di differenze al quadrato (sum of squares): total (SSt), residual (SSr), model (SSm) - coeff angolare/coeff di regr/b1 – var esplicativa/predittore/regressore/x/VI – gradi di libertà/df (N-var esplicativa-1) – b) y=(B0+B1x1+B2x2)+e Multipla (2 var esplicative/piano) – multipla (n var esplicative/ iperpiano) – R2 multiplo è biased (gonfiato) – adjusted R2 opp mod parsimoniosi (Akaike/ AIC) – c) Metodi di costruz modello (simultaneo, gerarchico, passo a passo/stepwise in avanti/ indietro/both, su tutti i sottoinsiemi/all-subsets) – d) Valutaz modello (accuratezza, generalizzabilità) – accuratezza: casi anomali/outliers e casi influenti (distanza di Cook) – residui standardizzati (misura grande residuo) – generalizzabilità: presupposti statistici (tipi di variabili, varianza, multicollinearità/VIF (b inaffidabili, r limitato, ruolo predittori indeterminato), variabili esterne, omoschedasticità dei residui, errori indipendenti, normalità degli errori, indipendenza, linearità) – convalida incrociata (diff adjR2 e R2 shrinkage) – strategie per violaz presupposti statistici (trasformaz; bootstrapping) – Predittori/VI categoriali (+di 2 livelli occorrono dummy di comodo) – attributo contrast (manuale opp automatico) Quale è la relazione tra la somma degli scarti quadratici (SS = sum of squared errors), le dimensioni del campione N e la sua varianza? S^2 (varianza) = SS/N-1 In un modello di regressione R^2 rappresenta: la proporzione della varianza nella variabile dipendente spiegata dal modello Quale delle seguenti affermazioni riguardo alla t-statistic in un modello di regressione non è corretta? La t-statistic è uguale al coefficiente di regressione b diviso per la sua regressione standard Se in una regressione multipla una delle variabili esplicative è di tipo categoriale a m livelli, con m > 2: dobbiamo scomporre la variabile categoriale in (m - 1) variabili fittizie (dummy) che rappresentino ciascuna soltanto 2 livelli Sono casi influenti ma possono influenzare in maniera più o meno seria la stima dei coefficienti di regressione: quando i dati non sono ben rappresentati dal modello La X nella retta di regressione è: la v. indipendente Quale di queste caratteristiche della regressione semplice è falsa? Yi = (b0 + b1 + b2 + x quadrato/ 1 sola variabile) Regressione: Tecnica statistica che cerca di individuare una relazione lineare tra due variabili al fine di usare una per predire i valori dell’altra Overfitting: Modello di regressione che fitta troppo il campione e quindi è poco generalizzabile perché troppo specifico per il campione scelto (=il modello fitta anche per variazioni casuali) Quale delle seguenti affermazioni sulla regressione è falsa? La relazione fra le variabili è definita da una formula y = p0x + p2 x2 Distanza di COOK: Misura dell’influenza globale di un caso sul modello 6 Il seguente grafico diagnostico per un modello regressivo indica: che non c’è evidenza di eteroschedasticità o non linearità (nel caso in cui il grafico sia una massa di punti al centro con scritto Residual vs Fitted) Regressore: v. indipendente che serve per predire i valori della v. dipendente Nel contesto della regressione quale delle seguenti affermazioni riguardo ai valori anomali (outlier) è falsa? Sono sempre casi influenti (anche Slides3) Come si controlla che i requisiti di omoschedasticità e normalità siano soddisfatti in un modello di regressione? Si esaminano il grafico dei residui in funzione dei valori predetti e il Q-Q plot dei residui (anche Slides3) Cos’è il coefficiente b 1 (modello lineare): pendenza della retta Residual sum of squares: Differenza tra valori predetti dal modello e dati del campione Strumento x valutare la bontà del fit di un modello: Criterio informativo di AKAIKE Regressore/Predittore: v. indipendente che serve per predire i valori della v. dipendente Adjusted R2: Valore corretto in base al numero di regressori usati Slides 6 – Confronto di due medie (=confronto medie tra 2 gruppi) campioni indipendenti – misure ripetute/campioni appaiati/paired – >Significatività: valutazione visiva box plot - T-test (per val medie significativamente differenti=campioni da pop diverse; simile a regressione lineare=stessi requisiti, es. distribuz campionaria delle medie normale e omoschedasticità) – a)t-test campioni indipendenti (rapp variabilità spiegata e variabilità dovuta al caso; campioni dim uguali opp diversi/uso variante di Welch/gradi di libertà n1+n2-2) – b)t-test campioni appaiati (diff medie tra le due condizioni/gradi di libertà N-1) - c)metodi robusti (per dati asimmetrici o anomali)/funz Rand Wilcox: media troncata (eliminaz code estreme) – bootstrapping – M estimator (è la funz stessa a stimare i dati da togliere) - >Dimensioni effetto: convers t-test in r di Pearson Il numero di gradi di libertà per un t-test a campioni indipendenti per numerosità N1 e N2, rispettivamente è pari a: N1 + N2 – 2 Sono prerequisiti all’applicazione del t-test per campioni indipendenti (stessi requisiti dei test parametrici): normalità della distribuzione campionaria delle medie, scala di misura dei dati (almeno a intervalli), omogeneità della varianza nei due gruppi, o uso della variante Welch nel caso di eteroschedasticità Un unico gruppo di soggetti sperimentali è stato sottoposto ad un addestramento per migliorare le capacità attentive: i dati sono stati raccolti su un campione ampio prima del 7 trattamento e a due mesi dopo il trattamento. Quale tipo di statistica è più appropriata per valutare l’effetto dell’addestramento? T-test per campioni appaiati Voglio individuare le differenze tra la fase pre-training e post con un unico gruppo di persone, che test? T-test a misure ripetute per gruppi appaiati Quando si usano t-test per campioni indipendenti? Quando la distribuzione delle medie è normale In quale dei seguenti casi è appropriato usare un t-test per campioni indipendenti? Quando vogliamo valutare la significatività della differenza tra le medie di soggetti diversi e la distribuzione campionaria delle medie è normale Ipotesi nulla di t-test per campioni appaiati: m1-m2 = 0 (anche Slides2bis) Si usa un test di Welch quando omoschedasticità è soddisfatta o in caso di eteroschedasticità? Lo usiamo quando vi è una possibile eteroschedasticità. Produce risultati validi anche in eteroschedasticità Il test di Welch si usa quando: a. Si vuole usare una anova ma il prerequisito della normalità non è soddisfatto b. Si vuole usare una anova in un disegno sperimentale non bilanciato c. Si vuole usare un t-test su campioni molto piccoli (N AB AC AD BC BD CD – 6 test quindi 0.05/6 Nei disegni sperimentali non bilanciati: il numero di soggetti non è uguale in tutti i gruppi Family wise error rate Errore tipo 1 che si commette in caso di confronto tra più medie (anche Slides2bis) Slides 8 - ANCOVA Anova + aggiunta di covariate (possibili confondenti) – requisiti: stessi Anova + indipendenza covariate + omogeneità pendenza delle rette di regressione – Indipendenza covariate: per calcolo contributo di ogni predittore: sum of squares tipo I (solo contrasti dei predittori che lo precedono) /II (contributi di tutti i predittori eccetto interazioni VI/di ordine superiore) /III (contributi di tutti i predittori) – Omogeneità pendenza rette di regressione: se no omogeneità allora uso procedure robuste: 5 valori covariata con rel costante sul vd; trimmed means; bootstrapping – dimensione effetto con contrasti pianificati e post-hoc Supponete di voler valutare la differenza nei tempi di reazione tra un gruppo di pazienti affetti da sindrome di affaticamento cronico e un gruppo di pazienti sani. Perché lo stato depressivo può influire sulla capacità psicomotoria e quindi sui tempi di reazione, sottoponete ogni paziente a un questionario che rileva il livello di depressione con l’intenzione di usare tale misura come covariata di un’ANCOVA. Se scoprite che il gruppo di pazienti ha un livello di depressione significativamente maggiore del gruppo dei soggetti sani, è legittimo usare quest’ultima come covariata? No, perché la covariata del livello di depressione NON è statisticamente indipendente dalla manipolazione sperimentale, il che pregiudicherebbe l’interpretazione dei risultati 9 Quali sono i requisiti dell’ANCOVA oltre a quelli dell’ANOVA? Indipendenza della covariata e della manipolazione sperimentale, omogeneità delle pendenze delle rette di regressione Che cosa rappresenta il valore del coefficiente della covariata in un’ANCOVA? La variazione nel valore della variabile dipendente per una variazione unitaria del valore della covariata Che info potete estrarre dal seguente output di un’ANCOVA che esamina l’effetto del tipo di dieta sul calo di peso controllando per l’età dei volontari: sono stati impiegati 3 tipi di dieta su 43 soggetti e l’effetto della manipolazione sperimentale è altamente significativo con p < 0.001: l’inclusione dell’info sull’età dei volontari NON migliora significativamente il fitting del modello Un insegnante di musica è interessato a sapere se il tipo di strumento suonato dagli studenti sia associato a livelli di ansia da prestazione differenti nell’esame finale. In un gruppo di soggetti che suonano la chitarra, la batteria e il piano ha quindi misurato il livello di ansia durante l’esame. Poiché il livello di ansia può essere influenzato dal livello di competenza dello studente (da 1 = principiante a 5 = avanzato) la valutazione dell’effetto dello strumento sul livello di ansia deve essere controllata per il livello di competenza. Che tipo di analisi si deve usare? Analisi della covarianza (ANCOVA) In un’ANCOVA semplice con una variabile categoriale e una covariata continua, che cosa rappresenta il valore di n^2 parziale? La frazione di varianza nella variabile dipendente spiegata dalla manipolazione sperimentale, dopo aver controllato per la varianza spiegata dalla covariata Scopo e definizione ANCOVA: analisi delle covarianze, stabilire effetto delle v. dipendenti controllando le v. confondenti In un’ANCOVA che cosa rappresentano le medie corrette o marginali (adjusted o marginal means)? Le medie della variabile dipendente nei diversi gruppi sperimentali corrette per l’effetto della covariata Output di un’ANCOVA che esamina “dietweight” come leggiamo i gradi di libertà: 39 Definizioni varie Nei disegni sperimentali non bilanciati: il numero di soggetti non è uguale in tutti i gruppi Considerando la distribuzione di frequenza per il gradimento di un libro su Amazon illustrato dal seguente grafico (votazione da parte di 13 individui) quale è la moda dei dati? 4 (n6 pex hanno dato 4 stelle = è il num di pex con la frequenza maggiore) > se chiede la media = 3.69 10 Predittore è sinonimo di: variabile indipendente La varianza nella variabile dipendente dovuta a variabili che non sono state misurate è detta: varianza non simmetrica (o non sistematica?) Cos’è una variabile confondente? Una variabile che influenza la variabile dipendente in maniera simile a/o al posto della indipendente Un campione di studenti (N = 30) è arruolato su uno studio di apprendimento. Ai primi 15 soggetti reclutati viene detto che la prova sarà particolarmente difficile mentre agli altri 15 non vengono fornite indicazioni riguardo alla difficoltà. La prova consiste nell’apprendimento di liste di parole: vengono calcolati il numero di parole che il soggetto riesce a rievocare e il numero di intrusioni. Quale è la variabile indipendente dello studio? Informazioni sulla difficoltà della prova A un gruppo di 30 bambini di 10 anni viene presentata una prova di scrittura nella quale vengono dettate 30 parole. Gli sperimentatori valutano sia gli errori commessi che i tempi impiegati nello scrivere ciascuna parola. Indicare le variabili oggetto di studio e le loro caratteristiche: numero errori = v. dipendente discreta – tempo di esecuzione = v. dipendente continua In un test psicologico, un campione di studenti ha ottenuto i seguenti punteggi… calcolare la media dei punteggi nel test: fare calcolo della media > mediana 8 media 9 La variabile casuale normale: ha sempre la media = 0 se standardizzata La verifica di ipotesi: consente di stabilire con un margine d’errore se il valore stimato per un parametro è accettabile Quale dei seguenti indici può assumere solo valori positivi? Varianza La media: è calcolata solo per le variabili quantitative I quartili: sono calcolabili solo per le variabili quantitative Una variabile casuale discreta: assume un numero finito di valori La mediana è calcolabile: per variabili quantitative e per variabili qualitative ordinali Il coefficiente di variazione può essere calcolato: per caratteri solo quantitativi La variabile casuale normale: è simmetrica La funzione di probabilità è: la probabilità di estrarre casualmente dalla popolazione un individuo con la caratteristica x I parametri ignoti: sono stimabili solo per variabili quantitative discrete La funzione di ripartizione (def: è la probabilità che la variabile casuale X assuma valori minori o uguali a un generico valore x: formula = P(X < o uguale x) dove x è un numero reale qualunque) Test Stroop esperimento: discreta = numero di errori commessi – continua (variabile dipendente continua) = tempo di reazione Italiani vs francesi: tutte corrette Quale è la v. indipendente di un gruppo che viene valutato per osservare 2 metodi di apprendimento diversi? Metodo di apprendimento Che variabile è Qi: scala a intervalli equivalenti Variabile confondente: variabile che può incidere sull’esito di uno studio Varianza sistematica: Varianza sistematica dal modello Variabile manipolata dal ricercatore: variabile indipendente Quale delle seguenti grandezze statistiche è meno influenzata da valori anomali nel campione? Mediana 11