Metodologia di Ricerca Parte 2 PDF
Document Details
Uploaded by CleanestBiography
Universitas Mercatorum
Tags
Related
Summary
Questo documento presenta una trattazione sulla validità interna nella ricerca. Vengono descritti i quattro tipi di validità, con particolare focus sulla validità interna e sulle minacce che la possono compromettere. L'articolo spiega come determinare se i risultati di una ricerca rispecchino il fenomeno studiato o siano influenzati da altre variabili non considerate.
Full Transcript
Validità Interna 1. Tipi di validità In generale, è possibile dire che la validità di una ricerca attiene alla qualità, sotto i diversi aspetti specificati oltre, dei risultati raggiunti, in termini di rigore metodologico, significatività, attendibilità e generalizzabilità degli enunciati proposti,...
Validità Interna 1. Tipi di validità In generale, è possibile dire che la validità di una ricerca attiene alla qualità, sotto i diversi aspetti specificati oltre, dei risultati raggiunti, in termini di rigore metodologico, significatività, attendibilità e generalizzabilità degli enunciati proposti, solidità di impianto. In termini più ampi,la validità di una ricerca : ci permette di valutare se quello che è stato trovato nella ricerca rispecchia effettivamente il fenomeno studiato, oppure dipende da variabili di disturbo; la validità di una ricerca ci dice se i risultati aggiungono qualcosa alla teoria di riferimento e consentono un utile modello interpretativo; la validità di una ricerca ci dice se le deduzioni tratte dai dati sono estensibili ad altri contesti; infine ci dice se la relazione trovata tra le variabili dipende dalla loro reciproca influenza, oppure se dipende dal caso. Come suggerito da questa definizione, esistono fondamentalmente quattro tipi di validità: validità interna; validità di costrutto; validità esterna; validità statistica. La validità interna si riferisce alla relazione tra la variabile indipendente e quella dipendente: vi è validità interna quando la relazione tra queste due variabili è di tipo causale, cioè quando si può provare che le modifiche apportate alla variabile indipendente causino quelle rilevate nella variabile dipendente. La validità interna di una ricerca risponde al quesito: i risultati trovati rispecchiano effettivamente il fenomeno studiato o dipendono da altre variabili non considerate. La validità di costrutto si riferisce alla corrispondenza tra il piano della ricerca e la teoria di riferimento. Una ricerca è valida se si possono ragionevolmente escludere spiegazioni alternative dei dati rispetto alla teoria di riferimento. Perché ciò sia possibile è necessario che il riferimento teorico sia chiaro ed univoco. La validità esterna di una ricerca fa riferimento alla possibilità di generalizzare, cioè di estendere le conclusioni tratte dalla ricerca empirica ad ambiti più ampi rispetto a quello in cui la ricerca è stata compiuta. Una particolare forma di validità esterna è la cosiddetta validità ecologica, termine con cui si indica il fatto che la conduzione degli esperimenti determina spesso condizioni ecologiche (ambientali) un po’ artificiali, che possono causare nei soggetti uno snaturamento dei loro comportamenti, che così non corrispondono più a quelli sviluppati in condizioni ambientali naturali. Si ha validità ecologica tanto maggiore quanto più le caratteristiche ambientali in cui si svolge la ricerca sono simili alle condizioni ambientali naturali in cui agisce la popolazione di riferimento. Infine, la validità statistica ha lo scopo di verificare se la relazione trovata tra le variabili sperimentali è o meno di tipo casuale, ovvero se l’effetto è significativamente da quello che si sarebbe ottenuto per caso. La validità statistica si occupa di controllare la variabilità dovuta al caso, tramite il calcolo delle probabilità e dell’inferenza statistica. 2. Concetto di validità interna Validità Interna Si ha validità interna quando la relazione tra due variabili è di tipo causale; ovvero, quando si può ragionevolmente provare che le modifiche della variabile indipendente hanno causato quelle della variabile dipendente e che queste ultime non dipendono dalla concomitante variazione di altre variabili. L’esclusione di possibili fattori di confusione implica il controllo di tutte le variabili che potrebbero influenzare la relazione causale in esame. Il compito del ricercatore consiste nell’eliminare tutte le possibili minacce alla validità interna e nel creare condizioni adeguate affinché si possa concludere che la relazione di causa-effetto è genuina. Affinché si abbia validità interna occorre che il nesso relazionale enunciato nelle conclusioni della ricerca sia effettivo, cioè sussista realmente e non sia dovuto in modo erroneo a circostanze inquinanti non controllate dallo sperimentatore o non sia comunque reso più incerto, se non addirittura sbagliato, da fattori di disturbo. Esempio In un esperimento si vuole effettuare un confronto fra due particolari espedienti didattici; due classi parallele (diciamo A e B), di cui è accertata l’equivalenza sotto i vari aspetti di interesse per quella sperimentazione, sono sottoposte ai due corrispondenti trattamenti; al termine, entrambe le classi sono sottoposte ad un medesimo test. Dai risultati raccolti emerge che la classe A ha dato risultati superiori alla B. Conclusioni: l’espediente A dà migliori risultati del B. Ora, immaginiamo che il giorno prima della verifica un ragazzo della classe B abbia compiuto gli anni e abbia dato una festa, invitando i suoi compagni. Dunque, i ragazzi della classe B il giorno prima della verifica non si sono esercitati e, magari, si sono anche coricati un po’ più tardi del solito. A questo punto è giustificato il dubbio seguente: i migliori risultati di A sono davvero da imputare al corrispondente espediente didattico? O piuttosto sono imputabili alle diverse condizioni (non controllate dallo sperimentatore) in cui si sono presentati alla verifica i ragazzi della classe B? Nell’esempio, la circostanza non controllata potrebbe invalidare le conclusioni formulate dal ricercatore. La circostanza fortuita del compleanno minaccia la validità interna della ricerca, nel senso che l’affermazione contenuta nelle conclusioni del ricercatore non è esente da un fattore di disturbo. Problemi per la validità interna Al di là delle variabili di confusione, un serio problema per la validità interna deriva dal fatto che lo sperimentatore non può controllare alcune variabili indipendenti legate al soggetto, quali: Il sesso Il livello di istruzione Lo status socioeconomico Per esempio, tutti gli studi che intendono valutare le differenze tra i processi cognitivi di uomini e donne devono affrontare il problema che le eventuali differenze riscontrate potrebbero non essere causate da fattori biologici, ma piuttosto da influenze culturali che derivano dal modo in cui i due gruppi sono stati educati nel corso della loro vita. Analogamente, negli studi che valutano le differenze di QI tra le razze, vi possono essere una molteplicità di variabili confuse con la razza. In particolare, lo status socioeconomico e il livello di istruzione dei partecipanti di razza nera (ad esempio africani) sono in genere inferiori rispetto a quelli riscontrati nei partecipanti di razza bianca. Naturalmente, non tutti i possibili fattori di confusione possono essere controllati dallo sperimentatore. Così, la maggior parte delle ricerche sperimentali in psicologia non prende in considerazione variazioni delle fasi lunari o dei ritmi circadiani, in quanto si assume che esse abbiano uno scarso impatto sui processi cognitivi dei partecipanti. 3. Minacce alla validità interna Le minacce alla validità interna sono di vario tipo, ma essenzialmente riguardano la possibilità di confondere variabili potenzialmente importanti con la variabile indipendente che si sta studiando. Un primo tipo di minaccia è dovuto ad eventi esterni al laboratorio. Infatti, negli esperimenti in cui gli stessi soggetti vengono esaminati in condizioni sperimentali differenti in tempi diversi, è possibile che eventi esterni al laboratorio influenzino i risultati. Si tratta di eventi storici esterni all’ambiente sperimentale che possono avere rilevanti influenze sul comportamento dei soggetti nell’ambito della sperimentazione. Ad esempio: una forzata e prolungata sospensione dell’attività didattica a causa di eventi atmosferici; un evento di forte disturbo in concomitanza ad una importante prova di verifica, come un evento luttuoso; un improvviso cambio nelle abitudini di lavoro scolastico dovuto alla modifica di un regolamento, o all’apertura di nuove infrastrutture, come una biblioteca o un laboratorio. Se uno (o più) di questi eventi dovesse accadere nella fase centrale della sperimentazione (vale a dire tra la fase di pre-test e quella di post-test), potrebbe influenzarne positivamente o negativamente i risultati (a seconda che si tratti di un evento favorevole o sfavorevole), in modo tale che potrebbe indurre il ricercatore a trarre conclusioni sbagliate o comunque non del tutto affidabili. Per meglio dire: un esito positivo (o negativo) della sperimentazione potrebbe erroneamente essere imputato al solo trattamento, mentre in realtà l’evento storico potrebbe aver influito sul risultato finale, magari anche pesantemente. Effetto della Storia Occorre notare che quando si parla di effetto della storia (o della storia attuale), non ci si riferisce alle storie individuali dei singoli soggetti sperimentali, perché queste influiscono solo sui risultati conseguiti singolarmente dai soggetti stessi. Ora, siccome si suppone che gli eventi individuali si distribuiscano casualmente, ed i corrispondenti effetti possono essere sia positivi che negativi, possiamo affermare che gli eventi sui singoli soggetti tendono a compensarsi reciprocamente, e quindi l’effetto medio complessivo sulla sperimentazione dovrebbe essere tendenzialmente nullo. Invece, una forte minaccia per la validità interna è rappresentata da un evento (negativo o positivo) a cui siano esposti tutti i soggetti (o la maggior parte di essi), perché in tal caso non avremmo effetti casuali di natura opposta che tenderebbero a compensarsi reciprocamente, ma uno stesso effetto (positivo o negativo) che tenderebbe a migliorare o peggiorare la situazione di tutti (o della maggior parte). Effetti della Maturazione Una seconda minaccia sono gli effetti dovuti alla maturazione. Se i tempi di un esperimento sono lunghi (ad esempio un anno scolastico o una sua frazione significativa) occorre tenere presente che i soggetti sperimentali sono sottoposti ad un naturale processo di maturazione (organica e psichica) indipendente dalla sperimentazione stessa; gli effetti di tale processo sull’esperimento possono essere molto differenti a seconda del periodo evolutivo dei soggetti. Se ad esempio si studiano gli effetti di un determinato trattamento didattico sull’apprendimento cognitivo di bambini di scuola elementare, il naturale processo di maturazione psichica comporta per lo più effetti positivi (una maggiore capacità di concentrazione), ma talvolta gli effetti possono essere anche negativi (si pensi ai problemi psicologici associati alla fase adolescenziale). Dunque, lavorando su soggetti in età evolutiva non si può mai essere certi che l’esito della sperimentazione non sia almeno parzialmente influenzato dalla maturazione piuttosto che dal particolare protocollo sperimentale cui sono sottoposti i soggetti. Effetto delle Prove L’effetto delle prove si ha quando la semplice partecipazione ad un esperimento (o ad una prova) influenza la prestazione dei partecipanti in un esperimento (o prova) successiva. Un esempio classico è quello del cosiddetto effetto contrasto: se il soggetto è stato precedentemente esposto a percezioni piuttosto intense (ad esempio uditive, con forti rumori) e poi è bruscamente esposto a percezioni di intensità inferiore (ad esempio a rumori di media intensità), per contrasto le nuove percezioni saranno soggettivamente giudicate molto inferiori alla loro reale intensità (i rumori saranno giudicati non medi bensì leggeri). Effetto della Regressione verso la Media Una quarta minaccia molto importante alla validità interna è il cosiddetto effetto della regressione verso la media. Quando uno strumento di misurazione (un questionario o un reattivo) non è perfettamente stabile (praticamente sempre) nel corso di una somministrazione ripetuta, le misure ottenute sono soggette a fluttuazioni casuali che fanno sì che i punteggi tendano ad avvicinarsi al punteggio medio. Nelle misurazioni successive alla prima, i punteggi più scadenti, pur rimanendo tali, tenderanno ad essere leggermente migliori; analogamente, i punteggi eccellenti, pur mantenendosi su quei livelli, tenderanno a essere un po’ meno alti. Questo effetto ha importanti conseguenze, in quanto spesso nella sperimentazione psicologica vi è un confronto fra le misure ottenute prima e dopo un determinato trattamento. Nella ripetizione delle misure fra prima e dopo si verifica la regressione statistica. Per i soggetti che occupano le posizioni centrali della distribuzione, la regressione statistica non è un grosso problema. Tuttavia, nella misurazione effettuata dopo il trattamento si potrebbe osservare un miglioramento dei punteggi dei soggetti peggiori; prima di concludere che il trattamento migliori la situazione dei peggiori, occorre però accertarsi che ciò non sia una pura illusione dovuta all’effetto della regressione verso la media. Effetti della Selezione Con il termine effetti della selezione si fa riferimento alle problematiche connesse con la selezione dei soggetti per la sperimentazione nel corso del campionamento. In pratica, se una ricerca prevede la formazione di due gruppi indipendenti, potrebbe verificarsi che il gruppo sperimentale non sia perfettamente equivalente al gruppo di controllo sotto tutti gli aspetti rilevanti per la ricerca. In questo caso, i risultati non possono essere attribuiti in maniera univoca al trattamento sperimentale. Mortalità Infine, la mortalità è il fenomeno per cui nel corso della sperimentazione si verifica una perdita progressiva dei soggetti sperimentali dovuta ad abbandono. Il problema è dato dal fatto che la perdita può essere selettiva e non casuale. Ovvero, i soggetti persi sono tutti appartenenti a specifiche categorie, che in qualche modo potrebbero essere connesse al trattamento sperimentale. Ad esempio, un ricercatore potrebbe affermare l’efficacia di un trattamento perché tutti i soggetti che hanno portato a termine l’esperimento hanno dato risposte positive. Ma se coloro che hanno abbandonato avessero portato a termine l’esperimento, i risultati complessivi sarebbero stati probabilmente inferiori. Questo fenomeno è molto acuto nel caso di ricerche longitudinali che utilizzino partecipanti anziani. In questo caso, un certo numero di partecipanti potrebbero non prendere parte alle valutazioni successive in quanto morti o malati. Molto probabilmente, questi sono gli stessi soggetti che avrebbero registrato prestazioni inferiori al test o uno scarso effetto del trattamento sperimentale. Validità Esterna, di Costrutto e Statistica 1. Validità di costrutto Validità di Costrutto La validità di costrutto si riferisce alla corrispondenza tra il piano dei risultati e la teoria di riferimento. Una ricerca è valida se si possono ragionevolmente escludere spiegazioni alternative dei dati rispetto alla teoria di riferimento. Perché ciò sia possibile è necessario che il riferimento teorico sia chiaro ed univoco. In psicologia, il termine costrutto indica un complesso organizzato della vita psichica non osservabile direttamente. I costrutti non sono osservabili ma vengono inferiti dal comportamento osservato attraverso l’utilizzo di indicatori. Purtroppo, tali indicatori non sono perfetti perché dipendono dalle teorie dei ricercatori e dagli strumenti adottati per misurarli. Fornire una definizione operazionale significa far corrispondere un indicatore osservabile ad una nozione latente. Pertanto, l’operazionismo specifica le operazioni che legano il livello astratto del costrutto al livello misurabile, empirico dell’indicatore. Minacce alla Validità di Costrutto Una delle minacce più importanti per la validità di costrutto riguarda l’insufficiente definizione teorica dei costrutti, ovvero la carenza di una dettagliata analisi dei costrutti a livello concettuale. Ad esempio, uno studioso che intende studiare l’aggressività degli studenti potrebbe assumere che un alunno si è dimostrato aggressivo eseguendo in modo deliberatamente lento un compito assegnato dall’insegnante. Tuttavia, questa definizione di aggressività riguarda un aspetto specifico del costrutto teorico, chiamato aggressività passiva. In questo caso, l’insufficiente definizione teorica del costrutto ha condotto all’utilizzo di un indicatore che misura solo un aspetto del costrutto stesso. Una seconda minaccia, strettamente legata alla prima, riguarda l’inadeguata definizione operazionale dei costrutti. Ciò si verifica soprattutto quando la variabile da studiare è complessa. In tal caso, si rischia di utilizzare un indicatore che è inadeguato a rappresentare tale complessità, in quanto coglie soltanto uno dei potenziali aspetti del costrutto. L’esempio precedente illustra in maniera adeguata questo errore. Infine, una terza minaccia riguarda l’ambiguità delle variabili indipendenti. Questa minaccia è dovuta al fatto che i partecipanti a un esperimento percepiscono la situazione in modo diverso dallo sperimentatore, e quindi possono mettere in atto comportamenti che differiscono notevolmente da quelli quotidiani. Un esempio classico di questo fenomeno è il cosiddetto Effetto Hawthorne. L'Effetto Hawthorne Nel 1924, presso le Officine Hawthorne della Western Electric Company in un sobborgo di Chicago, fu avviato un programma di ricerche sperimentali per studiare la connessione tra illuminazione e rendimento. Dopo una serie di rilevazioni basate sul livello di produttività in diverse condizioni d'illuminazione, i risultati si rivelarono inaspettati. Il rapporto tra le due variabili (produttività e illuminazione) si mostrò così anomalo da far pensare all'esistenza di una variabile interveniente, il cosiddetto fattore umano, ovvero il complesso dei fattori psicologici latenti che condiziona il comportamento manifesto dei soggetti. I ricercatori trascorrevano parecchio tempo con i gruppi di lavoro (formati da sei donne ciascuno), discutendo delle modifiche prima che venissero apportate (come la riduzione dell’orario di lavoro, varie pause e una serie di incentivi). Ogni volta che si introduceva un cambiamento, si registrava un aumento di produttività. Tuttavia, quando ai gruppi fu chiesto di ritornare alle condizioni di lavoro iniziali (48 ore di lavoro settimanali, senza incentivi né pause), la produttività continuò ad aumentare in maniera inaspettata. In generale, vi fu una riduzione dell’assenteismo dell’80%. L’unica spiegazione, concluse Mayo, era che i dipendenti si sentivano più soddisfatti del lavoro perché percepivano di essere trattati come individui e non come ingranaggi di una macchina. Grazie alla comunicazione con i ricercatori, i lavoratori si sentivano maggiormente responsabili della propria performance e di quella dell’intero gruppo. Ai fini della performance, la coesione e la stima di sé erano più importanti di qualsiasi miglioramento delle condizioni lavorative. Strategie per Aumentare la Validità di Costrutto Cook e Campbell (1979) hanno suggerito varie strategie per aumentare la validità di costrutto. La prima è stabilire una chiara definizione del costrutto astratto. Una definizione teorica incompleta può condurre a definizioni empiriche scadenti. Una volta che il costrutto teorico è stato definito e tradotto in specifiche operazioni, è necessario verificare la bontà della misura attraverso l’utilizzo di indicatori convergenti. Ad esempio, se una manipolazione sperimentale induce fame in un ratto, ci si dovrebbe aspettare di registrare un maggior numero di contrazioni nello stomaco dell'animale. Infine, ci si deve accertare che i dati che dovrebbero riflettere un determinato costrutto teorico non correlino con costrutti totalmente differenti. 2. Validità esterna e statistica Validità Esterna La validità esterna di un esperimento riguarda l’applicabilità dei risultati a soggetti differenti da quelli sperimentali e a situazioni, tempi e luoghi diversi da quelli utilizzati in una particolare ricerca. In altre parole, la validità esterna valuta la possibilità di generalizzare le conclusioni ad individui e contesti differenti da quelli considerati dallo studioso. A seconda del fattore considerato, la validità esterna può essere definita come: Validità di popolazione Validità temporale Validità ecologica Il metodo più semplice per raggiungere la validità esterna è ripetere l’esperimento più volte, modificando sistematicamente una o più variabili (soggetti, tempi, luoghi). Tipi di Validità Esterna 1. Validità di Popolazione La validità di popolazione si riferisce alla rappresentatività dei soggetti sperimentali, ovvero alla capacità di generalizzare i dati del campione alla popolazione di riferimento. Le regole per ottenere questo tipo di validità sono essenzialmente due: Selezionare i soggetti in maniera casuale dalla popolazione di riferimento. Aumentare l’ampiezza del campione (in generale, più grande è il campione, maggiore sarà la sua rappresentatività). Una seria minaccia alla validità di popolazione è data dall’uso comune di topi albini nelle ricerche psicobiologiche e studenti universitari nelle ricerche psicosociali, per motivi pratici. 2. Validità Temporale La validità temporale si riferisce alla stabilità dei risultati nel corso del tempo. Questo tipo di validità è minacciato dal fatto che le tendenze storiche e i costumi culturali cambiano. Ad esempio, uno studio di McGinnies (1949) mostrò che parole tabù come "troia" o "stupro" elevavano la soglia percettiva, riflettendo la riluttanza dell’epoca a pronunciare tali termini. Oggi, il linguaggio è cambiato e quegli stessi termini non sono più considerati tabù. Le minacce alla validità temporale possono essere dovute a: Variazioni stagionali, come l'aumento di incidenti stradali in inverno rispetto all'estate. Variazioni cicliche, come i cambiamenti nel ritmo circadiano o nelle funzioni endocrine dei partecipanti. Variazioni personologiche, ovvero i cambiamenti delle caratteristiche degli individui nel tempo, particolarmente rilevanti nelle ricerche longitudinali con bambini e anziani. 3. Validità Ecologica La validità ecologica si riferisce alla corrispondenza tra le condizioni dell’esperimento e la realtà cui si fa riferimento. È lo studio di un fenomeno nel contesto reale, senza scomporre artificialmente le variabili. Tuttavia, la validità ecologica e la validità interna sono inversamente correlate: più è artificiale l’esperimento per controllare le variabili, minore sarà la sua validità ecologica. Validità Statistica La validità statistica ha lo scopo di verificare se il rapporto tra le variabili è causale o casuale. I dati sperimentali sono spesso caratterizzati da variabilità casuale, e l’uso della statistica inferenziale serve a valutare l'influenza di fattori non controllati. Errori di Tipo I e Tipo II Quando si analizzano i dati, si inizia con l’ipotesi nulla (che in genere si vuole rigettare) e l’ipotesi alternativa (che si vuole accettare, indicando l'effetto del trattamento sperimentale). Un errore di primo tipo (tipo I) si verifica quando si rifiuta erroneamente l’ipotesi nulla, che in realtà è vera. Un errore di secondo tipo (tipo II) si verifica quando si accetta l’ipotesi nulla, che in realtà è falsa. Minacce alla Validità Statistica Un fenomeno che aumenta la probabilità di errore di primo tipo è il cosiddetto fishing, ovvero la ricerca di correlazioni significative senza ipotesi a priori, conducendo molte analisi nella speranza di trovare una relazione significativa. Le minacce alla validità statistica che aumentano la probabilità di errore di secondo tipo includono: Bassa potenza statistica, dovuta a campioni di piccole dimensioni. Violazione degli assunti delle tecniche statistiche, come l'applicazione impropria di test parametrici senza una distribuzione normale. Altre minacce includono: Scarsa affidabilità degli strumenti di misura. Mancata standardizzazione delle procedure. Presenza di variabili confuse. Eccessiva eterogeneità dei partecipanti. 3. Effetti di disturbo Gli psicologi sono sempre più consapevoli del fatto che un esperimento è una situazione sociale dotata di regole specifiche e che i soggetti sperimentali hanno delle aspettative riguardo al tipo di comportamento che dovrebbero mostrare in tale condizione. Il semplice fatto di partecipare a un esperimento produce una serie di aspettative nei partecipanti, note come richieste del ruolo. In particolare, le persone si prestano spesso a fare cose apparentemente inutili e/o socialmente inaccettabili quando pensano di partecipare a un esperimento. Per esempio: Orne ed Evans (1965) dimostrarono che i loro partecipanti potevano essere facilmente indotti a gettare dell’acido su un assistente, indipendentemente dal fatto di essere sotto ipnosi. Milgram (1963) rilevò che i partecipanti erano convinti di somministrare delle scosse elettriche ad altre persone, nonostante le loro evidenti proteste. Le conseguenze dovute alle richieste del ruolo possono essere attenuate quando lo sperimentatore adotta certe contromisure: 1. Inganno riguardo al vero scopo dell’esperimento: Nascondere il vero scopo dell’esperimento ai partecipanti, o addirittura non rivelare loro che stanno partecipando a un esperimento. 2. Divisione dell’esperimento in più parti: Suddividere l’esperimento in più fasi apparentemente slegate le une dalle altre, rendendo difficile per il soggetto comprendere il vero scopo. 3. Utilizzo di misure poco influenzate dalle aspettative individuali: Ad esempio, la risposta galvanica, che è meno influenzata dalle aspettative dei partecipanti. Per quanto riguarda gli effetti disturbo dovuti allo sperimentatore, si fa riferimento al fatto che lo sperimentatore può influenzare in maniera non intenzionale i comportamenti dei partecipanti e quindi i risultati della ricerca. Un esempio noto è lo studio di Rosenthal e Fode (1963), in cui gli sperimentatori a cui era stato detto che avevano ratti “intelligenti” manipolavano gli animali con maggiore frequenza rispetto agli sperimentatori a cui era stato detto che avevano ratti “stupidi”. I topi del primo gruppo ottennero successivamente una prestazione migliore in un test di apprendimento. Questo problema è talmente noto che molti studi adottano il metodo del “doppio cieco”, in cui né i partecipanti né lo sperimentatore conoscono la natura della condizione sperimentale alla quale sono assegnati. Un altro metodo è standardizzare l’esperimento il più possibile, ad esempio fornendo istruzioni scritte valide per tutti i partecipanti. I disegni ripetuti (o within-subject design in inglese) sono un tipo di disegno sperimentale in cui gli stessi partecipanti vengono esposti a tutte le condizioni o trattamenti di un esperimento. Questo significa che ogni soggetto è misurato più volte, una per ciascuna condizione sperimentale. Caratteristiche principali dei disegni ripetuti: 1. Stessi partecipanti in tutte le condizioni: Ogni partecipante partecipa a ciascuna delle condizioni o gruppi dell'esperimento. Per esempio, se un ricercatore sta studiando l'effetto di due diverse tecniche di apprendimento, i partecipanti proveranno entrambe le tecniche, in momenti diversi. 2. Controllo delle differenze individuali: Poiché ogni soggetto partecipa a tutte le condizioni, le differenze tra le condizioni non possono essere attribuite a differenze tra i partecipanti stessi. Questo riduce la variabilità dovuta alle differenze individuali (come capacità, intelligenza, livello di ansia, ecc.). In altre parole, le caratteristiche personali di ogni partecipante sono uguali in tutte le condizioni. 3. Maggior efficienza: Poiché è necessario un numero minore di partecipanti (rispetto a un disegno tra soggetti), questo metodo è più efficiente in termini di risorse. 4. Riduzione della varianza interna: Dato che i partecipanti sono confrontati con sé stessi in tutte le condizioni, le differenze tra i gruppi vengono ridotte, permettendo un'analisi più precisa degli effetti del trattamento. Esempio di disegno ripetuto: Immagina un esperimento per testare l'effetto di due diverse tecniche di apprendimento, "Tecnica A" e "Tecnica B", sulla capacità di memorizzare parole. In un disegno ripetuto, gli stessi partecipanti proveranno prima la Tecnica A e, in un secondo momento, la Tecnica B. La prestazione dei partecipanti verrà confrontata tra i due metodi di apprendimento. In questo modo, il confronto viene fatto all'interno dello stesso gruppo di partecipanti, riducendo la probabilità che differenze individuali influenzino i risultati. Vantaggi dei disegni ripetuti: 1. Controllo delle differenze individuali: Come detto, poiché ogni partecipante è esposto a tutte le condizioni, le differenze individuali non influenzano i risultati. 2. Meno partecipanti richiesti: Dato che ogni partecipante partecipa a tutte le condizioni, è necessario un numero minore di persone rispetto a un disegno "tra soggetti". 3. Maggiore potenza statistica: Dato che le differenze tra soggetti sono controllate, il disegno ripetuto ha una maggiore potenza statistica, permettendo di rilevare anche effetti più piccoli. Svantaggi dei disegni ripetuti: 1. Effetto dell'ordine: Se un partecipante svolge prima una condizione e poi un'altra, l'ordine in cui vengono presentate le condizioni può influenzare i risultati (ad esempio, il partecipante potrebbe migliorare semplicemente perché ha fatto pratica con la prima condizione). Per ridurre questo effetto, si usa il controbilanciamento: si varia l'ordine delle condizioni tra i partecipanti. 2. Effetto della fatica o del tempo: Se l'esperimento richiede molto tempo, i partecipanti possono stancarsi, influenzando le loro prestazioni nelle condizioni successive. 3. Effetto della consapevolezza: Poiché i partecipanti sono esposti a tutte le condizioni, potrebbero diventare consapevoli delle ipotesi dello sperimentatore e comportarsi di conseguenza. Conclusione: Nei disegni ripetuti, gli stessi partecipanti vengono testati in tutte le condizioni, il che consente di ridurre gli effetti delle differenze individuali e di ottenere risultati più accurati. Tuttavia, bisogna fare attenzione agli effetti dell'ordine e della fatica, che possono influenzare i risultati. Disegni ripetuti (A) Nei disegni ripetuti, gli stessi soggetti partecipano a tutte le condizioni sperimentali. Questo tipo di disegno permette di ridurre gli effetti dovuti alle differenze individuali tra i soggetti, poiché ogni partecipante viene esposto a tutte le condizioni sperimentali, e quindi le differenze tra condizioni non possono essere attribuite a differenze tra i gruppi. Questo riduce l'influenza che lo sperimentatore può avere nel trattare i gruppi in modo diverso. Inoltre, poiché ogni soggetto funge da proprio controllo, si riducono potenziali bias legati allo sperimentatore. Altre opzioni spiegate: Disegni tra i soggetti (B): In questo tipo di disegno, diversi gruppi di persone partecipano a condizioni sperimentali differenti. Anche se questo può evitare l'effetto dell'ordine delle prove, può esporre lo studio a maggiori effetti dello sperimentatore se trattamenti differenziati vengono applicati ai gruppi, specialmente se non si tiene sotto controllo il bias dello sperimentatore. Disegni longitudinali (C): Si tratta di studi che osservano gli stessi soggetti nel tempo. Non sono progettati principalmente per ridurre gli effetti dello sperimentatore. Disegni fattoriali (D): Esaminano l'interazione di due o più variabili indipendenti, ma non sono pensati specificamente per affrontare gli effetti dello sperimentatore. In conclusione: La risposta corretta è A: disegni ripetuti, perché consentono di controllare le differenze indivduali e di ridurre alcuni tipi di bias dello sperimentatore. iSpiegazione: Disegni tra i soggetti (B): In questo tipo di disegno, diversi gruppi di partecipanti vengono assegnati a diverse condizioni sperimentali. Poiché i soggetti non vengono esposti a più condizioni, è meno probabile che l'effetto dello sperimentatore influenzi i risultati in modo consistente tra le diverse condizioni. Questo può ridurre al minimo i bias introdotti dallo sperimentatore. Per chiarire le altre opzioni: Disegni ripetuti (A): In un disegno ripetuto, gli stessi soggetti vengono esposti a tutte le condizioni. Questo tipo di disegno può esporre i partecipanti agli effetti dell'ordine delle prove o a un maggior coinvolgimento dello sperimentatore, il che può aumentare gli effetti dovuti al suo comportamento. Disegni longitudinali (C): Gli studi longitudinali seguono gli stessi soggetti per un lungo periodo di tempo. Anche in questo caso, lo sperimentatore potrebbe influenzare i risultati a causa del contatto ripetuto con gli stessi soggetti nel tempo. Disegni fattoriali (D): I disegni fattoriali esaminano l'effetto simultaneo di due o più variabili indipendenti, ma non sono direttamente concepiti per ridurre gli effetti dello sperimentatore, anche se possono essere combinati con altri accorgimenti per farlo. Ricerca Longitudinale La ricerca longitudinale è uno studio che raccoglie dati su lunghi periodi di tempo, osservando gli stessi soggetti in più momenti. Questo approccio consente di esaminare cambiamenti e sviluppi nel tempo e di comprendere come determinate variabili influenzino i soggetti lungo il corso della loro vita o di un periodo prolungato. Scopo: La ricerca longitudinale è particolarmente utile per studiare il cambiamento nel tempo e le relazioni causali. Caratteristiche principali: ○ I partecipanti vengono osservati e misurati in diversi momenti (giorni, mesi, anni, o anche decenni). ○ Permette di monitorare i cambiamenti individuali e di gruppo nel tempo. ○ Può essere usata per identificare correlazioni tra variabili e studiare l’effetto di interventi o fenomeni di lunga durata. Esempio: Uno studio longitudinale potrebbe seguire un gruppo di bambini dalla nascita fino all’età adulta per osservare come le esperienze familiari influenzano lo sviluppo cognitivo. Vantaggi Permette di osservare il cambiamento nel tempo. Aiuta a stabilire relazioni di causa-effetto. Consente di studiare processi evolutivi o di sviluppo. Svantaggi Richiede molto tempo e risorse. C'è il rischio di perdita di partecipanti nel tempo (drop-out). Il cambiamento di contesto sociale o culturale durante lo studio può influenzare i risultati. Ricerca Trasversale La ricerca trasversale, al contrario, raccoglie i dati in un singolo momento nel tempo, osservando un campione rappresentativo di una popolazione in quel momento. Non si focalizza sui cambiamenti nel tempo, ma piuttosto offre una fotografia istantanea di una situazione. Scopo: Lo scopo di una ricerca trasversale è solitamente quello di descrivere una popolazione o confrontare diversi gruppi all'interno di essa. Caratteristiche principali: ○ I dati sono raccolti in un unico momento o in un breve lasso di tempo. ○ È utile per confrontare diverse variabili tra gruppi differenti o per studiare la prevalenza di determinate caratteristiche o comportamenti. ○ Non permette di stabilire relazioni causali nel tempo, ma può indicare associazioni tra variabili. Esempio: Una ricerca trasversale potrebbe studiare il livello di attività fisica tra diversi gruppi di età in una popolazione in un determinato momento. Vantaggi Richiede meno tempo rispetto a una ricerca longitudinale. È più economica. Può fornire un quadro generale di una situazione o di un fenomeno in un momento specifico. Svantaggi Non permette di osservare i cambiamenti nel tempo. Non può stabilire relazioni di causa-effetto. Può essere influenzata da variabili confondenti presenti al momento della raccolta dati. Differenze Principali Aspetto Ricerca Longitudinale Ricerca Trasversale Tempo Dati raccolti nel tempo (più Dati raccolti in un singolo momento punti di misurazione) Scopo Studiare il cambiamento e le Descrivere o confrontare variabili in relazioni causali un determinato momento Causa-effetto Possibile identificare relazioni Difficile stabilire relazioni causali causali Costi e durata Richiede più tempo e risorse Più rapida e meno costosa Esempi di Studi di sviluppo, effetti a lungo Sondaggi, studi di prevalenza applicazione termine In sintesi, la ricerca longitudinale è ideale quando si vuole comprendere come le variabili evolvono nel tempo, mentre la ricerca trasversale fornisce un'istantanea utile per descrivere e confrontare situazioni o comportamenti in un momento specifico. Attendibilità della misurazione 1. L'errore di misura Ogni volta che si esegue una misurazione, ovvero si associano numeri a oggetti o eventi, è sempre possibile commettere degli errori. Poiché gran parte della psicologia si basa sulla misurazione tramite strumenti come test, questionari e griglie di codifica, è essenziale che tali strumenti siano il più possibile esenti da errori e che le condizioni di somministrazione garantiscano una misurazione efficace. In generale, gli errori di misura possono essere di due tipi: Errori casuali: Sono dovuti a fluttuazioni del caso che vanno ora in una direzione ora nell’altra e tendono ad annullarsi. In altre parole, se si potessero fare infinite misurazioni della stessa caratteristica psicologica sullo stesso soggetto, la sommatoria degli errori casuali sarebbe pari a zero. Errori sistematici: Sono dovuti a variazioni che vanno tutte nella stessa direzione, creando un bias sistematico nella risposta. Se si potessero eseguire infinite misurazioni su uno stesso soggetto, la sommatoria degli errori sistematici non tenderebbe mai a zero. Ad esempio: ○ Il peso di una persona diminuisce di circa un chilo durante la notte e tende ad aumentare con l'avanzare dell'età. Questa variabilità non è dovuta all’errore casuale ma può essere spiegata da specifiche variabili indipendenti (la perdita di liquidi nel primo caso, i processi di invecchiamento nel secondo caso). ○ Tuttavia, se ci si pesa più volte sulla stessa bilancia, vi saranno piccole variazioni nei valori registrati che non dipendono da nessuna variabile indipendente conosciuta: questi aumenti e diminuzioni casuali tendono a compensarsi, per cui, se potessimo effettuare infinite misurazioni, il peso effettivo di una persona coinciderebbe con la media di tutte le misurazioni. Un altro esempio riguarda un questionario per misurare l’aggressività che include la domanda: «Ti è mai capitato di picchiare un tuo compagno?». Se, prima di rispondere, lo sperimentatore fa leggere ai partecipanti l’istruzione: «Non bisogna avere paura di manifestare la propria aggressività; anzi, recenti ricerche indicano che l’aggressività ha una funzione positiva e liberatoria nei rapporti sociali», è probabile che questa istruzione induca tutti i soggetti a sovrastimare i propri livelli di aggressività. In questo caso, l'istruzione introduce un errore sistematico, poiché tutti i partecipanti forniranno risposte viziati nella stessa direzione. La presenza di errori sistematici può avere conseguenze più o meno gravi all’interno di una ricerca sperimentale: Errori sistematici in tutte le condizioni sperimentali: Se l'errore è presente in uguale misura in tutte le condizioni sperimentali, gli effetti sulle conclusioni saranno minimi. Ad esempio, se uno sperimentatore utilizza una bilancia che tende a sovrastimare (o a sottostimare) il peso effettivo in entrambe le condizioni di trattamento, l’errore sistematico non altererà la validità delle conclusioni dello sperimentatore, poiché le differenze tra le due condizioni sperimentali rimarranno sostanzialmente inalterate. Errori sistematici associati a una sola condizione: Se l’errore sistematico è associato a una variabile indipendente in modo tale da essere presente in un solo livello della variabile, diventa impossibile determinare la causa delle variazioni nella variabile dipendente. Nell'esempio precedente, se lo sperimentatore utilizza la bilancia viziata per valutare i risultati di un solo trattamento sperimentale, sarebbe difficile determinare se l’effetto sul peso dipenda dal trattamento o dall’errore sistematico introdotto dalla bilancia. In psicometria, i termini varianza di errore o errore casuale si riferiscono alla variabilità della variabile dipendente che non può essere spiegata dalle variabili indipendenti considerate in una determinata ricerca. Tutte le tecniche statistiche basate sulla verifica delle ipotesi cercano di dimostrare che la variabilità della variabile dipendente spiegata da una o più variabili indipendenti è significativamente maggiore rispetto alla varianza di errore non spiegata. 2. Attendibilità e validità Attendibilità e Validità di uno Strumento Attendibilità: Riguarda il grado di accordo tra misurazioni indipendenti dello stesso costrutto. Se uno strumento misura un costrutto e fornisce risultati coerenti in misurazioni ripetute, si può considerare attendibile. Ad esempio, se misuriamo la lunghezza di un tavolo e otteniamo risultati molto simili ogni volta, il nostro strumento è attendibile. Tuttavia, se le misurazioni variano significativamente, lo strumento non è attendibile. Validità: Riguarda il grado in cui uno strumento misura ciò che dice di misurare. In pratica, questo concetto coincide con la validità di costrutto. Ad esempio, un test che misura il quoziente intellettivo tramite la misurazione della circonferenza della testa sarebbe attendibile (poiché la circonferenza della testa è stabile negli adulti), ma non valido, poiché non c'è una relazione tra la circonferenza della testa e il quoziente intellettivo. Relazione tra Attendibilità e Validità Una misura può essere affidabile ma non valida: Esempio: Un test che misura il QI attraverso la conoscenza del valore del Dow-Jones può essere valido se le persone che conoscono questo valore tendono ad avere un QI più alto, ma non è molto affidabile, poiché la conoscenza del valore del Dow-Jones può variare nel tempo. Dal punto di vista pratico, l’attendibilità è fondamentale per la validità: Esempio: Non ha senso chiedersi se un test misura l’aggressività (validità) se gli item non correlano tra loro (attendibilità), poiché ogni item misurerebbe un costrutto diverso. Aspetti dell'Attendibilità 1. Stabilità: Riferita al grado di correlazione tra due misurazioni dello stesso costrutto effettuate in tempi diversi. Ad esempio, ci aspettiamo che una misurazione dell'intelligenza di una persona adulta sia coerente nel tempo. 2. Accuratezza: Riferita al grado di corrispondenza tra il costrutto misurato e la realtà. Ad esempio, se uno strumento misura una persona alta 180 cm e fornisce un risultato di 170 cm, lo strumento non è accurato. 3. Precisione: Riferita al grado di coerenza tra indicatori diversi dello stesso costrutto. Si ha precisione quando due item differenti dello stesso costrutto forniscono risposte coerenti dallo stesso partecipante. Esempi di Precisione e Accuratezza Precisione ma Non Accuratezza: Supponiamo che uno strumento di misurazione dell'aggressività presenti elevati livelli di correlazione tra item, ma misura invece la "competizione". Anche se preciso, non è accurato. Stabilità ma Non Accuratezza: Una scala di aggressività può essere stabile se due misurazioni effettuate a distanza di 6 mesi mostrano alte correlazioni, ma non è valida se misura la "competizione" anziché l'aggressività. In sintesi, una misura può essere affidabile ma non valida, oppure valida ma non affidabile. Tuttavia, senza un'adeguata attendibilità, non è possibile avere una validità adeguata. 3. Tipi di attendibilità Teoria Classica dell'Attendibilità La teoria classica dell’attendibilità si basa sull'idea che il punteggio osservato (X) in una misurazione è composto da due componenti principali: X=V+E dove: V è il punteggio vero. E è l’errore casuale. Concetto di Attendibilità: Se si effettuassero infinite misurazioni, la sommatoria degli errori casuali dovrebbe tendere a zero. In questo scenario, il punteggio vero V sarebbe rappresentato dalla media di tutti i punteggi osservati. L’attendibilità è definita come il rapporto tra la varianza della parte vera e la varianza osservata. Questo rapporto è conosciuto come coefficiente di attendibilità e può essere espresso come: Il coefficiente di attendibilità varia tra 0 e 1: 0 indica che il punteggio osservato è composto solo da errore. 1 indica che tutto il punteggio osservato è vero. Applicazioni Pratiche dell'Attendibilità 1. Attendibilità Test-Retest: ○ Il test viene somministrato ai tempi T1 e T2. ○ Si calcola il coefficiente di correlazione tra i punteggi ottenuti nei due tempi. 2. Forme Parallele (o Equivalenti) di uno Strumento: ○ Si somministrano due versioni equivalenti del test (che misurano lo stesso costrutto) allo stesso tempo T1. ○ Si misura la correlazione tra le due forme. 3. Consistenza Interna (Metodo Split-Half): ○ Il test viene diviso a metà e le due metà sono trattate come forme parallele. ○ La correlazione tra le due metà stima l’attendibilità. 4. Accordo tra Osservatori: ○ Diversi osservatori codificano lo stesso evento o comportamento nella stessa situazione e nello stesso momento. ○ La corrispondenza tra le codifiche degli osservatori stima l’attendibilità. Coefficiente Alfa di Cronbach L'α (alfa) di Cronbach è un indice di attendibilità molto utilizzato in psicologia, applicabile a misure come le scale di personalità o di atteggiamenti. La procedura per calcolarlo è: 1. Dividere gli item di un test in due gruppi uguali e calcolare l’attendibilità con il metodo split-half (correlazione). 2. Ripetere l’operazione con diversi raggruppamenti di item, fino a esaurire tutte le possibili divisioni a metà. 3. Calcolare l’α di Cronbach come la media di tutte le correlazioni split-half ottenute. L'α di Cronbach varia tra 0 e 1. La maggior parte dei ricercatori considera valori superiori a 0.70 come molto buoni. È importante notare che l'α di Cronbach è influenzato dalla lunghezza del test: aumenta con il numero degli item. Il coefficiente Alfa di Cronbach è una misura statistica utilizzata per valutare la consistenza interna di un insieme di item o domande in un test o questionario. La consistenza interna indica quanto bene i vari item misurano lo stesso concetto o costrutto. È ampiamente utilizzato in psicologia, educazione, sociologia e altre scienze sociali, per determinare l'affidabilità di scale e test psicometrici. Definizione Il coefficiente Alfa di Cronbach varia tra 0 e 1, dove: Un valore più vicino a 1 indica una maggiore affidabilità e coerenza interna tra gli item. Un valore più vicino a 0 indica una bassa coerenza, suggerendo che gli item potrebbero non essere ben correlati tra loro o che non misurano lo stesso costrutto. Interpretazione dei valori di Alfa di Cronbach: α ≥ 0.9: Eccellente 0.8 ≤ α < 0.9: Buono 0.7 ≤ α < 0.8: Accettabile 0.6 ≤ α < 0.7: Scarso α < 0.6: Insufficiente Quando si usa l'Alfa di Cronbach? Si utilizza l'Alfa di Cronbach quando si desidera verificare l'affidabilità di una scala o di un questionario, cioè quanto i singoli item siano tra loro coerenti e misurino lo stesso concetto. È comunemente applicato in: Test psicologici (ad esempio, per misurare tratti della personalità o atteggiamenti), Questionari educativi (per verificare se le domande di un esame misurano coerentemente una specifica abilità), Scale di valutazione in ambito sanitario o sociale. Esempio pratico Immagina di avere un questionario con 10 domande che valutano l'autostima. Il coefficiente Alfa di Cronbach ti permette di capire se queste 10 domande sono sufficientemente correlate tra loro, cioè se misurano effettivamente la stessa cosa (l'autostima). Se ottieni un Alfa di Cronbach alto, diciamo 0.85, significa che il questionario è affidabile, e le 10 domande sono coerenti tra loro. Se invece l'Alfa è basso, ad esempio 0.50, significa che probabilmente alcune domande non misurano bene l'autostima o non sono ben correlate. Limitazioni dell'Alfa di Cronbach Non è una misura di unidimensionalità: Un coefficiente Alfa elevato non garantisce che tutti gli item misurino un singolo fattore o costrutto. Un'analisi fattoriale è necessaria per verificare la presenza di un'unica dimensione latente. Dipende dal numero di item: Aumentare il numero di item in un test tende ad aumentare artificialmente il valore di Alfa, anche se la consistenza tra gli item non è migliorata. Non distingue tra affidabilità e validità: L'Alfa di Cronbach misura solo la coerenza interna, ma non garantisce che il test misuri effettivamente il concetto che intende misurare (validità). In sintesi: L'Alfa di Cronbach è una misura di consistenza interna che valuta quanto bene gli item di un test o di una scala sono correlati tra loro. Un valore più alto indica una maggiore affidabilità del questionario o della scala, mentre un valore basso suggerisce che gli item potrebbero non essere coerenti o non misurare lo stesso concetto. Validità della misurazione 1. Concetto di validità In generale, la validità riguarda il grado in cui uno strumento misura il costrutto che si intendeva misurare al momento della sua costruzione. Vi sono diversi aspetti della validità, tra i quali ricordiamo: Validità di contenuto: Riguarda il grado in cui gli item sono un campione rappresentativo dell'universo di comportamenti che si vuole misurare. Validità di criterio (predittiva o concorrente): Si riferisce al grado di associazione tra la misurazione del costrutto tramite lo strumento e le misurazioni di altri costrutti utilizzati come criteri di riferimento esterni. Validità di costrutto (convergente o discriminante): Riguarda il grado in cui la misura riflette accuratamente il costrutto che si vuole misurare. Ci sono molti modi diversi per determinare se uno strumento o un test sia valido o meno. In primo luogo, il test dovrebbe effettivamente misurare il costrutto teorico che si suppone voglia esaminare e non qualcos’altro. Ad esempio, un test che valuta l’abilità di leadership non dovrebbe in realtà misurare l’estroversione (sebbene i due costrutti possano mostrare una moderata correlazione tra di loro). In secondo luogo, oltre a misurare il costrutto che si intende misurare, un test valido dovrebbe evitare di misurare costrutti che non sono ad esso legati teoricamente. Quindi, un test che si prefigge di valutare le attitudini musicali non dovrebbe richiedere una eccessiva abilità di lettura (i due costrutti dovrebbero essere sostanzialmente indipendenti). Infine, un test con una buona validità dovrebbe dimostrarsi utile per predire risultati legati al concetto teorico che si sta esaminando. Ad esempio, un test di abilità musicale dovrebbe consentire di differenziare gruppi di soggetti che hanno scelto la musica come attività professionale da quelli che non l’hanno scelta. In termini statistici, la validità è sempre definita dalla correlazione tra i punteggi ottenuti da un gruppo di soggetti nel test che si sta validando e quelli ottenuti dagli stessi soggetti in un altro test, chiamato criterio. Come vedremo, infatti, tutti i metodi per la verifica della validità di un test consistono essenzialmente nel mettere in relazione le misure in un test con altre raccolte indipendentemente da questo, ma relative alla stessa variabile valutata dal test. Tale correlazione è anche nota come coefficiente di validità. Nel valutare l'entità di questo coefficiente occorre tenere sempre presente il cosiddetto problema dell’attenuazione, ovvero il fatto che l’errore casuale (che riduce l’attendibilità di entrambi i test ed è inevitabilmente presente in qualsiasi misurazione) tende a ridurre la correlazione tra il test e il criterio. Ciò significa che la correlazione fra i punteggi osservati in due test è in genere inferiore rispetto alla correlazione tra i punteggi veri, a causa dell'imperfetta attendibilità dei test stessi (Dazzi & Pedrabissi, 2005). 2. Validità di contenuto La validità di contenuto riguarda il grado in cui gli item che fanno parte dello strumento costituiscono un campione rappresentativo dell’universo dei comportamenti possibili relativi al costrutto che si vuole misurare. Ad esempio, quando si costruisce un compito scritto a risposte multiple per valutare le conoscenze degli studenti universitari su una determinata materia, è necessario che le domande mappino la maggior parte degli argomenti del programma affrontati durante le lezioni e nei libri di testo. La validità di contenuto è soddisfatta quando il costrutto è stato esplicitato teoricamente nei termini di tutti gli aspetti specifici che esauriscono il dominio del contenuto coperto dal costrutto stesso. La validità di contenuto è pertanto indebolita quando: Il test ipo-rappresenta un aspetto importante che contribuisce alla definizione del costrutto teorico. Il test iper-rappresenta uno specifico aspetto del costrutto a scapito di altri aspetti. Per chiarire questo punto, occorre ricordare che un costrutto teorico è un concetto astratto che indica un processo mentale non osservabile direttamente. L’indicatore, a sua volta, è un comportamento empirico che misura il costrutto teorico (definizione operazionale). Gli indicatori possono essere: Riflettivi: Quando il comportamento osservato è una semplice manifestazione empirica del costrutto (in tal caso si dice che il costrutto causa l’indicatore). Ad esempio, il comportamento di aggredire fisicamente qualcuno è una manifestazione osservabile del costrutto teorico di aggressività attribuito al soggetto. Formativi: Quando il comportamento contribuisce a definire il costrutto teorico (in tal caso si dice che l’indicatore causa il costrutto). Ad esempio, il costrutto teorico di stress può essere indicato da item quali “Negli ultimi mesi ho avuto un grave lutto” oppure “Nell'ultimo anno il mio partner mi ha lasciato”. È chiaro che tali eventi negativi determinano in maniera causale l'insorgenza di uno stato di stress. Sebbene alcuni costrutti possano essere semplici e unidimensionali, la maggior parte di essi implica un’organizzazione gerarchica in dimensioni non osservabili che si collocano a livello intermedio tra i costrutti e gli indicatori. Ad esempio, l’estroversione viene spesso indicata da tre dimensioni latenti: la socialità, l’assertività e la loquacità. Un test ha una buona validità di contenuto quando gli item che compongono il test rappresentano tutte le dimensioni latenti del costrutto. Quindi, un test che si prefigga di misurare l'estroversione dovrebbe essere composto da item che valutano la socialità, l'assertività e la loquacità del soggetto. In effetti, lo studio del numero delle dimensioni di un test o di un questionario è un aspetto molto importante e delicato che viene spesso affrontato con una tecnica statistica chiamata analisi fattoriale, la quale permette di identificare i fattori o le componenti latenti del test stesso a partire dalle correlazioni tra gli item. A livello pratico, per valutare la validità di contenuto si ricorre quasi sempre al giudizio di esperti competenti di quel particolare settore scientifico, i quali sono chiamati a valutare la rappresentatività di ciascun item rispetto all’universo di contenuto del costrutto teorico. Tali giudizi possono essere eventualmente valutati attraverso analisi statistiche appropriate. Infine, bisogna ricordare che la validità di facciata è molto simile alla validità di contenuto. La validità di facciata si riferisce al grado in cui gli item utilizzati appaiono ragionevoli come indicatori del costrutto alle persone a cui è diretto il test. Si pensi ad esempio al test di Rorschach: la validità di facciata di questo test proiettivo è molto bassa, in quanto la maggior parte dei soggetti che vi si sottopongono si chiede come sia possibile valutare la personalità attraverso una serie di macchie di inchiostro. La validità di facciata, comunque, è più un problema di apparenza che di sostanza. Infatti, un test può avere un alto o basso grado di validità, indipendentemente dalla sua validità di facciata. 3. Validità di criterio e di costrutto La validità di criterio riguarda il grado di corrispondenza tra la misura e una variabile esterna, diversa dal costrutto originario, che si assume come criterio di riferimento. Ad esempio, un test che misura il successo lavorativo ha una buona validità di criterio se esso consente di assegnare punteggi elevati alle persone che hanno avuto una carriera folgorante, ovvero, se correla con comportamenti che richiedono il successo lavorativo. La validità di criterio può essere: Concorrente: Quando la valutazione del criterio è contemporanea alla valutazione del costrutto. Ad esempio, un test di intelligenza dovrebbe correlare con il profitto scolastico dei bambini nel periodo in cui il test viene somministrato. Predittiva: Quando la valutazione del criterio è differita nel tempo rispetto alla valutazione del costrutto. Ad esempio, un test di intelligenza somministrato a un bambino delle scuole elementari dovrebbe essere in grado di predire il futuro rendimento universitario del bambino stesso, come la probabilità che completerà (o meno) gli studi universitari. La validità di costrutto riguarda il grado in cui uno strumento misura ciò che intende misurare. Di solito, si ritiene che essa sia composta da due aspetti: Validità convergente: Riflette il grado di accordo tra due misurazioni dello stesso costrutto fatte con metodi diversi. In altre parole, i punteggi ottenuti da un gruppo di soggetti a un test di intelligenza dovrebbero correlare con i punteggi ottenuti dagli stessi soggetti in altri test di intelligenza. Validità divergente: Riflette il grado di discriminazione tra test che misurano costrutti diversi. Ad esempio, un test di intelligenza dovrebbe correlare poco o nulla con un test di introversione. La validità di costrutto è strettamente legata alla validità nomologica, che indica il grado in cui la misura del costrutto che vogliamo esaminare si inserisce in una rete di relazioni predittive tra costrutti e criteri appositamente definiti. A differenza della validità di costrutto, la validità nomologica non si limita a considerare un solo criterio; al contrario, essa valuta molti criteri (o misure) inseriti in una rete nomologica o di relazione tra costrutti. In pratica, gli studiosi che si interessano a questo tipo di validità cercano di comprendere le relazioni tra il costrutto esaminato e una serie di misure ad esso correlate. Negli ultimi decenni, lo studio della validità nomologica è progredito molto grazie alla disponibilità di nuove e sofisticate tecniche di analisi statistica, come la path analysis o le equazioni strutturali, che permettono di testare modelli teorici complessi sia per numero di variabili che per numero di relazioni (La Figura 1 riproduce un modello di path analysis che valuta le relazioni tra la competenza sociale e i problemi emotivo-comportamentali nel corso dello sviluppo: Bornstein, Hahn, & Haynes, 2010). Figura 1. Modello di path analysis che valuta le relazioni tra la competenza sociale e i comportamenti esternalizzanti ed internalizzanti nel corso dello sviluppo (a 4, 10 e 14 anni): Bornstein, Hahn, & Haynes, 2010 Il concetto di controllo 1. Esperimenti di controllo Il controllo sperimentale può essere definito come «qualsiasi procedimento atto a neutralizzare o a controllare le potenziali minacce alla validità di un esperimento». Quando si avvia un nuovo studio, il ricercatore dovrebbe sempre porsi le seguenti domande: Quali sono le principali minacce alla validità della ricerca che sta per iniziare? Quali sono i mezzi disponibili per neutralizzare tali minacce? Il primo significato del termine «controllo» è quello di fornire un punto di paragone fisso con cui confrontare l’effetto di una particolare variabile indipendente. Questo implica progettare un esperimento di controllo. La logica alla base di questo primo metodo è molto semplice: se due condizioni sperimentali differiscono solo per una variabile indipendente, qualsiasi differenza che emerge tra le due condizioni può essere attribuita all’azione di quella variabile. Il concetto di controllo si basa essenzialmente sul metodo della differenza proposto dal filosofo John Stuart Mill. Mill suggeriva che se due individui differiscono solo per una variabile, allora quella variabile può essere considerata la causa della differenza. Il controllo sperimentale costituisce un modo per stabilire che due individui, o gruppi, o condizioni, sono identici in tutto tranne che nella variabile indipendente che interessa allo sperimentatore. Uno dei metodi più comuni per ottenere il controllo sperimentale consiste nell’utilizzare un gruppo di controllo. Supponiamo, ad esempio, che una ricerca preveda l'uso di due gruppi sperimentali composti da soggetti diversi. Il Gruppo 1 riceve il trattamento A (gruppo sperimentale), mentre il Gruppo 2 non riceve il trattamento (gruppo di controllo). Se i due gruppi erano uguali prima del trattamento, lo sperimentatore può ragionevolmente concludere che qualsiasi differenza tra di essi dopo l’esperimento è stata causata dal trattamento. Gli esperimenti in cui soggetti diversi sono assegnati a condizioni sperimentali diverse sono detti esperimenti tra i soggetti. Al contrario, gli esperimenti nei quali ciascun soggetto è sottoposto a tutte le condizioni sono detti esperimenti entro i soggetti (o ripetuti). In quest'ultimo caso, non si avrà più un gruppo di controllo, ma una condizione di controllo: le prestazioni dei partecipanti in tale condizione sono successivamente confrontate con le prestazioni degli stessi soggetti in una condizione in cui viene manipolata una determinata variabile indipendente (condizione sperimentale). In altre parole, negli esperimenti ripetuti, il soggetto serve da controllo per sé stesso. È fondamentale ricordare che lo sperimentatore può esercitare il controllo sperimentale anche senza avere un gruppo di controllo. Supponiamo, ad esempio, che il Gruppo 1 riceva il trattamento A1, mentre il Gruppo 2 riceve il trattamento A2. Anche in questo caso, se i due gruppi erano uguali prima del trattamento, qualsiasi differenza tra di essi dopo l’esperimento potrà essere attribuita alla differenza tra le condizioni A1 e A2. In altre parole, pur non avendo un gruppo di controllo, abbiamo comunque una condizione in cui ciascun gruppo serve da controllo per l'altro gruppo. 2. Il controllo sperimentale Un secondo significato del termine «controllo» consiste nella capacità di limitare le sorgenti di variabilità in una ricerca. Questo concetto di controllo sperimentale è ben illustrato dal paradigma del condizionamento operante di Skinner. In alcuni dei suoi esperimenti, i piccioni erano addestrati a beccare un tasto per ottenere il cibo in risposta a una luce verde e a non beccarlo in risposta a una luce rossa. Quando il piccione era ben addestrato, il suo comportamento era altamente prevedibile: il colore della luce praticamente lo attivava o disattivava. In questo senso, ottenere il controllo sperimentale significa limitare le fonti di variabilità in un esperimento al punto tale da rendere il comportamento del soggetto altamente prevedibile. I due significati di controllo (esperimenti di controllo e controllo sperimentale) sono strettamente legati tra loro. L’esperimento di controllo permette di concludere che una variabile dipendente è associata con una specifica variabile indipendente e non con altre variabili. Il controllo sperimentale facilita il raggiungimento di questa conclusione limitando il numero di variabili che agiscono in una determinata situazione. In altre parole, il controllo sperimentale è la base per poter trarre conclusioni valide: quando in un esperimento sono state eliminate o controllate le maggiori fonti di variabilità (significato secondario), vi è una possibilità molto maggiore per il ricercatore di escludere spiegazioni alternative dei risultati sperimentali (significato primario). Entrambi i significati di controllo sono in rapporto con l’uso della statistica nella ricerca psicologica. Da una parte, la statistica inferenziale valuta la probabilità che una differenza tra i gruppi o tra le condizioni sperimentali sia dovuta solo al caso (e non alle variabili indipendenti manipolate). D'altra parte, lo sperimentatore effettua un numero elevato di osservazioni su un campione sufficientemente ampio: ciò riduce la variabilità della misurazione e rende le valutazioni statistiche più precise. Le strategie di controllo sperimentale più comunemente utilizzate in campo psicologico sono le seguenti: Strategie generali di controllo (ad es., controllo nel laboratorio o ripetizione) Strategie di controllo sugli effetti dei soggetti e dello sperimentatore (ad es., doppio cieco, automazione delle istruzioni) Strategie di controllo mediante selezione e assegnazione dei soggetti (ad es., metodi di campionamento) Strategie di controllo degli effetti dell’ordine e della sequenza (ad es., controbilanciamento) È bene ricordare che non è necessario o addirittura possibile usare tutti i mezzi di controllo in tutte le ricerche. I vari metodi di controllo sono mezzi che gli psicologi usano quando è necessario. Alcuni, come la randomizzazione, vengono usati quasi sempre; altri, invece, sono usati raramente. 3. Strategie generali di controllo La procedura di controllo più generale consiste nel definire l'ambiente in cui viene condotta la ricerca, ovvero il setting sperimentale. Il laboratorio è sempre stato considerato l’ambiente ideale in quanto permette di eliminare, o quantomeno tenere sotto controllo, le variabili estranee o di confusione, come stimoli interferenti visivi e uditivi, la presenza di altre persone, e così via. Inoltre, il laboratorio consente di mantenere costanti tutte le variabili che non possono essere esaminate o manipolate durante l’esperimento. Questa proprietà è fondamentale, poiché se una variabile legata all'ambiente o allo sperimentatore è la stessa per tutti i gruppi, l'effetto che essa produrrà sui risultati sarà trascurabile. Il laboratorio è particolarmente importante in tutte quelle ricerche che richiedono condizioni ambientali specifiche, le quali possono essere realizzate soltanto in un ambiente controllato: ad esempio, molte ricerche percettive richiedono un certo isolamento, condizioni di illuminazione ottimale e il completo isolamento da rumori distraenti. Tuttavia, non bisogna mai dimenticare che il laboratorio rappresenta un luogo organizzato per permettere il controllo più adeguato delle variabili di interesse in una particolare ricerca. Quindi, non dobbiamo necessariamente pensare al laboratorio come a una stanza con mobili grigi o neri, senza tende alle finestre, con pavimenti piastrellati e tutte le persone che vi lavorano vestite in camice bianco. In genere, i laboratori di psicologia sociale o i laboratori di psicologia dello sviluppo sono molto diversi da questo standard: possono avere tappeti sul pavimento, tende alle finestre, quadri alle pareti, comode poltrone e un mucchio di giocattoli facilmente disponibili in una grossa cesta. Nonostante l'utilità e i vantaggi prodotti dall'uso del setting di laboratorio, è chiaro che, in alcuni casi, la ricerca sul campo è preferibile rispetto alla ricerca di laboratorio. Ciò avviene, ad esempio, in tutti gli studi in cui sarebbe impossibile o eticamente scorretto manipolare certe variabili in laboratorio (ad esempio, quando la procedura sperimentale richiede che i soggetti aggrediscano altri partecipanti); oppure, in tutte quelle ricerche in cui la manipolazione della variabile indipendente potrebbe non essere sufficientemente realistica in laboratorio (si pensi, ad esempio, a quanto sarebbe difficile simulare una rissa in laboratorio). Una seconda procedura di controllo riguarda la scelta della situazione sperimentale più adeguata: l’obiettivo, in questo caso, è trovare il preparato più indicato per studiare un problema. Il concetto di preparato è molto noto in ambito biologico: ad esempio, gli studiosi che intendevano esaminare i meccanismi della conduzione nervosa fecero enormi progressi studiando l'assone gigante del calamaro. La disponibilità di questo assone, molto più grande di quello di altri animali, consentì ai biologi di fare ricerche che all’epoca erano impossibili su altri nervi. D'altra parte, trovare il preparato adeguato a verificare i fattori che determinano i comportamenti di cooperazione nelle persone può essere molto più complicato. Ad ogni modo, la preparazione della situazione sperimentale dovrebbe sempre rispondere alla domanda: quale situazione produrrà la relazione più forte tra la variabile indipendente e quella dipendente? Molti contributi importanti alla psicologia sono venuti da ricercatori che hanno ideato nuovi preparati o paradigmi. Si pensi ad esempio a tutti gli studi sul condizionamento operante che sono stati resi possibili dall'invenzione della gabbia di Skinner, uno strumento semplice che permise di studiare in modo analitico una variabile diversa da quelle indagate fino ad allora, ovvero la frequenza delle risposte di pressione della leva da parte dei ratti. Una terza strategia di controllo riguarda la scelta degli strumenti: l’obiettivo è quello di aumentare la sensibilità della ricerca migliorando la misurazione del comportamento in esame. In generale, uno strumento di osservazione adeguato deve consentire di estrarre la risposta dall’insieme delle osservazioni casuali, rendendo così la misura oggettiva e attendibile. Il termine “strumento” richiama volutamente l’attenzione sui mezzi che lo psicologo ha a disposizione per trasformare il comportamento in numeri o in altre forme adatte per le analisi statistiche. Esattamente come certi preparati sono diventati classici nella ricerca psicologica, così certi strumenti per misurare le variabili dipendenti hanno avuto un enorme impatto in questo settore. Si pensi ad esempio al Minnesota Multiphasic Personality Inventory (MMPI) o alla Wechsler Adult Intelligence Scale (WAIS). Entrambi sono strumenti che consentono di misurare costrutti psicologici in maniera estremamente attendibile e sono diventati di uso comune nel campo della psicologia. Nel valutare la bontà di uno strumento di misura, occorre tenere in considerazione due aspetti fondamentali: Oggettività: una misura è tanto più oggettiva quanto più la somministrazione, l’assegnazione e l’interpretazione dei punteggi sono indipendenti dal giudizio soggettivo del ricercatore. Sensibilità: definita come la variazione minima che induce un cambiamento nell’unità di misura o nel livello della variabile misurata. In altre parole, la sensibilità riguarda la capacità dello strumento di dare informazioni più o meno specifiche sul fenomeno studiato. Ad esempio, il termometro valuta la temperatura in gradi Celsius, ma non può essere usato per misurare variazioni dell'ordine di centesimi. Analogamente, alcuni sistemi di codifica per l'osservazione del comportamento umano consentono di studiare solo poche macrocategorie, e quindi sono poco utili per esaminare categorie di comportamento più specifiche. Lo psicologo dovrebbe sempre scegliere lo strumento di misura in funzione del livello di specificità con cui vuole misurare la variabile dipendente. Infine, una quarta strategia di controllo consiste nella ripetizione dell’esperimento. Se un esperimento viene replicato più volte da ricercatori diversi, la fiducia della comunità scientifica nei confronti del fenomeno indagato sarà molto alta. Al contrario, se un esperimento non può essere replicato, rimarrà sempre il dubbio che i risultati ottenuti siano frutto del caso. Nella pratica, è necessario distinguere tra: Ripetizione esatta (o diretta): consiste nel rifare l’esperimento nel modo più fedele possibile all’originale. Ripetizione sistematica: consiste nel verificare se un risultato si ottiene anche in situazioni differenti da quelle originali (in questo caso, il ricercatore dovrebbe variare una sola variabile per volta). Poiché le maggiori riviste scientifiche si rifiutano di pubblicare studi che consistono semplicemente in repliche esatte di esperimenti precedenti, la ripetizione sistematica è certamente la strategia più utilizzata dagli psicologi ricercatori. Strategie di controllo sugli effetti dei soggetti e dello sperimentatore 1. Effetti dovuti ai soggetti I soggetti sperimentali possono introdurre numerosi effetti di disturbo nella ricerca psicologica, in quanto la loro prestazione può essere influenzata da conoscenze specifiche di vario tipo: 1. Conoscenze psicologiche generali (corrette o meno). 2. Conoscenze generiche sulle procedure sperimentali adottate negli esperimenti psicologici (in genere derivanti da precedenti partecipazioni ad altre ricerche). 3. Conoscenze sugli obiettivi dello specifico studio al quale partecipano (in genere questo fenomeno si verifica quando il soggetto ha avuto notizie da altri partecipanti che si sono già sottoposti alle prove). Impatto delle Conoscenze Psicologiche Generali L’impatto delle conoscenze psicologiche generali è particolarmente rilevante quando si utilizzano studenti di psicologia come volontari. Questi possono aver appreso nozioni relative al funzionamento dei processi cognitivi, permettendo loro di fare inferenze sugli scopi dell’esperimento. Tuttavia, anche al di fuori del contesto accademico, la maggior parte delle persone ha teorie ingenue su vari ambiti del sapere psicologico, rendendo i soggetti realmente "naïf" piuttosto rari. Strategie per limitare l’impatto delle conoscenze psicologiche generali: Fornire consegne specifiche che impediscano o spingano i soggetti ad evitare di ricorrere alle proprie conoscenze per rispondere. Somministrare un questionario alla fine dell’esperimento per valutare le conoscenze del soggetto nelle aree indagate, escludendo eventualmente i dati dei soggetti giudicati troppo «esperti». Gestione delle Risposte ai Questionari Nel caso di questionari che richiedono informazioni personali, i partecipanti potrebbero mentire volontariamente. Per evitare questa possibilità, lo sperimentatore dovrebbe: Assicurare l’anonimato sull’identità del partecipante. Garantire che i dati saranno analizzati a livello di gruppo, solo per ricavare descrizioni generali del fenomeno. Assicurare che l’interesse della ricerca riguarda quello che la gente crede e fa veramente, non quello che sarebbe eticamente giusto credere o fare. Impatto delle Conoscenze sulla Procedura Sperimentale I partecipanti tendono a interrogarsi sullo scopo dell’esperimento e sulle risposte che ci si aspetta da loro. Per ridurre gli effetti prodotti dalle supposizioni dei partecipanti, vi sono vari metodi: Fornire al soggetto informazioni sufficienti per evitare che rifletta oltre quanto gli è stato detto riguardo alle vere finalità dell’esperimento. Instaurare una relazione di fiducia e invitare il soggetto a collaborare in modo ‘ingenuo’. Ridurre l’ansia proveniente da una situazione nuova, ad esempio garantendo che lo scopo della ricerca sarà svelato alla fine dell’esperimento. Effetto Diffusione I partecipanti potrebbero aver ricevuto informazioni sullo scopo dell’esperimento da altri soggetti che hanno già partecipato (effetto diffusione). Questo può influenzare le risposte, inducendo il partecipante a produrre risposte che supportano l’ipotesi dello studioso o, alternativamente, a mettere in atto comportamenti di non collaborazione o di aperta ostilità. Rimedi per l’effetto diffusione: Invitare i partecipanti a mantenere la riservatezza sul contenuto e sulla procedura della ricerca. Accertarsi, prima dell’esperimento, se i soggetti sono stati informati, anche solo parzialmente, da altre persone. Conclusione Tutti questi metodi hanno come obiettivo generale quello di impedire che il soggetto mostri comportamenti differenti da quelli che avrebbe in condizioni normali, solo per adeguarsi o per contrastare lo scopo della ricerca. 2. Effetti dovuti allo sperimentatore Effetto Sperimentatore (Experimenter Bias) L’effetto sperimentatore si verifica quando l'influenza inconscia o non intenzionale dello sperimentatore modifica il comportamento dei partecipanti e, di conseguenza, i risultati dell'esperimento. Questo fenomeno, noto come effetto di attesa (expectancy effect), implica che le aspettative dello sperimentatore possano influenzare le prestazioni dei partecipanti, portandoli a comportarsi in modo che confermi le ipotesi dello sperimentatore. Caratteristiche dell'Effetto Sperimentatore Fattori fisici: Le caratteristiche fisiche dello sperimentatore, come sesso, etnia, età e condizione sociale, possono influenzare i risultati. Ad esempio: ○ Gli studenti di sesso opposto possono richiedere più tempo per rispondere a compiti verbali. ○ Nei test con bambini, le ricercatrici spesso ottengono risultati migliori rispetto ai ricercatori maschi. Fattori psicologici: Le caratteristiche psicologiche, come uno stile interattivo amichevole o il calore umano, possono influenzare i risultati: ○ Un approccio amichevole può incoraggiare i partecipanti a completare compiti sgradevoli. ○ Lo stile interattivo può modificare le risposte in test proiettivi e di intelligenza. Fasi di Influenza dell’Effetto Sperimentatore 1. Campionamento: Lo sperimentatore potrebbe selezionare soggetti che sono più propensi a mostrare il comportamento desiderato. 2. Fornitura delle Istruzioni: Gli indizi non verbali (come sorrisi o sguardi) possono influenzare le risposte dei partecipanti. 3. Raccolta dei Dati: Errori di osservazione, codifica o calcolo possono derivare dall’influenza dello sperimentatore. 4. Interpretazione dei Risultati: Le aspettative possono portare a considerare solo i risultati che confermano l’ipotesi iniziale. Studio di Rosenthal e Fode (1963) Uno studio emblematico dell’effetto sperimentatore è quello condotto da Rosenthal e Fode nel 1963. In questo esperimento: Procedura: Gli studenti dovevano addestrare dei ratti a percorrere un labirinto a T. Ad alcuni fu detto che i ratti erano selezionati per alta intelligenza ("ratti intelligenti"), mentre ad altri fu detto che erano selezionati per bassa intelligenza ("ratti stupidi"). In realtà, tutti i ratti erano dalla stessa popolazione. Risultati: I ratti "intelligenti" mostrarono prestazioni superiori sin dal primo giorno, trovando il cibo più rapidamente. Gli studenti che pensavano di avere ratti intelligenti trattavano gli animali con maggiore amichevolezza e delicatezza rispetto agli studenti con i ratti "stupidi". Conclusione: Le differenze nel comportamento degli studenti verso i ratti erano la causa principale delle differenze di apprendimento osservate nei due gruppi di ratti. 3. Controllo sugli effetti dei soggetti e dello sperimentatore Gli effetti dovuti ai soggetti e allo sperimentatore possono essere controllati in vari modi, tra i quali ricordiamo: I procedimenti a singolo e doppio cieco: ○ Procedimento a Singolo Cieco: Controlla solo gli effetti dovuti ai soggetti, in quanto consiste nel nascondere ai partecipanti lo scopo della ricerca e la condizione alla quale sono stati assegnati. Questo procedimento si usa spesso negli esperimenti di psicofarmacologia, in cui al gruppo di controllo si somministra un placebo, ovvero un farmaco del tutto simile al farmaco vero, ma che non contiene il principio attivo presente nel farmaco somministrato al gruppo di controllo. In questo modo, i soggetti non sanno se la sostanza che è stata data loro contiene o meno il principio attivo. ○ Procedimento a Doppio Cieco: Controlla anche gli effetti dovuti allo sperimentatore. A tale scopo, è necessario ridurre al minimo i contatti tra i soggetti e lo sperimentatore, ad esempio attraverso l’uso di collaboratori ben addestrati in grado di realizzare tutte le fasi dell’esperimento. I collaboratori non dovrebbero conoscere né le ipotesi sperimentali né la condizione alla quale sono assegnati i soggetti, in modo tale da non poter trasmettere loro alcuna informazione. Inoltre, se i collaboratori codificano le risposte, è necessario che essi non conoscano il gruppo da cui esse provengono. In sintesi, nel procedimento a doppio cieco né lo sperimentatore né il soggetto conoscono le finalità della ricerca. L’automazione delle istruzioni: Infatti, le istruzioni possono veicolare aspettative sulla facilità del compito o sulle ipotesi teoriche, anche attraverso indizi quali il tono della voce. In questo caso, automatizzare le istruzioni è un altro metodo per ridurre il contatto tra i soggetti e lo sperimentatore. Ad esempio, le istruzioni possono essere distribuite in forma scritta o mediante registrazione. Oggi, la maggior parte degli esperimenti si avvale di computer, i quali consentono di standardizzare, oltre alle istruzioni, anche la presentazione degli stimoli e la registrazione delle risposte. L’uso di più osservatori o valutatori: Ad esempio, nelle ricerche che richiedono la codifica di comportamenti osservati è possibile usare due o più osservatori; analogamente, nelle ricerche che richiedono la codifica del contenuto o di domande aperte, è raccomandabile usare due o più valutatori. In tutti questi casi, è buona norma adottare il procedimento del doppio cieco e far codificare il materiale a ciascun valutatore in modo indipendente; solo in seguito sarà possibile calcolare un indice di accordo tra codificatori (ad esempio, il K di Cohen). L’uso dell’inganno: Questo procedimento, che è diventato sempre più comune negli studi psicologici, consiste nel far credere ai soggetti che la situazione sperimentale sia diversa da quella che i ricercatori stanno in realtà studiando e manipolando; esso include anche i casi in cui lo sperimentatore nasconde, magari con il silenzio, informazioni importanti relative allo scopo dell’esperimento o alla procedura che sarà applicata. Ovviamente, l’uso dell’inganno pone notevoli problemi etici e lo studioso dovrebbe evitare il ricorso a questa tecnica quando l’inganno implica il fornire ai partecipanti informazioni false in grado di generare ansia o stati di disagio psicologico. Tuttavia, quando l’inganno è innocuo ed organizzato in maniera semplice ed elegante, esso può dare un contributo importante alla conoscenza di specifici meccanismi cognitivi. Un esempio famoso deriva da un esperimento di Asch (1951) sul conformismo sociale, ovvero il fenomeno per cui i partecipanti tendono a conformarsi al giudizio del gruppo anche quando tale giudizio è palesemente in contrasto con la realtà. Il protocollo sperimentale prevedeva che 8 soggetti, di cui 7 complici dello sperimentatore all'insaputa dell'ottavo, si incontrassero in un laboratorio, per quello che veniva presentato come un normale esercizio di discriminazione visiva. Lo sperimentatore presentava loro delle schede con tre linee di diversa lunghezza; su un'altra scheda aveva disegnato un'altra linea, di lunghezza uguale ad una delle tre linee della prima scheda. Chiedeva a quel punto ai soggetti, iniziando dai complici, quale fosse la linea corrispondente nelle due schede. Dopo un paio di ripetizioni "normali", alla terza serie di domande i complici iniziavano a rispondere in maniera concorde e palesemente errata; il vero soggetto sperimentale, che doveva rispondere per ultimo o penultimo, in un'ampia serie di casi iniziava regolarmente a rispondere anche lui in maniera scorretta, conformemente alla risposta sbagliata data dalla maggioranza di persone che aveva risposto prima. Tuttavia, anche nei casi in cui l’uso dell’inganno è ben congegnato, le implicazioni negative riguardano il fatto che i soggetti possono accorgersi dell’opacità delle procedure e quindi farsi una idea negativa sulla sincerità del ricercatore. Questa impressione può generare sfiducia nei confronti di questo settore di studi e portare alla diffusione dell’opinione che i metodi della psicologia si basano sempre sull’inganno generalizzato. Drammatizzazione (Role Playing): Un’alternativa che ha avuto una discreta diffusione è la drammatizzazione, ovvero la costruzione di una situazione fittizia, durante la quale si richiede al soggetto di comportarsi come se si trovasse in una situazione reale. Evidentemente, lo svantaggio di questa tecnica è che fornisce informazioni su come il soggetto pensa che si comporterebbe in una data situazione, mentre il suo comportamento reale potrebbe essere ben diverso da quello ipotizzato.