Metologia della Ricerca Psicologica PDF
Document Details
Uploaded by Deleted User
Tags
Summary
Questo documento riassume i metodi di ricerca psicologica. L'approccio scientifico e le sue caratteriste vengono discusse nei dettagli. Vengono esaminati i metodi non empirici e empirici, le ipotesi, e l'utilità della teoria nel campo della ricerca.
Full Transcript
METODOLOGIA DELLA RICERCA PSICOLOGICA LA PSICOLOGIA COME SCIENZA La Psicologia, inizialmente branca della filosofia, ha dovuto lottare per affermarsi come disciplina scientifica. Il suo oggetto di studio sono comportamenti umani e processi psichici. Ma com...
METODOLOGIA DELLA RICERCA PSICOLOGICA LA PSICOLOGIA COME SCIENZA La Psicologia, inizialmente branca della filosofia, ha dovuto lottare per affermarsi come disciplina scientifica. Il suo oggetto di studio sono comportamenti umani e processi psichici. Ma come si fa a considerare scientifico (e misurabile) un fenomeno tipicamente umano? ↓ METODO SCIENTIFICO Preso a prestito dalle scienze dure MEZZI DI CONOSCENZA 1)METODI NON EMPIRICI non basati sull’esperienza 1. AUTORITÀ 2. LOGICA 2)METODI EMPIRICI basati sull’esperienza, sull’osservazione diretta di un fenomeno 1. INTUITO 2. SCIENZA 1) METODI NON EMPIRICI 1. AUTORITÀ Il Principio di Autorità Accettazione di una o più affermazioni come vere poiché definite tali da un’autorità. fonti rinomate (es. i governi); università; persone fidate; internet (es. notizie sui social); religioni (trasmesse come dogmi); Limiti: 1. Spesso sono in disaccordo tra loro; 2. Spesso si sbagliano; 3. gravemente limitato come mezzo di conoscenza 2. LOGICA Forma basilare di ragionamento deduttivo, studiata in modo approfondito da Aristotele. Si concretizza nel sillogismo. 1. Il comportamento degli animali è soggetto alle scienze naturali (Premessa A) 2. Gli uomini sono animali (Premessa B) 3. Il comportamento umano è soggetto alle scienze naturali (Conclusione) Tra la prima e la seconda premessa esiste un termine medio che permette di connetterle (es. classe degli animali). Non è, di per sé, un metodo sbagliato, ma non sempre funziona. Un percorso logico perfetto può portare a: conclusioni valide ma non vere (errate) Es. Tutte le persone hanno dei pensieri. Tutti i pensieri sono intelligenti. Tutte le persone sono intelligenti. conclusioni non sempre nuove; importante per la scienza, ma non sostituisce l’evidenza empirica! 2) METODI EMPIRICI 1. INTUIZIONE Metodo di conoscenza quasi immediato, basato su “processi istintivi”, non sul ragionamento. Utilizzato per prendere decisioni nella vita quotidiana (es. empatia). Se condiviso tra un ampio gruppo di persone esso diventa SENSO COMUNE (accordo tra più sensazioni). Limiti: può cambiare a seconda del tempo e del contesto; manca di teoria alla base (una credenza o pratica è considerata vera solo se funziona); Questa mancanza di una teoria generale alla base impedisce la comprensione, la previsione e non porta, di conseguenza, a nuove conoscenze. la conoscenza è spesso in contraddizione con il senso comune 2. SCIENZA Che cos’è la SCIENZA? Il metodo scientifico prevede: Teoria (studio di letteratura); Ipotesi di Ricerca; Conferma/disconferma (attraverso raccolta e trattamento dati, ecc…) Conclusioni Consecutivi o meno. Questo è l’APPROCCIO THEORY-DRIVEN. APPROCCIO DATA-DRIVEN: 1. Raccolta dati (grandi quantità grandi dimensioni, diverse fonti) 2. Analisi dei dati 3. Ipotesi su relazioni/correlazioni emerse 4. Conclusioni Es. Data Science (profilazione psicologica basata sui Big-Data, modelli predittivi basati su algoritmi di Machine Learning, data-mining, Market Basket Analysis). LA SCIENZA E LE SUE CARATTERISTICHE EMPIRICA l’esperienza conferma (o piuttosto, confuta) la teoria. OBIETTIVA a parità di condizioni sperimentali chiunque, ripetendo l’esperimento dello scienziato, otterrebbe gli stessi risultati. AUTOCORRETTIVA si aggiorna. Nuovi dati e nuove scoperte contraddicono (o integrano) quelle precedenti. ORIENTATA AL PROGRESSO continui sviluppi futuri (es. le conclusioni e sviluppi futuri sempre proposti negli articoli scientifici). POSSIBILISTA esistono solo verità parziali che, con ragionevole fiducia, ci avvicinano alla verità. PARSIMONIOSA Preferire la spiegazione più semplice possibile nel dar conto di un dato fenomeno. FOCALIZZATA SULLA TEORIA Obiettivo finale della scienza è di sviluppare e definire una Teoria generale su come funziona qualcosa. SCIENZA VS TECNOLOGIA ↓ ↓ Perché funziona Come funziona LE IPOTESI SU CUI SI FONDA LA SCIENZA DOTTRINA DEL REALISMO (o realtà del mondo): Gli oggetti di studio esistono indipendentemente da chi li osserva e possono essere compresi tramite il pensiero logico. Esistono delle relazioni tra fenomeni, e compito dello scienziato è quello di scoprirle. - contrapposto a Realismo comune (secondo cui le cose sono così come appaiono). Es. Relazione tra Job Satisfaction e salario. È, più precisamente, determinata dal salario percepito le cose non sono come sembrano. LE CONCEZIONI SU CUI SI FONDA LA SCIENZA REGOLARITÀ Il mondo segue le stesse leggi, in ogni tempo e luogo. Le cause di determinati comportamenti possono anche essere complesse, ma essi rientreranno sempre nelle leggi di natura, dovunque e in qualsiasi tempo si verifichino. CAUSALITÀ (o Determinismo) Una delle ipotesi di lavoro fondamentali della scienza: Relazione di causa-effetto gli eventi si verificano per una ragione; conoscere queste ragioni permette di fare previsioni; Estremamente difficile da determinare, nelle scienze umane e sociali. GLI OBIETTIVI DELLA SCIENZA 1) RICERCA DI REGOLARITÀ Attraverso la 1.1. DESCRIZIONE si descrive qualcosa per conoscerne i riferimenti principali. L’approccio descrittivo mira a fornire una panoramica del fenomeno e di tutto ciò che gravita attorno ad esso (la cosiddetta «rassegna bibliografica») (Es. Un ricercatore vorrebbe condurre un esperimento. Dovrebbe, in primo luogo, verificare se qualcuno l’ha già fatto. Se sì, in che condizioni? Quale campione ha utilizzato? Con quale disegno di ricerca? Quali strumenti di misura ha utilizzato? Ecc…) 1.2 INDIVIDUAZIONE DI LEGGI Regolarità fra eventi comportamentali: Alcuni eventi sembrano essere regolarmente associati (un fenomeno si presenta assieme ad un altro). Ogni volta che esiste un’associazione regolare tra due variabili si ha una legge.. Spesso, la regolarità non è perfetta, né assoluta né deterministica (piuttosto è una regolarità statistica). Regolarità statistica regolarità soggetta ad un errore (solitamente, un errore di tipo casuale). 1.3 RICERCA DELLE CAUSE obiettivo fondamentale, primario della scienza. Conoscere le cause di un fenomeno (es. un comportamento problematico quale l’ostilità, l’aggressività, un disordine psicologico, una caratteristica di personalità) permette di: 1. comprenderlo; 2. prevenirlo. Esempio Paul Broca notò che molti suoi pazienti, dopo aver avuto un ictus, perdevano la capacità di parlare (afasia). Per cercare di capire come mai, lo studioso, molto probabilmente, si è posto alcune domande. Allora effettuò l’autopsia a questi suoi pazienti e scoprì che tutti avevano avuto ictus nell’emisfero sinistro. Ictus che variava come localizzazione e grandezza. Esaminando attentamente i cervelli dei pazienti, notò che un’area danneggiata, nella corteccia frontale, accomunava tutti i pazienti che avevano perso l’uso della parola. Quell’area è oggi conosciuta come Area di Broca. Esempio 1. In cosa differiscono, questi casi, da altri casi simili? Probabilmente, molti dei pazienti di Broca colpiti da ictus non presentavano afasia. Quei pazienti si differenziavano dagli afasici in quanto quella piccola area della corteccia frontale non era stata danneggiata dall’ictus. Sulla base di questo, Broca abbandona l’idea che tutti gli ictus possano provocare afasia. 2. L’effetto varia in concomitanza di qualche altro evento? L’effetto varia in concomitanza di qualcosa che possa esserne la causa. Nel caso degli afasici di Broca, è possibile che il grado di compromissione linguistica (effetto) vari in concomitanza di quanto la lesione è estesa (evento)? 2) SVILUPPO DI UNA TEORIA LEGGE Asserzione su una singola relazione tra variabili. TEORIA Asserzione o insieme di asserzioni sulle relazioni tra variabili che includa almeno un concetto non direttamente osservato, ma necessario per spiegare le relazioni fra le variabili. Esempio: la Teoria dell'azione ragionata (Martin Fishbein e Icek Ajzen, nel 1975). La psicologia fa ampio uso di concetti non osservabili, come la memoria, le intenzioni, le emozioni, per elaborare teorie del comportamento. ECSI MODEL (Ciavolino & Dahlgaard, 2007) Modello psicometrico: modello di tipo psicologico sviluppato e confermato attraverso tecniche di tipo matematico- statistico. VARIABILI MANIFESTE 2.1) FALSIFICABILITÀ (Karl Popper) La prova più fruttuosa di una teoria è quella di costruire una situazione in cui può non funzionare. Per quale motivo? Perché non possiamo mai provare con certezza che una teoria sia vera. Tuttavia, quanto più la mettiamo alla prova (ed essa supera quelle prove) tanto più possiamo darle fiducia. VERIFICA DELLE IPOTESI: ESEMPI Ipotesi nulla: Status quo. Ciò che è vero fino a prova contraria Ipotesi alternativa: è l’ipotesi che contrasta l’ipotesi nulla H0= (Ipotesi Nulla) H1= (Ipotesi Alternativa) H0= Innocente H1= Colpevole H0= CS non influenza la Loyalty H1= CS influenza la Loyalty 2.2 IL RUOLO DELLE TEORIE Organizzare conoscenze e leggi in un contesto unificato La teoria serve a spiegare le leggi trovate. creando collegamenti tra concetti particolari e concetti più generali spiegando un gran numero di eventi e leggi (teoria generale ma poco precisa) Oppure spiegando fenomeni più circoscritti (es. teorie sulla percezione dei volti o del problem solving) ma in maniera più precisa. Prevedere nuove leggi dare, cioè, indicazioni non solo rispetto a quelle esistenti e diverse prima d’ora non collegate tra loro, ma anche su dove o come cercarne (ipotizzarne) di nuove Basarsi su delle Ipotesi ovvero, su affermazioni ritenute vere, al fine di valutarne la validità. 2 casi: l’ipotesi è una legge della teoria: Es. «se faccio certe osservazioni in determinate condizioni, e la teoria è esatta, allora dovremmo ottenere i seguenti risultati.» la teoria è il punto centrale dell’ipotesi: Es. «Un intervento psicologico basato sulla teoria che il pensiero determini le emozioni ed il comportamento.» ESEMPIO: vedere slide 34-35-36 La teoria permette di anticipare/prevedere il verificarsi di una determinata legge. Al contempo: Guida la Ricerca suggerisce la direzione di nuovi esperimenti aiuta i ricercatori a scegliere vie alternative per realizzarli. Allo scopo di consolidare o smentire la legge (o le leggi) oggetto di studio. Si avvale di concetti teorici. Per quale motivo dovremmo avvalerci di questi, per spiegare il comportamento umano? Cosa permette di distinguere un concetto scientifico da uno non scientifico? Si basa su conoscenze oggettive (osservabili da tutti, allo stesso modo) È operazionalizzabile: può essere definito operativamente, cioè attraverso delle operazioni osservabili, delle procedure precise e ben definite. STUDIO DI UNA TEORIA: OPERAZIONALIZZAZIONE Esempio: Esperimento di Asch (1951) sul conformismo sociale. Nel suo esperimento, come viene definito il conformismo, in termini operativi? Numero di complici (e le loro risposte per indurre conformismo); Numero risposte dei sogg. sperimentali conformi (o meno) alla maggioranza; Presenza (o meno) di supporto sociale (introduzione di un secondo soggetto "ingenuo" in successive repliche dell’esperimento). Inoltre Definizioni operazionali diverse non sono del tutto indipendenti tra loro, ma piuttosto contribuiscono ad ampliare un corpo comune di conoscenze. Esempio: che si considerino variabili come le differenze di genere, il livello di autostima, il locus of control dei partecipanti (e dunque, modificare la definizione operazionale del conformismo per tener conto di queste variabili) contribuisce a estendere la conoscenza globale sul fenomeno del conformismo sociale. L’uso di mezzi diversi (e diverse definizioni operazionali) per arrivare a un concetto viene definito uso di operazioni convergenti. Ogni nuova esplorazione di un concetto teorico eliminerà una possibile obiezione alla sua spiegazione, aumentando la confidenza che si può avere in quella teoria. ESERCIZIO vedere slide 42. IL PROGRESSO SCIENTIFICO E LA SUA EVOLUZIONE Secondo Thomas Kuhn (1961) la Scienza non evolve in modo lineare, ma è fatta di: Fasi di scienza normale dominate da un paradigma (una serie di assunti e teorie condivise da un gruppo di studiosi, che lo studiano/applicano/utilizzano per spiegare i fenomeni). Fase di rivoluzione in cui sorgono problemi/questioni che non possono essere spiegate dal paradigma predominante. Queste anomalie provocano una crisi. La crisi porta allo sviluppo di paradigmi che competono con quello originario. Il paradigma che spiega i dati empirici meglio di quello originario, sarà accettato. SVILUPPARE UNA DOMANDA DI RICERCA Da dove partire per fare una ricerca? Numerose sono le fonti da cui partire: Corsi universitari particolarmente interessanti; Curiosità e osservazioni quotidiane; Docente o Tutor; Letture interessanti; Ricerca nella letteratura. Qualunque sia l’argomento scelto, è necessario avere un’idea di cosa si sa già (o di cosa è stato già fatto) rispetto a quell’argomento, successivamente si può chiedere al tutor di riferimento in modo tale che ci possa dare un manuale oppure degli articoli scientifici di riferimento da cui partire. Una volta capita la letteratura di riferimento si deve capire qual è la domanda di ricerca: “che cosa ci interessa verificare nelle nostre ricerche?” DOMANDA (o domande) il più PRECISE possibile: Esempi: 1. è possibile creare un profilo di personalità basato sulle preferenze delle persone sui social network? 2. quale profilo è più affidabile, quello umano o quello computerizzato? ESAME DELLA LETTERATURA Atteggiamenti Errati: 1. Progettare direttamente la ricerca senza consultare la letteratura o credendo di essere la prima persona ad aver considerato quel determinato problema. La prima domanda da porsi è “che cosa in letteratura è presente?” partendo dai suggerimenti del docente. 2. Rimanere bloccati a causa della mole di libri già esistenti su quel tema (es. qualsiasi cosa io mi chieda, è stata sicuramente pensata ed affrontata da qualcun’altro). Come fare? Ridurre la letteratura ad una dimensione maneggevole. In che modo? Ogni manuale, ogni articolo alla fine ha la propria bibliografia, qui si può vedere quali possono essere gli articoli da dove partire per approfondire un determinato aspetto. Dove ricercare gli articoli? L'università ha il vantaggio di avere diversi abbonamenti a diverse case editrici, che ci consente di accedere a molte riviste; ciò è possibile attraverso il SIBA: collegandosi con la rete dell’unisalento si possono scaricare le riviste (con le quali si ha l’abbonamento) gratuitamente; inoltre, si può chiedere al SIBA le credenziali per accedere da casa. RIDURRE LA LETTERATURA Da dove partire per ridurre la letteratura? Materiale suggerito dal docente; Manuale e articoli scientifici in esso citati; Biblioteca; Catalogo per schede o elettronico (SIBA unisalento). Una volta formulata un’idea iniziale, è il momento di approfondire. STRUMENTI UTILI 1) INTERNET Strumento (potenzialmente) estremamente utile, poiché permette di: Accedere ad una gran mole di informazioni; Effettuare ricerche trasversali per verificare l’attendibilità del materiale che ci interessa; Reperire materiale che non si troverebbe in una biblioteca. MA teniamo bene a mente che: Essendo internet alla portata di tutti, tutti possono dire la loro (non solo organizzazioni professionali, ma anche appassionati, amatori di qualsiasi tipo, sino ai diffusori di fake news di qualsiasi genere); Chi diffonde certi contenuti è la stessa persona che li produce (non sono passati al vaglio di un editore e di un revisore. Come riuscire a distinguere un contenuto affidabile da uno non affidabile? Considerandone la FONTE: da dove proviene il contenuto? È un sito afferente ad un’università, associazione professionale, un’organizzazione privata rispettabile, un ente pubblico? Se sì → il materiale è affidabile. 2) BIBLIOTECA ELETTRONICA Il SIstema Bibliotecario di Ateneo (SIBA) permette agli studenti di accedere al materiale della biblioteca attraverso un server del web: https://siba.unisalento.it/accessoremoto (dove ci sono le istruzioni per accedere). Si può scaricare il materiale integrale. Consente accesso a banche dati (motori di ricerca): PsycARTICLES, Scopus, Web of Science, ecc… Contenuti sono sicuri e attendibili. 3) I MOTORI DI RICERCA: META-MOTORI (cioè sono motori di ricerca che si agganciano ad altri motori di ricerca) quali: - Google: https://www.google.com/ che esaminano il risultato di altri motori di ricerca. Tuttavia, i risultati potrebbero ancora essere troppo ampi e includere materiale non scientifico. Per ovviare a questo problema esiste: - Google Scholar: https://scholar.google.com/ Motore di ricerca libero, accessibile. Permette di effettuare una ricerca per parole chiave e individuare tutti i testi della letteratura accademica che le contengono. Es. paper scientifici, peer-reviewed, short paper e proceedings di conferenze, tesi di laurea, tesi di dottorato, libri, pre- stampe, report tecnici, materiali provenienti da case editrici, università, ecc… 4) DATABASE PsycARTICLES: articoli pubblicati su periodici, rispettivamente, dell’American Psychological Association (APA) da fine anni ‘80 ad oggi; ha un catalogo che racchiude tutti i dati relativi agli articoli scientifici nell’ambito della psicologia. Scopus: articoli pubblicati su periodici di vario genere. Possibile visualizzare l’impatto di un autore nella comunità scientifica (H-Index) e l’analisi citazionale degli autori e delle relative pubblicazioni (Citation Tracker). - un autore ampiamente citato probabimente ha prodotto un lavoro particolarmente rilevante/interessante/ampio/ad alto impatto. Clarivate (Web of Science): simile a quanto elencato sopra. Archivio elettronico generalista che nasce principalmente per le scienze dure: matematica, fisica, ingegneria, ecc. successivamente è nato Scopus, anch'esso generalista, che nasce con l'obiettivo di integrare le discipline non coperte da Clarivate: medicina, psicologia, sociologia, statistica…. I cataloghi raccolgono informazioni relative al titolo dell'articolo, gli autori, il dipartimento e l'università degli autori, il paese degli autori, il riassunto dell'articolo (abstract), le keywords e la bibliografia degli articoli. Queste sono le informazioni principali che consentono a questo tipo di cataloghi di organizzare le pubblicazioni per nuclei tematici ad esempio. sempre per quanto riguarda i DATABASE… Si possono utilizzare varie modalità di ricerca: per Autore per Titolo dell’articolo per Parola Chiave Si può filtrare la possibilità che una certa parola sia contenuta: tra le parole chiave dell’articolo scientifico nel Titolo nell’Abstract (breve sintesi di qualche riga) dell’articolo. INDIVIDUARE GLI ARTICOLI IMPORTANTI ESAMINARE LA LETTERATURA Quali articoli? (full-text), manuali disponibili sono in biblioteca/libreria, ecc… Alcuni di questi materiali costituiscono dei testi di base, una base da cui partire e da cui si aprono una serie di direzioni di ricerca (esplorate o tuttora inesplorate). Leggere e studiare: Abstract, Introduzione, Discussione e Conclusioni (inizialmente, per avere un’idea di cosa è stato fatto, quali sono i problemi ancora irrisolti e quali risultati sono stati raggiunti) Materiali e Metodi degli esperimenti (quali i punti di forza? E quelli di debolezza?) Visionare il materiale con spirito critico, perché tutti possono commettere degli errori, anche degli scienziati esperti. Ci sono due tipi di ricerche principali: 1. La RASSEGNA DELLA LETTERATURA: è una sintesi di tutto ciò che è stato pubblicato fino a quel momento in riferimento a un certo argomento (che cosa è stato scritto, quali sono i principali articoli…). Sebbene non dia nessun contributo innovativo, ma fa la sintesi di ciò che è stato fatto, spesso è uno dei lavori più importanti; un lavoro di rassegna diventa un punto di partenza per lo sviluppo di nuovi lavori. 2. META-ANALISI: fa l'analisi quantitativa dai risultati ottenuti da altre ricerche: fa un'analisi dei risultati (Es. confronta i campioni, confronta le metodologie…). A volte ci si imbatte in studi che riportano dei risultati opposti. Questo problema ha reso necessario sviluppare un metodo di revisione degli articoli scientifici trasparente e basata su criteri oggettivi → META-ANALISI: insieme di metodi che permettono di combinare assieme molti studi con caratteristiche diverse per raggiungere una conclusione comune. esamina la letteratura su un certo argomento da una prospettiva più esterna e distanziata. La Meta-Analisi permette inoltre di: stimare la tendenza a pubblicare solo risultati di un certo tipo. (es. pubblicare studi a favore di un certo tipo di psicoterapia, mettendo da parte i risultati non significativi “problema del cassetto dell’archivio”). dare, nel confronto, più peso a studi metodologicamente più forti. (es. campionamento randomizzato, campioni di numerosità ampia, tecniche di analisi dei dati adeguate al campione e ad alcune assunzioni di fondo). suffragare uno studio basandosi non solo sulla significatività statistica, ma anche sulla grandezza dell’effetto (Sun, et al., 2010) Perché questo (suffragare…) è importante? È possibile che uno studio: - trovi un grande effetto non statisticamente significativo, semplicemente perché lo studio è stato condotto su pochi soggetti; - trovi un effetto di grandezza trascurabile che risulta statisticamente significativo solo perché è stato studiato su un enorme numero di soggetti!! GRANDEZZA DELL’EFFETTO misura della forza della relazione tra variabili. Nella meta-analisi è utile perché, tenendo in considerazione la variabilità interna dei gruppi, rende confrontabili studi in cui le misurazioni vengono effettuate su scale differenti (es. Scala Likert da 1 a 10 piuttosto che da 1 a 5). In sintesi la meta-analisi è estremamente utile: per il ricercatore che la effettua (presuppone uno studio esaustivo dell’argomento d’interesse, rigore metodologico, spirito critico); per chi la legge (buon punto di partenza per avere una visione d’insieme su ciò che è stato fatto su un argomento e su quali sono gli approcci metodologici con cui è stato tradizionalmente affrontato). ESERCIZIO: vedere slide 18 ETICA DELLA RICERCA rispettare Diritti Civili e Umani Inizialmente era unica responsabilità del ricercatore. TUTTAVIA, eventi storici quali il processo di Norimberga sui crimini nazisti portano l’attenzione sul controllo etico nella ricerca scientifica. L’etica della ricerca è in continuo sviluppo, infatti: I più noti esperimenti della psicologia, come: L’esperimento con cui Watson testò il condizionamento classico sul piccolo Albert; L’esperimento di Stanley Milgram sulla tendenza umana ad obbedire a figure autorevoli e a compiere atti crudeli in nome di esse. Gli studi di Latanè e Darley sull’“effetto spettatore” e sulla “diffusione della responsabilità” L’esperimento di Harlow sulla deprivazione materna; L’esperimento di Philip Zimbardo sul comportamento dei gruppi e l’importanza dei ruoli non sarebbero ora possibili, in quanto non etici. RUOLO DEL COMITATO ETICO Esistono Comitati Etici Locali, composti sia da membri delle istituzioni (università, ASL), sia da esperti esterni, con lo scopo di: Dare informazioni e consulenza ai ricercatori (es. Ricerca con bambini piccoli, disabili, ecc…) Certificare la correttezza (tramite approvazione) di una ricerca; Dare un parere rispetto ad un “caso” segnalato al comitato stesso (es. particolari procedure sperimentali, possibile danno a terzi per la diffusione di risultati, ecc…) CODICE ETICO AIP Ultima versione: 27 marzo 2015¨ Si divide in 3 sezioni: Principi Generali Norme etiche Modalità e organismi di controllo * Il Codice Etico è reperibile dal sito dell'Associazione Italiana di Psicologia: https://aipass.org/node/11560 e cliccando su "Codice Etico. 1) PRINCIPI GENERALI COMPETENZA - Chi svolge attività di ricerca in psicologia è consapevole dei limiti della propria competenza e utilizza solo metodi e tecniche per cui possiede un’adeguata preparazione scientifica e metodologica. - Si impegna ad aggiornare continuamente le proprie competenze tecniche e professionali, dedicando particolare attenzione ai temi di natura etica e agli eventuali cambiamenti nella normativa nazionale e internazionale. - Agisce affinché coloro che lavorano sotto la sua supervisione mantengano un adeguato livello di preparazione e operino riconoscendo i limiti delle loro competenze. INTEGRITÀ - Chi svolge attività di ricerca in psicologia agisce con onestà, lealtà, trasparenza, autonomia ed equità, nel rispetto di tutte le persone coinvolte e nell’interesse di partecipanti, colleghi, studenti, istituzione di appartenenza, comunità scientifica, gruppi sociali di riferimento e opinione pubblica. - Essere integri significa evitare comportamenti opportunistici o ambigui e non abusare del proprio ruolo istituzionale e delle situazioni di asimmetria informativa e decisionale; significa prevenire e rimuovere le situazioni di conflitto di interessi, oltreché resistere ad ogni forma di pressione che si prefigga di condizionare o alterare i progetti di ricerca e i loro risultati. RISPETTO DELLA DIGNITÀ DELLA PERSONA - Chi svolge attività di ricerca in psicologia rispetta la dignità, la libertà e il benessere dei partecipanti, degli studenti, dei colleghi e dei collaboratori, e tutela i loro diritti alla autodeterminazione e alla riservatezza. - Evita e contrasta ogni forma di discriminazione basata su genere, orientamento sessuale, età, livello di istruzione, nazionalità, etnia, religione, stato socioeconomico, opinioni politiche e sindacali, condizioni psico- fisiche. - Nell’interazione con i partecipanti, tiene conto della loro specificità linguistica e culturale, delle eventuali condizioni di vulnerabilità e delle capacità di comprendere e comunicare. RESPONSABILITÀ SOCIALE - Chi svolge attività di ricerca in psicologia è consapevole della responsabilità sociale che deriva dai propri indirizzi di ricerca, dalle scelte metodologiche e dalle modalità di diffusione dei risultati che possono essere diversamente interpretati e usati nei diversi contesti di applicazione. - Agisce affinché la ricerca possa sempre incrementare la conoscenza, le possibilità di intervento, l’offerta di strumenti di comprensione e soluzione dei problemi. In nessun caso, presta la sua attività e la sua competenza per generare o giustificare sofferenza e oppressione. TUTELA DEL BENESSERE - Chi svolge attività di ricerca in psicologia si impegna a non compromettere il benessere psico-fisico dei partecipanti e a non alterare il loro grado di sicurezza e autostima. - Garantisce che la partecipazione alle ricerche non determini un peggioramento delle condizioni attuali e non esponga a situazioni di rischio, disagio o sofferenza. Il ricercatore gestisce il conflitto tra: Impegno per espandere la conoscenza sul comportamento; Costo della ricerca per i partecipanti. 2) NORME ETICHE 2.1) IL RUOLO DEL PARTECIPANTE ALLA RICERCA * Il partecipante da soggetto diventa oggetto di studio. 2.2) CONSENSO INFORMATO Informazione e Consenso (Articolo 1) I partecipanti ad una ricerca devono essere preliminarmente informati in maniera corretta e comprensibile su tutti gli aspetti della ricerca, soprattutto quelli che potrebbero indurle a ritirare il consenso. Possono fornire (o meno) il loro consenso alla partecipazione e al trattamento dei dati personali, inclusi quelli sensibili. I partecipanti sono informati che il consenso può essere rilasciato, rifiutato o ritirato in qualsiasi momento: essi hanno la più ampia libertà decisionale e tutto il tempo per riflettere, avanzare dubbi o chiedere chiarimenti. I partecipanti vanno informati della possibilità di ritirarsi dalla ricerca in qualsiasi momento senza dover dare spiegazioni. Per alcune categorie (es. minori, soggetti con handicap) il consenso deve essere dato da chi ne ha la responsabilità genitoriale o tutela legale. 2.3) INGANNO Uso dell’inganno nella Ricerca (Articolo 2) Si può tenere all’oscuro o ingannare su alcuni aspetti della ricerca solo qualora l’obiettivo scientifico lo richieda e non si possano usare metodi alternativi. Il modulo informativo può contenere informazioni parziali o false. TUTTAVIA: Rischi al benessere psico-fisico devono sempre essere riportati. Informare ogni partecipante in modo esaustivo alla fine della sessione o al termine della raccolta dati. Richiedere un nuovo consenso informato (che sarà l’unico ritenuto valido, dal momento che in quello precedente vi erano solo informazioni parziali). Un colloquio di chiarimento ha l’obiettivo di: - ripristinare stato di umore e autostima precedenti allo studio; - eliminare idee scorrette sulla propria persona che si siano formate per effetto dello studio. Dibattito sul tema dell’inganno: Dati inquinati? Spesso i partecipanti sono studenti di psicologia, ai quali la diffusione degli inganni negli esperimenti di psicologia è già ben nota. Soluzioni tipicamente adottate Informare i partecipanti sul possibile uso dell’inganno nello studio. Role-playing chiedendo al partecipante di agire come se fosse in una determinata situazione. Tuttavia si da per scontato che l’individuo sia in grado di dire cosa farebbe in una situazione semplicemente mettendosi in un ruolo. 2.4) RESTITUZIONE DEI RISULTATI Restituzione dei risultati: il «debriefing» (Articolo 3) Fase di informazione/chiarimento della natura della ricerca Risposte esaustive ad ogni domanda/dubbio dei partecipanti Fugare ogni impressione errata Fase che richiede molta abilità, in quanto bisogna comunicare trasmettendo al partecipante tutto il valore educativo e personale dietro la sua partecipazione. Il tema dell’inganno è molto delicato. Bisogna porre domande in modo da favorire la naturale apertura e, soprattutto, senza far sentire il partecipante tradito/ingannato/ridicolo o stupido. 2.5) PRIVACY Riservatezza e Anonimato (Articolo 4) Diritto dei partecipanti alla riservatezza e all'anonimato. I dati personali e sensibili raccolti nell’ambito dell’attività di ricerca sono: - trattati e conservati secondo quanto stabilito dalle leggi vigenti *. - utilizzati soltanto per gli scopi definiti nel progetto di ricerca e descritti nel modulo informativo. - richiesti solo se strettamente pertinenti agli scopi della ricerca. La persona responsabile del progetto di ricerca ha l’obbligo di custodire i dati personali e i codici identificativi in modo da evitarne la dispersione, la sottrazione e ogni altro uso non conforme alle leggi vigenti e ai principi etici che ispirano il presente Codice. Tutte le informazioni personali riguardanti i partecipanti allo studio sono trattate confidenzialmente e sono accessibili solo ai ricercatori autorizzati dal responsabile del progetto di ricerca. * Si veda il D.Lgs. n. 101/ del 10.08.2018, Disposizioni per l'adeguamento della normativa nazionale alle disposizioni del regolamento (UE) riguardo al trattamento dei dati personali (GDPR). PRIVACY: I DATI Definizione del GDPR Dato personale (art. 4 paragrafo 1): informazioni relative a persona fisica identificata o identificabile. In questo caso cambia il criterio di identificazione che si estende, oltre a caratteristiche dirette come il nome, il codice fiscale, l’indirizzo, a dati che consentano anche un’identificazione indiretta, come il nickname, oppure a caratteristiche relative allo stato di salute, economico, psicologico. Dati sensibili (art. 9 paragrafo 1): si considerano i dati personali come l'origine razziale o etnica, le opinioni politiche, le convinzioni religiose o filosofiche, o l'appartenenza sindacale, dati relativi alla vita sessuale o all'orientamento sessuale della persona, nonché: Dati genetici: ereditati o acquisiti, ottenuti tramite analisi di DNA ed RNA da un campione biologico della persona fisica in questione; Dati biometrici: come l’immagine facciale, grazie ai quali è possibile identificare una ed una sola persona fisica; Dati sulla salute: sia fisica che mentale, passata, presente o futura, ma anche informazioni su servizi di assistenza sanitaria, laddove presenti, indipendentemente dalla fonte, quale, ad esempio, un medico. Riservatezza e Anonimato (Articolo 4) I risultati delle ricerche sono diffusi solo in forma anonima o comunque aggregata. L’eventuale diffusione di informazioni deve essere preventivamente autorizzata. Nella diffusione dei risultati e in assenza di esplicita autorizzazione, chi svolge attività di ricerca garantisce l’anonimato della struttura presso la quale sono stati raccolti i dati. Il diritto all’anonimato e il diritto alla riservatezza sono garantiti anche nel caso di ricerche che prevedano la somministrazione di test e questionari online. Se durante la realizzazione di una ricerca i partecipanti dovessero rivelare informazioni relative a gravi pericoli per la vita, la salute o la sicurezza di terze persone, chi svolge attività di ricerca valuta con attenzione la necessità di derogare totalmente o parzialmente al rispetto della riservatezza. 2.6) PROTEZIONE DA DANNI Rischi e Gestione dei Rischi (Articolo 5) L’attività di ricerca non deve mai compromettere, in modo permanente o temporaneo, il benessere psico-fisico delle persone. Sono inaccettabili le ricerche che possano causare danni e patologie di varia natura, di tipo organico e psicologico. Si deve documentare con dati di letteratura scientifica ogni stima dei rischi e dichiarazione di rassicurazione. Se la procedura di una ricerca implica possibili rischi a causa delle condizioni fisiche e cliniche delle persone, la partecipazione deve essere preceduta da una intervista mirata, al fine di individuare ogni fattore incompatibile con la realizzazione dello studio. Nel caso si preveda la somministrazione di stimoli anche minimamente dolorosi o contrastanti con la sensibilità personale e culturale degli individui, chi svolge attività di ricerca adotta procedure idonee a prevenire situazioni di disagio e sofferenza. Oltre a garantire ogni intervento che prevenga le situazioni di rischio prevedibile, chi svolge attività di ricerca deve essere preparato a fronteggiare situazioni inattese ed interrompere immediatamente lo studio in caso di disagio/sofferenza dei partecipanti. 2.7) PROTEZIONE DEL PARTECIPANTE Protezione dei Partecipanti alla Ricerca (Articolo 6) Chi svolge attività di ricerca: possiede documentate competenze relazionali e scientifiche e garantisce un corretto e rispettoso rapporto con ogni partecipante; deve possedere competenze di pronto intervento se gli studi prevedano anche minime possibilità di rischio per la salute; garantisce il possesso da parte di eventuali collaboratori in formazione, delle capacità necessarie per il corretto svolgimento dei compiti assegnati e di un’adeguata competenza relazionale. deve direttamente e immediatamente contattare le persone indicate dal partecipante nel modulo relativo al consenso al trattamento dei dati personali, qualora durante la ricerca emergessero informazioni impreviste relative alle condizioni psico-fisiche dei partecipanti. L’eventuale possibilità di acquisire informazioni incidentali sulla salute psico-fisica dei partecipanti deve essere chiarita loro al momento dell’acquisizione del consenso. L’efficacia di un nuovo intervento educativo, clinico o riabilitativo è testata confrontandola con l’intervento standard, in uso al momento dello studio. La costituzione di gruppi di controllo che ricevono esclusivamente il placebo è accettabile quando non esiste alcun intervento valido disponibile. Chi svolge attività di ricerca in psicologia adotta particolare attenzione nell’evitare un uso non corretto del placebo. Chi svolge attività di ricerca gestisce il rapporto con i collaboratori e i tecnici, garantendo il pieno rispetto della dignità personale, la valorizzazione delle competenze individuali e le esigenze di crescita e sviluppo professionale. 2.8) LIBERTÀ DI PARTECIPARE ALLA RICERCA Incentivi alla partecipazione (Articolo 7) Qualsiasi forma di coercizione andrebbe evitata: «Richiesta di ruolo»: i soggetti che partecipano ad uno studio su richiesta di un’autorità (es. un ricercatore o un docente) potrebbero sopportare anche il disagio senza lamentarsi. Non approfittare. Studenti universitari: lasciare una scelta anche laddove partecipare ad una ricerca permette di guadagnare crediti/punti. Evitare promesse irrealistiche. 2.9) DIVULGAZIONE DELLA PSICOLOGIA Diffusione della Ricerca Scientifica (Articolo 9) La presentazione delle ricerche nelle sedi scientifiche (congressi, riviste, pubblicazioni, ecc.) è guidata esclusivamente da motivi scientifici o divulgativi. Risultati e interpretazione sono esposti in modo chiaro ed esaustivo per favorire il confronto delle idee e dei metodi nell’ambito della comunità scientifica e per promuovere la diffusione della conoscenza nella società. Consentire la replicabilità dei propri lavori, una comunicazione scientifica accurata e dettagliata ed è disponibilità a fornire ogni informazione utile per lo svolgimento di meta-analisi o la riproduzione dei risultati. Non sono consentite fabbricazione di dati, falsificazione, plagio e auto-plagio (pubblicazione multipla della medesima ricerca con la riproduzione degli stessi risultati e alla pubblicazione multipla del medesimo lavoro con la riproduzione di parti consistenti del testo). Quando una stessa ricerca dà luogo a più pubblicazioni che ne espongono aspetti differenti, la relazione con le altre pubblicazioni è sempre esplicitata. I dati raccolti in altre ricerche non possono essere utilizzati senza citarne la fonte o senza il consenso di chi le ha condotte. L’utilizzo di strumenti e dati di ricerca per i quali è necessario il consenso di chi li ha prodotti è possibile solo dopo averne ottenuto il preventivo consenso. Nelle pubblicazioni è necessario indicare le fonti di finanziamento, nonché ogni tipo di supporto e aiuto ricevuto da istituzioni e singole persone. Doveroso citare le fonti originali e attribuire pieno riconoscimento ai lavori altrui, sia che essi siano serviti come ispirazione, sia che siano stati riportati in tutto o in parte, anche se modificati nella forma. Ciò vale anche nel caso si tratti di materiale non pubblicato oppure di materiale tratto da Internet. Coloro che hanno svolto la ricerca devono esplicitare il loro ruolo e la loro responsabilità riguardo ai dati raccolti. Le persone che hanno collaborato in modo sostanziale nelle varie fasi della ricerca (colleghi, tecnici o studenti) devono vedere riconosciuta la contitolarità del lavoro pubblicato o della presentazione congressuale. Anche le persone che hanno contribuito in modo non sostanziale, ma accertabile, devono essere esplicitamente menzionate nel testo o nei ringraziamenti. Ogni presentazione effettuata nelle sedi scientifiche deve avere un carattere di originalità. Nel caso si tratti di una ricerca già pubblicata o presentata ad un congresso, anche se solo parzialmente, tale fatto va dichiarato esplicitamente con gli opportuni riferimenti. Chi svolge attività di ricerca in psicologia deve essere disponibile, per un periodo di almeno tre anni dalla pubblicazione dei risultati, a mostrare i dati grezzi, ancorché anonimi, a chi ne faccia richiesta per ulteriori verifiche. In ogni comunicazione scientifica deve essere evitato un uso del linguaggio che manifesti forme di discriminazione a danno di qualsivoglia gruppo o minoranza. Nelle comunicazioni in ambito scientifico oppure in contesti finalizzati alla divulgazione o all’intrattenimento, chi svolge attività di ricerca in psicologia specifica in modo chiaro le proprie competenze e il proprio ruolo professionale. Nella comunicazione mediatica chi svolge attività di ricerca in psicologia si astiene dall'esprimere valutazioni su temi di cui non è competente ed evita considerazioni sommarie e banalizzazioni della ricerca psicologica che possano minacciare la reputazione delle persone e della disciplina. Mentre le norme relative alla divulgazione scientifica sono, in generale, accettate, condivide e regolamentate all’unisono a livello mondiale, il controllo relativo alla divulgazione mediatica è relativamente recente. Rischi: diffondere informazioni approssimative, mal documentate, difficili da interpretare per un pubblico non esperto; dare giudizi e valutazioni specifici senza avere conoscenza diretta; danneggiare l’immagine della psicologia stessa; 2.10) INSEGNAMENTO Ricerca, insegnamento e valutazione (Articolo 10) Chi svolge attività di ricerca o supervisione in psicologia: promuove la conoscenza dei principi etici della ricerca mediante specifiche attività seminariali e di aggiornamento; trasmette i principi previsti dal presente Codice Etico e vigila sul loro rispetto; non permette un uso autonomo di strumenti psicologici (test, questionari, ecc.) da parte delle persone in formazione prima che queste abbiano raggiunto l’adeguata preparazione; è garante della preparazione dei collaboratori in formazione (studenti e dottorandi) e si accerta della correttezza con cui questi si qualificano all'esterno. è disponibile a illustrare, spiegare e discutere tutti gli aspetti teorici e metodologici dello studio (offerto agli studenti e ai cittadini come importante occasione formativa); si ispira esclusivamente a principi di merito e qualità scientifica. Evita comportamenti finalizzati a ottenere indebiti vantaggi per sé o per il proprio gruppo di lavoro (ad esempio, pretendere citazioni ingiustificate oppure bloccare pubblicazioni che riportano risultati o ipotesi contrastanti con le proprie teorie); rispetta il lavoro altrui, anche in caso di giudizi negativi, adottando un approccio valutativo finalizzato al miglioramento del prodotto scientifico. Finché la formazione non è terminata, lo studente è sotto supervisione del docente/ricercatore/psicologo esperto. 2.11) RICERCA CON GLI ANIMALI La ricerca con gli animali (Articolo 8) Chi svolge attività di ricerca utilizzando animali a fini scientifici: è responsabile non solo del trattamento che essi ricevono durante gli esperimenti, del loro benessere in termini di salute e confort nell'intero corso della ricerca, nel pieno rispetto della normativa nazionale e internazionale; deve assicurarsi del benessere dell’animale, anche al di fuori della prestazione sperimentale (aspetti alimentari, igienici, abitativi e sociali); si assicura che coloro che a qualunque titolo collaborano alla ricerca con animali abbiano competenza ed esperienza adeguate, sia che si occupino delle attività di pulizia, nutrimento, e soppressione, sia che svolgano funzioni più immediatamente connesse alla ricerca. La normativa di riferimento è rappresentata dal Decreto Legislativo n. 26 del 14/03/2014 di attuazione della Direttiva 2010/63/UE del Parlamento Europeo e del Consiglio del 22 settembre 2010 sulla protezione degli animali utilizzati a fini scientifici. I metodi e le procedure sperimentali: devono prevedere il rispetto del principio della massima riduzione possibile del numero di animali impiegati mantenendo la previsione di risultati affidabili. che comportano interventi chirurgici su animali o la presentazione di stimoli dolorosi vanno ridotte al minimo e consentite solo quando siano giustificate dalla preminenza degli obiettivi della ricerca e non siano disponibili altre procedure alternative. devono ridurre al minimo l’entità della stimolazione dolorosa o di altri stimoli che possono attivare intensi stati emozionali negativi o provocare situazioni di forte disagio e stress. VARIABILI (APPUNTI LEZIONI ANNI PRECEDENTI) X = {x1, x2, x3, …, xn} Definiamo una variabile di solito con una lettera maiuscola (X). Una variabile è un concetto che vogliamo misurare che di solito è direttamente osservabile o osservabile in maniera diretta. La indichiamo con la lettera maiuscola X per definire un concetto che vogliamo misurare, come ad esempio l’altezza delle persone e poi data una variabile abbiamo le sue modalità o determinazioni, che indichiamo con la stessa lettera che utilizzo per la variabile, però minuscola. A fianco ad ogni lettera c’è un PEDICE che identifica l’unità statistica, 1, 2, 3, …, n che rappresenta il numero totale delle osservazioni. ESEMPIO: altezza delle persone (QUANTITATIVA) X = {170, 160, 172, 177, 190} n (numero totale delle osservazioni) = 5 x1= 170; x2= 160; x3= 172; x4= 177; X5= 190 ALTRO ESEMPIO: sesso delle persone (QUALITATIVA) Y = {M,M,M,F,F} n=5 y1=M; y2=M; y3=M; y4=F; y5=F VARIABILI si distinguono in QUANTITATIVE e QUALITATIVE. 1) VARIABILI QUALITATIVE sono delle variabili le cui modalità sono delle espressioni verbali. Ad esempio abbiamo: sesso; titolo di studio; colore degli occhi; colore dei capelli ecc.. Si distinguono in: 1. NOMINALI all’interno di queste variabili le modalità non esprimono nessun ordinamento, ma consentono di classificare le unità statistiche in gruppi, che non possiamo riordinare rispetto alla caratteristica che osserviamo. Ad esempio: prendiamo es. precedente maschi e femmine. Possiamo dividere il gruppo in due, quindi ho due gruppi di unità statistiche: 3 maschi e 2 femmine. Non si può effettuare un ordinamento, ma possiamo effettuare una ricodifica, come ad esempio: Y = {1,1,1,2,2,} dove 1 = maschio 2 = femmina Quindi: per quanto riguarda le variabili qualitative nominali, si prende in prestito dalla matematica la parte simbolica, ovvero i simboli, che permettono di utilizzare ad esempio, al posto dell’espressione verbale maschio e femmina, la codifica matematica, ovvero utilizziamo il numero 1 e 2 per indicare rispettivamente maschio e femmina. Possiamo utilizzare come operazioni matematiche l’uguale (=) e il diverso (≠). Possiamo confrontare le unità statistiche e dire se appartengono o meno allo stesso gruppo, di maschi o di femmine. 2. ORDINALI le modalità delle variabili qualitative ordinali non solo esprimono delle categorie di gruppi, ma tra i gruppi si può effettuare un ordinamento vero e proprio. ESEMPIO: titolo di studio. D = diploma; L = laurea; M = master Z = {D, D, L, L, L, M} n = 6 Anche in questo caso posso ricodificare e posso prendere come simboli sempre i numeri e considero il numero più basso corrispondente al titolo di studio più basso, e quello più alto al titolo di studio più alto. Quindi dirò: 1 = D; 2 = L; 3 = M In questo modo effettuando la decodifica avrò: Z = {1, 1, 2, 2, 2, 3} La differenza qual è? Nelle variabili qualitative ordinali posso verificare se due persone hanno o meno ( = o ≠) lo stesso titolo di studio, ma posso anche effettuare degli ordinamenti utilizzando i seguenti simboli: (> o o L > D oppure codificato 3 > 2 > 1. DOMANDA 1: Si può calcolare il titolo di studio medio? NO, perché non è quantitativo. Le uniche cose che posso fare sono l’ordinamento [ ( = o ≠) , (> o 20); in più è possibile definire una unità di misura per cui è possibile dire che tra 30 e 20 c’è una differenza di 10 (30- 20). Non ha uno zero assoluto, per cui non è possibile dire se un valore sia in relazione di multiplo o di rapporto rispetto ad un altro. Non è possibile stabilire se un caso A possiede la proprietà misurata in quantità doppia rispetto al caso B. Se lo zero non coincide con l’assenza di quella proprietà, esso è arbitrario (non reale). Nella scala ad intervalli la posizione dello zero è arbitraria, non corrisponde all’intensità nulla della proprietà misurata e cambia nel passare da una scala ad un’altra, entrambe misura dello stesso sistema empirico. Esempio di scala a intervalli: Temperatura (°C oppure °F, in cui lo 0 non indica assenza di temperatura!) QI (una persona con QI di 120 non ha un’intelligenza doppia di una con QI pari a 60). 4) SCALA A RAPPORTI La scala a rapporti differisce da quella a intervalli per il diverso significato che lo zero possiede: zero relativo (scala ad intervalli) VS zero assoluto (scala a rapporti). Lo zero rappresenta l’elemento dotato di intensità nulla rispetto alla proprietà misurata. Regola: le differenze e i rapporti tra i numeri riflettono le differenze e i rapporti tra le intensità della proprietà misurata. SCALE: ULTERIORE DISTINZIONE CONFRONTI TRA SCALE Passando dalla scala nominale a quelle superiori guadagniamo via via maggiori informazioni sui dati, sino a raggiungere il massimo livello che possiamo avere quando misuriamo un evento o oggetto su una scala a rapporti. Trasformazioni permissibili Modi in cui possiamo modificare l’assegnazione dei valori numerici a eventi o oggetti senza distorcere la scala. Passando dalla scala nominale a quelle superiori, possiamo effettuare sempre meno trasformazioni, sino a raggiungere il minimo di trasformazione possibile nella scala a rapporti (possiamo solo moltiplicarla per una costante positiva). MISURA E STATISTICHE La scala di misura di una variabile determina il tipo di statistica che può essere correttamente applicata ai dati? Solo se i dati sono misurati su scale a intervalli e/o a rapporti? Oppure anche su altre modalità di scale? STATISTICA lavora su un campione poiché lavorare sulla popolazione costa molto in termini di denaro e tempo. STATISTICA INFERENZIALE prendere dati da un campione (statistiche campionarie) e generalizzarli. Nella statistica inferenziale ci sono diversi approcci: 1) Statistica parametrica Studia una popolazione facendo delle assunzioni sulla legge di probabilità che la caratterizza. In particolare, che essa si distribuisca normalmente e che ogni gruppo presenti la stessa varianza (Coefficiente di correlazione di Pearson, t-test, Analisi della varianza o ANOVA). SIMBOLI: 2 Popolazione (statistica descrittiva) µ - σ - Campione – stimatore – formula (statistica campionaria) (media) - (varianza) - Utilizzo le statistiche che già conosco e ottengo delle stime: STIME = ; = ; = 2) Statistiche non-parametriche Le assunzioni sulla popolazione sono meno stringenti, o non necessariamente devono essere rispettate (Test basati sui ranghi dei dati o sul segno della differenza tra soggetti). AFFIDABILITÀ E VALIDITÀ Uno strumento di misura (ad es. un test psicologico) deve essere: Affidabile o Attendibile Se uno strumento è affidabile, in misure ripetute darà sempre lo stesso risultato. Deve essere costante, cioè persone diverse, in situazioni diverse e con strumenti diversi devono poter misurare quello stesso oggetto. Valida Deve misurare esattamente quello che si propone di misurare. Es. metro = strumento valido per misurare le persone. VALIDITÀ NELLE MISURAZIONI VALIDITÀ DI COSTRUTTO Il test misura il costrutto teorico che si propone di misurare e non altro. Es. Un test di personalità non deve misurare la depressione. Il test non misura costrutti che non sono collegati teoricamente a quello misurato. Es. Un test di attitudine musicale non dovrebbe richiedere un’eccessiva abilità di lettura Il test dev’essere utile per predire i risultati relativi al concetto teorico che sta misurando. Es. Un test di personalità dovrebbe predire il più adatto ad una particolare carica lavorativa (si alla selezione in ambito militare basata su colloqui ma anche test di personalità) In questo tipo di validità rientrano: Validità esteriore o di facciata: l’apparenza di un test; Validità di contenuto: misura tutti i comportamenti che rappresentano il concetto teorico misurato. Es. Test d’intelligenza che, oltre all’abilità spaziale, deve misurare anche abilità verbale, abilità matematiche e conoscenze generali. VALIDITÀ DI CRITERIO Possibilità di verificare la validità di un test attraverso un criterio esterno (es. somiglianza o predittività). Si valuta come: Validità concorrente: un test valido dev’essere in stretta relazione con altre misure dello stesso costrutto teorico oppure con comportamenti legati ad esso. Es. Test d’intelligenza correlato con altre misure d’intelligenza oppure con comportamenti legati all’intelligenza, come il rendimento scolastico. Validità discriminante: un test valido non dev’essere in stretta relazione con misure di altri costrutti teorici. VALIDITÀ PREDITTIVA La capacità di un test di predire un comportamento futuro. Es. Un test d’intelligenza predice il successo scolastico futuro? Un test per la selezione del personale predice il successo lavorativo in quel determinato ruolo? VALIDITÀ CORRELATIVA Si mette a confronto un nuovo strumento con uno strumento simile già esistente. VARIABILITÀ ED ERRORE Tutte le ricerche hanno a che fare con la variabilità. Variabili indipendenti e dipendenti variano. Il ricercatore ha l’obiettivo di trovare una relazione tra variabile indipendente e variabile dipendente. Di capire, cioè, se e come varia la variabile dipendente al variare della variabile indipendente (es. il voto d’esame in relazione alle ore di studio). Variabilità * della variabile dipendente: Varianza spiegata dai cambiamenti nella variabile indipendente; Varianza d’errore o errore, la porzione di variabilità che non può essere attribuita alla variabile indipendente, ma ad elementi che non sono stati considerati o non sono controllabili. * La variabilità viene tradizionalmente misurata attraverso il calcolo della varianza (σ²). Esempio: Peso: diminuisce durante la notte, aumenta temporaneamente quando si mangiano cibi salati e durante le vacanze. Variabili indipendenti che spiegano la variabilità del peso: perdita di liquidi durante la notte, sete provocata da cibi salati, iperalimentazione. Errore di misura Quando effettuiamo delle misurazioni si possono commettere degli errori, come: Errore sistematico: variabilità associata ad un malfunzionamento nello strumento di misurazione o ad un errore volontario o involontario dello sperimentatore. È un errore che si ripete in maniera costante in tutte le misurazioni, non si annulla mai. Es. bilancia tarata male (-3kg) Mi peso ogni mattina, anche indossando il pigiama, rimanendo in un certo modo sulla bilancia. Mai desiderato nella ricerca. Tuttavia, se rimane lo stesso per tutta la ricerca (es. uguale nei gruppi coinvolti o nelle condizioni sperimentali) non è considerato troppo grave (i risultati non sarebbero influenzati da nessun errore particolare). Errore casuale (o varianza d’errore): variabilità non associata ad alcuna variabile indipendente conosciuta. Parte di esso può essere legato a: Posiziono i piedi in modo diverso sulla bilancia, come mi appoggio, se ho bevuto da poco un bicchiere d’acqua, ecc… È un errore che è soggetto a oscillazioni che seguono una certa distribuzione di probabilità (una legge di probabilità governa l’errore). L’errore non è costante, ma oscilla o verso l’alto o verso il basso. Si può tenere sotto controllo. Il valore atteso (media aritmetica) dell’errore casuale è pari a 0. Grave problema. Riduce la precisione con cui sono valutati gli effetti della variabile indipendente. Minaccia l’affidabilità (attendibilità) delle misurazioni. AFFIDABILITÀ (O ATTENDIBILITÀ) Affidabilità test-retest Lo stesso strumento di misura porta agli stessi risultati in occasioni differenti? Un buon test da sempre risultati simili anche in occasioni differenti. Coerenza interna Gli item di un test misurano la stessa cosa? Affidabilità split-half: dividere gli item del test in due gruppi separati. Si calcola la correlazione tra i punteggi delle due metà. Se il test è buono, le due metà mostreranno tra loro una correlazione elevata. STRUMENTI PRATICI Esperimenti sulla percezione gli stimoli sperimentali proposti devono coprire tutta la gamma di variazione possibile (esplorare un sistema sino ai suoi limiti) stimoli sperimentali sufficientemente ravvicinati (in tal modo si osservano effetti potenzialmente interessanti legati a stadi intermedi dello stimolo) presentare almeno sette stimoli (in modo da escludere l’effetto della memorizzazione degli stimoli); Intervallare le variabili? Intervalli regolari oppure variabili? Si potrebbe mantenere costante il rapporto tra ciascuno stimolo e quello precedente. STATISTICA INFERENZIALE 1 INTRODUZIONE La statistica, disciplina che ci offre gli strumenti per organizzare, riassumere e analizzare i dati ottenuti attraverso delle misurazioni, si divide in due grandi aree: statistica descrittiva e inferenziale: La prima si utilizza per la sintesi e la presentazione dei dati; la seconda ha lo scopo di inferire le caratteristiche di un’intera popolazione a partire da dati raccolti su un suo sottoinsieme, attraverso il test di ipotesi e la possibilità di effettuare previsioni. VARIABILI vs COSTANTI Al fine di indagare un fenomeno d’indagine o di interesse, il ricercatore procede raccogliendo dei dati relativi ai soggetti, o partecipanti (in linea con la terminologia preferita dall’American Psychological Association) alla ricerca. I dati descrivono un evento e variano da individuo a individuo. Si introduce il concetto di variabile, contrapposto a quello di costante. Potremmo, ad esempio, essere interessati a studiare i risultati all’esame di Metodologia per la Ricerca in Psicologia di uno specifico anno accademico. Se consideriamo l’essere studente universitario, l’appartenere al percorso di studi umanistico-sociale, l’aver sostenuto l’esame, parliamo di caratteristiche comuni a tutti. Quando una caratteristica ha questo tipo di proprietà si definisceC COSTANTE una proprietà descritta da un solo attributo uguale per tutti i partecipanti alla ricerca. Se consideriamo informazioni quali il genere, l’età, il voto all’esame, vediamo che gli studenti si differenziano: possono essere maschi, femmine o altro, essere più giovani o più adulti, e il voto all’esame MRP varierà da 18 a 30. Caratteristiche di questo tipo sono definite VARIABILI, in quanto assumono, tra i partecipanti, valori diversi. L’interesse del ricercatore è quello di prendere in esame queste proprietà che variano e la statistica è lo strumento che consente di trarre delle informazioni a partire proprio da questa variabilità. Due sono le caratteristiche fondamentali di una variabile: ESAUSTIVITÀ: deve includere tutti i possibili attributi che definiscono la proprietà in questione. In altri termini, deve permettere di classificare tutti i casi in esame. Esempio: la variabile Stato civile che includa le alternative nubile/celibe; coniugato/a; separato-divorziato/a non è esaustiva, in quanto manca l’alternativa vedovo/a. Includendo questa categoria, si può affermare che la variabile sia esaustiva ESCLUSIVITÀ: gli attributi di una variabile devono essere mutuamente esclusivi, ovvero un caso non deve poter essere attribuito a più di una categoria ma deve essere assegnato in modo esclusivo ad uno degli attributi della variabile. Esempio: nel caso della variabile Stato civile, avremo difficoltà nel collocare una persona vedova che si è risposata, dal momento che Coniugato e Vedovo le si adattano ugualmente bene. Per rendere la variabile esclusiva, occorre aggiungere un’ulteriore specificazione per definire le differenti alternative della variabile. VARIABILE QUALITATIVA variabile definita da categorie (es. Sesso, caratterizzata dagli attributi Maschio, Femmina). VARIABILE QUANTITATIVA definita da valori che esprimono, in termini quantitativi, la proprietà definita da quella variabile (es. Età, caratterizzata dagli anni in numeri); A sua volta suddivisa in DISCRETA: può assumere solo valori interi; CONTINUA: assume valori continui, ovvero l’unità di misura può essere suddivisa in unità sempre più piccole ed avere valori con decimali; Esercizio: Un ricercatore vuole misurare la quantità di pioggia caduta in un anno. Può considerare due alternative: 1. numero di giorni di pioggia in un anno; 2. quantità di acqua caduta in un anno; Quale, tra le due, è una variabile discreta? Qual è continua? POPOLAZIONE E CAMPIONE Nella ricerca in Psicologia, si cerca di trovare prove, a sostegno o meno, di una teoria, studiando il comportamento di un gruppo di soggetti, o partecipanti. Possiamo, ad esempio, essere interessati a studiare la variabile risultati all’esame di Metodologia per la Ricerca in Psicologia di uno specifico anno accademico. Per conoscere la variabile statistica (in questo caso, risultati all’esame, o qualsiasi variabile Y), sarà necessario raccogliere dei dati e calcolare dei parametri (es: Media, Varianza). Possiamo decidere di far partecipare all’esperimento tutti gli studenti che hanno sostenuto l’esame in quell’anno (a partire dalla lista di studenti iscritti in quell’anno), oppure di sceglierne un gruppo. Se partecipano tutti gli studenti, la nostra ricerca è condotta sull’intera popolazione. In altre parole, la popolazione comprende la totalità delle persone o eventi oggetto di studio, che hanno tutti la caratteristica oggetto della ricerca, ad esempio aver sostenuto l’esame di MRP. Condurre un’indagine sull’intera popolazione produce una ricerca indubbiamente accurata, ma richiede tempi lunghi e costi spesso insostenibili dal ricercatore. Per tali motivi, spesso le analisi statistiche di Y si basano su dati incompleti. Risulta, infatti, più economico lavorare su un gruppo o su una parte della popolazione che vogliamo studiare. In più, talvolta è praticamente impossibile condurre una ricerca su tutta la popolazione perché questa è estremamente numerosa o infinita (es. il numero di stelle). Se, per la ricerca, viene utilizzata solo una parte delle persone con la caratteristica presa in esame, il gruppo esaminato viene definito campione. In altre parole, il campione è un sottoinsieme della popolazione alla quale siamo interessati, composto da n partecipanti (che definiamo ampiezza campionaria), tutti con la caratteristica oggetto della ricerca. Se lo scopo del ricercatore è quello di fare delle assunzioni sull’intera popolazione, è necessario che il campione sia rappresentativo della popolazione stessa, cioè che coloro che partecipano alla ricerca si comportino come si comporterebbe l’intera popolazione. Infatti, per le regole della probabilità, i dati di un campione casuale tendono a mantenere le stesse caratteristiche di quelli della popolazione, a meno di un errore campionario. Un modo per ottenere un campione rappresentativo della popolazione è quello di selezionare i partecipanti in maniera casuale (o attraverso campionamento casuale semplice). La selezione casuale ha due proprietà fondamentali: tutti i membri della popolazione devono avere la stessa probabilità di essere selezionati per fare parte per il campione; la selezione di un elemento non deve influenzare la selezione dell’altro (ci deve essere indipendenza tra le estrazioni). L’aver estratto un soggetto dalla popolazione non deve modificare la probabilità che gli altri appartenenti alla popolazione entrino a far parte del campione. Tornando all’esempio degli studenti MRP, la scelta casuale di trenta studenti che hanno sostenuto l’esame di MRP, costituirà un campione casuale di trenta partecipanti estratto tra tutti i possibili gruppi di trenta studenti che si possono ottenere a partire dalla popolazione di riferimento. Effettivamente, formare campioni utilizzando questi criteri è estremamente difficile o, addirittura, impossibile a fronte di popolazioni infinite. Così, il ricercatore da un lato deve rinunciare al rigore della scelta puramente casuale ma deve, tuttavia, evitare di introdurre nel campionamento distorsioni sistematiche che ne indeboliscano la rappresentatività. CAMPIONI Sulla base di quanto emerso, si possono distinguere due tipologie di campione: CAMPIONE PROBABILISTICO la probabilità, da parte di ciascuna unità appartenente alla popolazione, di essere inclusa nel campione, è nota a priori *; * Si vedano le caratteristiche di un campione rappresentativo della popolazione, menzionate nella slide 13. CAMPIONE NON PROBABILISTICO la selezione delle unità da includere nel campione è affidata al giudizio del ricercatore, il quale tenta di estrarre un campione C rappresentativo della popolazione P, in base a criteri più o meno personali. Si tratta di una tipologia di campione in cui viene introdotta, in qualche modo, una distorsione. CAMPIONE PROBABILISTICO Si tratta di metodi di campionamento che presuppongono la conoscenza di alcune delle caratteristiche della popolazione: ▪ CAMPIONAMENTO CASUALE SEMPLICE (CCS): da una popolazione di N elementi si seleziona un campione di numerosità n, in modo che ogni possibile campione abbia uguale probabilità di essere estratto; CAMPIONAMENTO STRATIFICATO: si suddivide la popolazione in sottogruppi omogenei e mutualmente esclusivi, detti strati, e da ciascuno si estrae un campione casuale. Esempio: si suddividono gli studenti in base all’età, e si estrae un campione per ogni fascia d’età considerata. ▪ CAMPIONAMENTO SISTEMATICO: si inizia il campionamento da un punto casuale e poi si prosegue selezionando un elemento ogni k elementi successivi. Esempio: in uno studio sul traffico in autostrada si decide di selezionare un automobilista ogni venti macchine transitate da un determinato casello autostradale ▪ CAMPIONAMENTO A GRAPPOLO (o cluster). Nel campionamento a grappolo si seleziona un campione casuale di g grappoli dai G grappoli della popolazione e tutte le unità ad esso appartenenti saranno oggetto di rilevazione. Esempio: una città si suddivide in settori, si campionano casualmente i settori. Su di essi si svolge un’indagine sui servizi per la prima infanzia. A sua volta, il campionamento a grappoli (o cluster) può essere: - A DUE O PIÙ STADI. Nel primo stadio di campionamento vengono selezionati g grappoli dai G grappoli della popolazione; nel secondo stadio si procede alla selezione di un campione casuale all’interno dei grappoli. CAMPIONE NON PROBABILISTICO Rappresentano la modalità prevalente nelle ricerche di mercato, Internet surveys e nei sondaggi di opinione, per i quali la tempestività è la dimensione più ricercata. Non consentono inferenza sulle proprietà statistiche dei metodi di stima utilizzati. CAMPIONAMENTO RAGIONATO. Le unità sono scelte tra quelle che si ritiene siamo più connesse al fenomeno oggetto di studio. CAMPIONAMENTO PER QUOTE. La popolazione viene divisa in strati (o sottogruppi) come nel campionamento stratificato, ma la scelta delle unità non avviene in modo casuale. TESTIMONI PRIVILEGIATI. Le unità sono selezionate per le loro caratteristiche, posizione professionale, in generale per le loro conoscenze riguardo il fenomeno e le variabili oggetto di studio. ESEMPIO: Se la selezione di un campione avviene scegliendo a caso i nomi dall’elenco telefonico di una città, sembra rispettato il criterio di scelta casuale. In realtà il campione presenta una distorsione, in quanto tutti coloro che non hanno il telefono o che per qualche motivo non risultano in elenco saranno esclusi automaticamente. Una distorsione viene introdotta anche quando si utilizza un campione di convenienza, ovvero si svolge l’indagine sui primi n elementi della popolazione disponibili. Ritornando all’esempio lo studio sugli esiti dell’esame di MRP, se si considerasse gli studenti del primo appello della sessione invernale, esso non sarebbe un campione rappresentativo della popolazione. Piuttosto, potrebbe darsi che sia costituito da studenti che hanno frequentato il corso e che siano particolarmente motivati. PROBABILITÀ Il concetto di probabilità è estremamente comune nella vita di tutti i giorni. «È improbabile che oggi piova» «Alla partita di domani le squadre hanno la stessa probabilità di vincere» «La probabilità di superare l’esame è massima, se si studia» Cos’hanno in comune tutti questi esempi? In tutti i casi, il concetto di probabilità si manifesta ogni volta che si è di fronte a una situazione di incertezza. I casi, cioè, in cui il risultato dell’evento in questione non è sicuro. Nel caso del lancio di una moneta non possiamo dire con certezza se il risultato sarà testa o croce. Possiamo solo fare una previsione, che sarà confermata o meno solo una volta effettuato il lancio. Tutto ciò viene definito in termini matematici dalla TEORIA DELLA PROBABILITÀ che ci consente di quantificare il grado di incertezza. VARIABILE CASUALE (o ALEATORIA) Una variabile rilevata su un campione può essere definita variabile casuale (o aleatoria). Una variabile casuale X è una funzione definita sullo spazio campionario che associa ad ogni evento ∈ un unico numero reale. Si effettuino, ad esempio, due lanci di una moneta: S = {TT, CC, TC, CT} S è lo spazio campionario: l’insieme di tutti gli eventi possibili dell’esperimento (testa/testa; croce/croce; testa/croce; croce/testa). Ad ogni punto dello spazio campionario possiamo associare un numero reale che rappresenti il numero delle volte che esce T, secondo la seguente tabella, ossia X (TT) = 2 X(CC) = 0 X(TC) = 1 X(CT) = 1 X è una variabile aleatoria. Si noti che, all’interno dello spazio campionario è comunque possibile definire altre variabili aleatorie: il quadrato del numero delle teste , oppure il numero delle teste meno il numero delle croci. Una distribuzione di probabilità è data dall’insieme delle probabilità associate ai possibili risultati di un esperimento (o, nel caso del nostro esempio, ai possibili risultati del lancio della moneta). In particolare: - si definisce distribuzione di probabilità la probabilità associata ai possibili valori di una variabile casuale discreta. - si definisce funzione di densità di probabilità la probabilità associata ai possibili valori di una variabile casuale continua. Le Variabili Casuali (e le distribuzioni di probabilità associate) rappresentano un modello di comportamento della popolazione. È possibile costruire una distribuzione di probabilità empiricamente, ovvero svolgendo un esperimento e registrandone i risultati, oppure costruire una distribuzione a livello teorico, in base alle regole della probabilità. Le distribuzioni teoriche di probabilità, utilizzate in statistica, sono molte ed hanno tutte in comune il fatto che non sono frutto di dati realmente raccolti (come accade quando costruiamo una distribuzione di frequenza) ma sono dati generati da una teoria matematica. Le distribuzioni teoriche di probabilità sono fondamentali per la statistica inferenziale, poiché è ad esse che si fa riferimento per trarre delle inferenze dalle nostre ipotesi di ricerca. DISTRIBUZIONE BINOMIALE Una variabile nominale è detta DICOTOMICA quando è definita da due sole categorie, due alternative che si escludono a vicenda (es. Sesso, lancio di una moneta, risposta ad una domanda vero/falso). Le variabili sopra sono naturalmente dicotomiche, ma è possibile dicotomizzare anche delle variabili che originariamente non lo sarebbero (nel caso del voto all’esame di MRP, possiamo essere interessati al superamento/non superamento, attribuendo alla prima categoria coloro che hanno raggiunto un punteggio superiore a 18, alla seconda coloro che hanno un punteggio inferiore a 18; nel caso di una domanda con più alternative di risposta di cui solo una corretta, la variabile su scala nominale con 4 categorie può essere dicotomizzata in corretta/scorretta). I dati che risultano dalla misurazione di una variabile dicotomica sono detti BINOMIALI, dati che hanno due nomi (testa/croce; superato/non superato; corretto/scorretto). Quando consideriamo un insieme di eventi di tipo binomiale (es. più lanci di una moneta, più domande ad un test, più prove d’esame) possiamo costruire una distribuzione di probabilità binomiale. Com’è possibile stabilire teoricamente la probabilità associata ai possibili risultati di un esperimento? In termini probabilistici, possiamo dire che i possibili risultati sono dati dal numero di eventi favorevoli o successi ( ) rispetto al numero di eventi ( ) che definiscono la distribuzione. Dobbiamo, in sostanza, conoscere la probabilità di successo ( ) per ciascun singolo evento, il numero di eventi n e calcolare la probabilità facendo variare da 0 a. Per velocizzare il calcolo di successi su prove, si utilizza l’equazione che esprime la funzione di probabilità binomiale Determinare la probabilità che su 12 lanci di una moneta buona si ottengano esattamente 8 teste. Si tratta di un esperimento di Bernoulli in cui il “successo” coincide con “esce Testa”; quindi: DISTRIBUZIONE NORMALE Le variabili con cui spesso abbiamo a che fare sono di tipo continuo. La più importante distribuzione continua è la distribuzione normale. Il termine normale deriva dalla sua ampia diffusione. Molti fenomeni fisici (es. il peso, l’altezza) e psicologici (es. il quoziente intellettivo o QI) mostrano questo tipo di distribuzione. La distribuzione normale è una distribuzione teorica, definita anche curva a campana (data la sua forma) o gaussiana (dal nome del matematico Gauss, che l’ha studiata). La distribuzione normale è nota anche come curva degli errori. Eseguendo una serie di misurazioni ripetute, gli errori accidentali ad esse attribuiti tendono a distribuirsi anch’essi normalmente. La funzione che permette di rappresentare e descrivere la distribuzione normale è la seguente Per rappresentarla si può stimare il valore di (il valore dell’ordinata o altezza della curva) per ciascun valore di (il valore dell’ascissa). Se, nella formula, sostituiamo con il valore 3.14 e a il valore 2.72, abbiamo tre incognite da definire: il valore di , che corrisponde al singolo punteggio e due parametri, e , rispettivamente la media e la deviazione standard. La forma della distribuzione si modifica sulla base di questi due parametri, dando origine ad una famiglia di distribuzioni. Come per le distribuzioni con variabili discrete, l’area totale al di sotto della curva (da − ∞ a + ∞) è uguale a 1, ossia alla probabilità totale. Per ciascun valore di , è dunque possibile calcolarne la probabilità di verificarsi, definendo l’intervallo sino al valore. CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE 1) Sono SIMMETRICHE rispetto alla media in quanto la funzione assume lo stesso valore per i valori di che si collocano ad una stessa distanza al di sopra e al di sotto della media. Lascia cioè metà della distribuzione a destra e metà a sinistra. Questa caratteristica facilita i calcoli: sappiamo, infatti che le aree tra − ∞ e e quella tra e + ∞ sono entrambe uguali a 0.50, la metà dell’intera area che è uguale a 1; 2) Ha una FORMA A CAMPANA, con una maggiore concentrazione dei casi intorno alla media ed una diminuzione nelle code. La curva è crescente da − ∞ a e decrescente da e + ∞. Presenta due punti di flesso in corrispondenza di più o meno una deviazione standard dalla media ( ± ). La funzione assume il suo punto di massimo in corrispondenza della media, che risulta essere il valore più probabile e con la frequenza più elevata. Per questo motivo la media coincide con la moda e, essendo la distribuzione simmetrica rispetto a , la media coincide anche con la mediana. Per tali motivi, la distribuzione normale è detta unimodale. La curva, inoltre, è asintotica, ovvero le code tendono all’infinito senza intersecare l’asse delle ascisse. Infine, qualsiasi siano i parametri, l’area della porzione di curva delimitata dalla media e un’ordinata espressa in termini di deviazione standard è costante: tra meno una e più una deviazione standard si trova il 68,26% dei casi; tra meno due e più due deviazioni standard il 95,46%, tra meno tre e più tre deviazioni standard, circa il 99,73%. Sono due i parametri che governano la distribuzione normale e sono: 1) µ = mi (media) 2) = sigma (deviazione standard) Con questi due possiamo cambiare la forma della distribuzione. DISTRIBUZIONI CAMPIONARIE: ESEMPIO Si considera la “popolazione” di N = 5 fatture rilasciate da software house e si vuole stimare il fatturato medio utilizzando un campione casuale semplice di n = 2 fatture, scelte a caso eseguendo due estrazioni consecutive sempre delle stesse cinque fatture. Quindi il valore esatto del fatturato (parametro da stimare) è: = 230/5 = 46 € è la media della popolazione. Ipotiziamo di estrarre dalla popolazione N = 5 di fatture tutti i possibili campioni di dimensione n = 2, utilizzando un campionamento casuale semplice (CCS) Si noti come la dimensione della popolazione sia indicata con la lettera maiuscola (M), mentre la dimensione campionaria con la minuscola (n). In modo simile, i parametri della popolazione vengono indicati con le lettere dell’alfabeto greco ( per la media e per la deviazione standard). STATISTICHE CAMPIONARIE E DISTRIBUZIONI CAMPIONARIE Possiamo pensare che, estraendo da una popolazione un campione con un’ampiezza sufficientemente elevata la sua media non si discosti molto da quella della popolazione. In altre parole, la statistica campionaria rappresenta una buona approssimazione (o stima) del parametro della popolazione oppure è una stima (stima fa riferimento al valore numerico), ossia quello che io immagino sia, approssimativamente, il valore nella popolazione. Se il campione si distribuisce normalmente → la popolazione si distribuisce normalmente → anche la media della popolazione si distribuisce normalmente (così come qualsiasi combinazione lineare). Ciò permette, ipoteticamente, di estendere quei valori campionari alla popolazione. Gli insiemi degli stimatori vengono chiamati STATISTICHE CAMPIONARIE e sono: MEDIA CAMPIONARIA ecc. (continua slide) Gli stimatori sono quindi una variabile casuale e il loro valore dipende dal campione estratto. La distribuzione di probabilità di uno stimatore è detta distribuzione campionaria. PROPRIETÀ DEGLI STIMATORI (VAR = variabilità) FORMA DELLA DISTRIBUZIONE La distribuzione campionaria ottenuta attraverso il calcolo empirico presenta una forma che si avvicina alla normale. Possiamo dedurre che, indipendentemente dalla forma originaria della distribuzione della popolazione dalla quale i campioni sono stati estratti, la distribuzione campionaria tende alla normale. In particolare, quanto più i campioni sono ampi, tanto più la distribuzione si avvicina alla normale e può essere considerata tale per >. Questo è quanto asserisce il TEOREMA DEL LIMITE CENTRALE Indipendentemente dalla forma della distribuzione della popolazione, una distribuzione campionaria della media tende alla normalità all’aumentare di , e raggiunge la forma normale per >. Nel campionamento casuale da una popolazione con media e scarto quadratico medio , la distribuzione campionaria di : è approssimativamente Normale per > 30; presenta media ( ) uguale a ; presenta errore standard che dipende da ed è uguale a = / L’errore standard esprime la media delle deviazioni standard di ciascun campione dalla media della popolazione, ovvero l’insieme degli scarti (o distorsioni o errori) delle medie campionarie rispetto al valore esatto della popolazione. (vedere meglio sugli appunti parte verde) Per la teoria dei campioni, la varianza non si chiama più così, ma prende il nome di errore standard. Se, oltre alla deviazione standard della popolazione non conosciamo neppure la media della popolazione dobbiamo far riferimento alla media campionaria per avere indicazioni su tale parametro. In questo caso, l’errore standard esprime quanto la statistica costituisca una buona stima del parametro. un errore standard elevato indica una notevole variabilità tra le medie campionarie, ovvero che i campioni possono avere medie che si discostano molto dal valore della popolazione e, dunque, la media campionaria calcolata può essere una stima non buona; un errore standard basso indica scarsa variabilità, ovvero che i campioni hanno medie che in generale si discostano di poco dal valore della popolazione, per cui la media campionaria può essere considerata una buona stima. Come la forma della distribuzione, la deviazione standard dipende dall’ampiezza campionaria. Tanto più è elevato, tanto più le medie dei campioni si avvicineranno a quella della popolazione; in tal modo, i valori si concentreranno attorno alla media della distribuzione e quindi diminuirà la variabilità. In altre parole, all’aumentare di diminuisce la variabilità della distribuzione campionaria: tale relazione inversa tra variabilità della distribuzione campionaria e ampiezza campionaria è detta legge dei grandi numeri. Essa implica che se tende a o all’infinito, tende a zero, poiché tutte le medie campionarie tenderanno a coincidere con la media della popolazione. STIMATORI STIMATORE è una formula e una variabile casuale. Il risultato è una STIMA. Ci consentono di stimare i parametri della popolazione. Supponiamo di non avere alcuna informazione relativa al voto medio all’esame di Metodologia per la Ricerca in Psicologia degli Studenti di Scienza e Tecniche Psicologiche e di avere media e deviazione standard del voto ( = 25 e = 2.3) di un campione casuale di 36 studenti. Si vuole stimare il parametro della popolazione. A partire dall’indicatore possiamo trarre (oppure, abbiamo due famiglie di stimatori e sono quelli puntuali e intervallari): una STIMA PUNTUALE, ovvero calcolare un singolo valore che rifletterebbe il parametro della popolazione; una STIMA INTERVALLARE, ovvero delimitare un intervallo di valori entro il quale dovrebbe ricadere il parametro. INTERVALLI DI CONFIDENZA DELLA MEDIA Se l’ampiezza del campione è maggiore di 30 sappiamo, per il teorema del limite centrale, che la distribuzione campionaria della media, alla quale questo appartiene, è normale. Quindi, la probabilità che il campione abbia una media vicina a quella della popolazione (che, ricordiamo, coincide con quella della distribuzione campionaria) è elevata. Tuttavia, esiste anche la probabilità (seppur più bassa) che la media del campione si discosti da quella della popolazione dalla quale proviene. Calcolata la statistica = 25, non possiamo sapere con certezza quanto sia vicina al parametro ignoto, ma possiamo fare una valutazione in termini probabilistici affermando che molto probabilmente la media della popolazione sarà compresa tra un valore inferiore ed un valore superiore alla media campionaria. Ciò significa stabilire che il parametro della popolazione sarà compreso nell’intervallo calcolato con una probabilità uguale a 0.95 oppure 0.99, valori prossimi a 1 che ci permettono di essere quasi certi che il parametro si collochi entro i valori definiti dall’intervallo di confidenza. La scelta del livello di fiducia è arbitraria: potremmo fissare un livello più basso (ad es. del 90%, dell’80% o del 70%). Questo porterebbe all’identificazione di un intervallo più piccolo; tuttavia, sarà minore la probabilità che il valore del parametro ricada all’interno di quell’intervallo. Si stabilisce di avere una probabilità elevata (0.95 o 0.99) che il valore ricada nell’intervallo, anche se ciò vuol dire ampliare l’intervallo stesso. Si preferisce dare un’indicazione meno precisa, ma con più fiducia. 1-α = 95% non 5 SE = S/ Z = è semplicemente la distribuzione normale 1 – α = rappresenta il LIVELLO DI CONFIDENZA. α = 1% ; α = 5% ; α = 10% Quindi 1 – α sarà: 99% ; 95% (più utilizzato) ; 90% quindi: P (L inferiore < µ < L superiore) = 95% {L = limite} Vedere esercizio sugli appunti ORA TOCCA A TE! ESERCIZI Per lo stesso campione dell’esempio precedente, calcola l’intervallo di confidenza: al 99% (sapendo che per questo livello di confidenza z sarà pari a ± 2.58); al 90% (con z che sarà pari a ± 1.64). STATISTICA INFERENZIALE 2 STIMATORE INTERVALLARE DELLA MEDIA (CON σ NOTA) Stabilire un livello di confidenza del 95% significa che 95 volte su 100 l’intervallo conterrà il vero parametro della popolazione. Per risalire al valore di z, sfruttando la simmetria della distribuzione normale (probabilità pari a 0.5 a sinistra e 0.5 a destra), ed il fatto che il valore sarà diviso equamente nelle due code della curva: si stabilisce a quanto ammonta α (0.05 nel caso di un livello di confidenza al 95%) e la sua ripartizione nella curva (α /2, ovvero 0.025. si calcola l’area della curva corrispondente, sottraendo il valore di α /2 all’area di metà della curva (0.5 − 0.025 = 0.475) si individua, all’interno delle tavole della distribuzione normale standardizzata il valore di corrispondente all’area 0.475, ovvero ±1.96, considerando entrambi i lati della curva. ESERCIZI Per intervalli di confidenza: al 90% al 99% al 99.9%; Calcolare i valori di corrispondenti SOLUZIONI = 0.1; z = 1.64|1.65; l’intervallo si restringe = 0.01; z = 2.58; = 0.001; z = 3.27; l’intervallo si allarga. ESERCIZI Il livello medio di conformismo all’autorità di un campione casuale di 125 studenti iscritti al corso di laurea in Scienze Politiche è pari a 4 (su una scala Likert a 7 punti dove 1-min e 7-max), con una deviazione standard pari a 0.3. Si calcoli l’intervallo di confidenza: 1. con un = 0.1; 2. con un = 0.05; 3. con un = 0.01; Le stime a nostra disposizione sono: = 125 =4 = 0.3 NELLA PRIMA RIGA DELLA SLIDE NON È 4 MA STIMA DI INTERVALLI DI CONFIDENZA PER PROPORZIONI ESERCIZIO All’interno di un’ area territoriale, il 40% delle donne di un campione casuale di 200 donne ha più di due figli. Si determini l’intervallo di confidenza al 95%. Le stime a nostra disposizione sono: Si noti come l’intervallo di confidenza per la differenza tra medie [19.60; 24.41] non contenga lo 0. Se l’intervallo di confidenza (per la differenza tra medie e per la differenza tra proporzioni) contenesse lo 0, vorrebbe dire che può accadere che, in campioni estratti casualmente, le ore trascorse in palestra siano superiori per il gruppo dei maschi piuttosto che per le femmine e viceversa. Questo aspetto che rende impossibile affermare che esista una differenza sostanziale tra le due categorie. Un intervallo di confidenza che non contiene lo 0 può indicare che, estraendo casualmente ulteriori campioni, emergerebbe comunque una differenza in favore delle femmine (nel caso di valori positivi) oppure in favore dei maschi (nel caso di entrambi valori negativi). LA VERIFICA DELLE IPOTESI (o TEORIA DEI TEST) Se l’ampiezza del campione di cui disponiamo è maggiore di 30 sappiamo, per il teorema del limite centrale, che la distribuzione campionaria della media, alla quale questo appartiene, è normale. Quindi, la probabilità che il campione abbia una media vicina a quella della popolazione (che, ricordiamo, coincide con quella della distribuzione campionaria) è elevata. Tuttavia, esiste anche la probabilità (seppur più bassa) che la media del campione si discosti da quella della popolazione dalla quale proviene. Calcolata una stima puntuale della media, non possiamo sapere con certezza quanto sia vicina al parametro ignoto, ma possiamo fare una valutazione in termini probabilistici affermando che molto probabilmente la media della popolazione sarà compresa tra un valore inferiore ed un valore superiore alla media campionaria. La verifica delle ipotesi parte da un’estendere del concetto di stima, ovvero dall’ipotizzare che un certo fenomeno abbia specifiche caratteristiche nella popolazione. Si estrae un campione in modo casuale da tale popolazione e, una volta raccolte le informazioni sul campione, possiamo chiederci: «Se nella popolazione le cose stanno come ho ipotizzato, qual è la probabilità di ottenere