Statistica Completo PDF

Document Details

WellConnectedAmetrine878

Uploaded by WellConnectedAmetrine878

Tags

statistical concepts research methods data analysis statistics

Summary

This document provides a comprehensive overview of statistical concepts, methodologies, and analyses. It covers various types of studies, qualitative and quantitative data analysis, and visual representations of data. This document is likely to be of use for those studying statistics and related fields.

Full Transcript

FASI DELLA RICERCA SCIENTIFICA: - DEFINIZIONE: 1) OBIETTIVI DELLA RICERCA 2) TIPOLOGIA DI STUDIO 3) POPOLAZIONE D’INTERESSE 4) VARIABILI D’INTERESSE (qualitative e quantitative) E SCALE DI MISURA 5) FONTE DI DATI (cartelle cliniche) 6) TECNICA D’INDAGINE (quest...

FASI DELLA RICERCA SCIENTIFICA: - DEFINIZIONE: 1) OBIETTIVI DELLA RICERCA 2) TIPOLOGIA DI STUDIO 3) POPOLAZIONE D’INTERESSE 4) VARIABILI D’INTERESSE (qualitative e quantitative) E SCALE DI MISURA 5) FONTE DI DATI (cartelle cliniche) 6) TECNICA D’INDAGINE (questionali, interviste...) 7) SELEZIONE DEL CAMPIONE 8) RILEVAZIONE DEI DATI E ORGANIZZAZIONE DEI DATI RACCOLTI 9) ANALISI STATISTICA E PRESENTAZIONE DEI RISULTATI (stati. descrittiva o inferenziale) 10) INTERPRETAZIONE E UTILIZZAZIONE DEI RISULTATI (dati mancanti e codifica) TIPOLOGIA DI STUDIO Studi trasversali o di prevalenza: viene effettuata una rilevazione in un istante di tempo Studi longitudinali: (prospettici, retrospettivi, misure ripetute) per ogni rilevazione vengono individuati dati in diversi istanti di tempo o Coorte Prospettici: si parte dal presente verso il futuro, si parte da soggetti che non hanno sviluppato la malattia (per studiare l’associazione tra esposizione a fattori di rischio e malattia) o Caso controllo, Retrospettivi: si parte dal futuro e si va indietro nel tempo andando ad identificare esposizioni o fattori di rischio nel passato, si basa su dati già esistenti come le cartelle cliniche Studi osservazionali: il ricercatore osserva senza intervenire o Studi descrittivi: il ricercatore si limita alla descrizione della realtà senza formulare un’ipotesi o Studi esplicativi o analitici: il ricercatore verifica l’ipotesi di ricerca e cioè la presenza di relazione tra fenomeni (per individuare determinanti e fattori influenzanti la salute e le malattie) Studi di coorte (prospettivi): seguono un gruppo nel tempo per vedere se sviluppa la malattia (uso RR) Studi caso – controllo (retrospettivi): confrontano chi ha la malattia con chi non ce l’ha per identificare fattori di rischio nel passato (uso ODD RATIO) Studi trasversali (cross sectional): osservano esposizione e malattia in un momento preciso Studi sperimentali: il ricercatore interviene modificando la realtà in studio mediante un esperimento Trial clinici randomizzati: i partecipanti sono divisi in due gruppi (ex. trattamento e placebo) per confrontare gli effetti Studi sistematici e metanalisi Revisione sistematica: analizza più studi per rispondere a una domanda specifica Metanalisi: combina risultati di più studi per ottenere una stima statistica RELAZIONI TRA VARIABILI Diretta: se cambia X cambia Y (causa – effetto) Reciproca: feedback positivo/negativo (X fa variare Y, ma Y fa variare X) (asse ipotalamo ipofisario) Spuria: è presente una causa comune alle due variabili seppur non ci sia alcuna correlazione Indiretta: quando il legame tra due variabili X e Y è mediato da una terza variabile Z (x,z,y) Condizionata: la relazione tra due variabili X e Y varia a seconda del valore assunto dalla terza variabile (all’aumentare dell’età aumenta l’ascolto di musica classica, a condizione (z) che aumenti il livello d’istruzione) LE VARIABILI QUANTITATIVE: (i valori son grandezze numeriche) sono variabili misurabili numericamente e rappresentano una quantità o una grandezza o Continue: assumono un numero infinito di valori (altezza, peso, temperatura…) o Discrete: assumono valori interi o specifici (numero di figli, numero giorni di lavoro…) QUALITATIVE: (i valori non sono grandezze numeriche ma modalità) descrivono attributi, categorie o qualità senza una scala numerica o Nominali non ordinabili: non hanno un ordine (colore degli occhi, razze dei cani, gruppi sanguigni...) o Ordinabili: hanno un ordine ma le differenze tra i valori non sono misurabili (livello di istruzione elementare, medio, superiore, universitario; percezione qualità della vita pessimo, mediocre, sufficiente) CASI PARTICOLARI; scale di misura: Variabili qualitative non ordinabili (scale nominali): o variabili dicotomiche: assumono solo due valori (attivo – non attivo) (malato, sano) o variabili polinominali: assumono più di due modalità (i gruppi sanguigni) Variabili qualitative ordinabili (scale ordinali): o in ordine crescente o decrescente (IMC) GRAFICI VARIABILI QUALITATIVE ▪ Grafico a barre (nominali e ordinabili: categorie) per confrontare frequenze o percentuali delle categorie (ex distribuzione gruppi sanguigni) Ogni barra rappresenta un valore associato a una categoria. ▪ Diagramma a torta per rappresentare proporzioni relative (%) tra categorie (ex percentuale di studenti maschi e femmine) VARIABILI QUANTITATIVE ▪ Istogramma (continui cioè valori infiniti) per rappresentare la distribuzione di variabili continue (ex distribuzione altezze in una popolazione) Le barre mostrano la frequenza di dati raggruppati in intervalli o classi. ▪ Box plot utile per capire se la distribuzione è simmetrica o asimmetrica (ex confronto dei pesi tra uomo e donna) EPIDEMIOLOGIA ✓ L’obiettivo è stimare la frequenza di una malattia (epidemiologia descrittiva: che malattia è, chi colpisce, quando, dove colpisce…) ✓ identificare i determinanti di salute / malattia (epidemiologia analitica: raccoglie dati per verificare l’ipotesi e rispondere al perché una malattia si verifica) MALATTIE INFETTIVE: causa unica, determinante necessario (CAUSA – EFFETTO) MALATTIE CRONICO DEGENERATIVE: più cause, attenzione ai fattori di confondimento (MOLTE CAUSE – EFFETTO) COVARIAZIONE E CASUALITÀ Covariazione o correlazione o associazione: al variare di una variabile varia anche l’altra Causazione: quando la variazione di una una variabile causa la variazione della seconda MISURA DELLE FREQUENZE DEGLI EVENTI Descrivono quanto spesso un evento (ex malattia) si verifica in una popolazione ▪ prevalenza: numero di casi totali (nuovi + preesistenti) in un momento specifico o periodo ▪ incidenza: numero di nuovi casi in una popolazione a rischio, in un determinato periodo ▪ incidenza cumulativa: stima il rischio che un individuo sviluppi una malattia in un periodo definito ▪ frequenza assoluta: il numero di volte in cui un evento si verifica in una popolazione (30 persone su 100 hanno l’influenza, il 30 indica la frequenza assoluta) ▪ frequenza relativa: LE PROPORZIONI: proporzione di un evento rispetto al tot. della popolazione (30:100= 0,3 = 3%) I RAPPORTI: rapporto tra infetti e non infetti ▪ tassi: per misurare eventi su tempi o popolazioni diversi (ex considero una fascia d’età) o grezzi: misura il numero totale di eventi senza tener conto di differenze tra i sottogruppi della popolazione (su 100 mila abitanti si registrano 1000 decessi all’anno), non tiene conto dell’età, sesso o standardizzati: elimina i fattori confondenti come l’età e rende confrontabili due popolazioni diverse; utilizza una popolazione standard di riferimento come quella europea o mondiale; dunque, tiene conto della distribuzione per classi MISURE DEL RISCHIO RISCHIO ASSOLUTO (incidenza cumulativa): misura la probabilità che un evento si verifichi (malattia) in un periodo in una popolazione esposta e non esposta (in un anno 10/100 persone contraggono x malattia; 10% di probabilità è il rischio assoluto) RISCHIO RELATIVO (RR): misura quante volte è più probabile che un individuo esposto a un certo fattore sviluppi la malattia rispetto a un individuo non esposto (forza di associazione tra fattore di rischio e malattia) o RR=1 nessuna associazione tra esposizione e risultato o RR > 1; l’esposizione aumenta il rischio (fumo – cancro) o RR < 1; l’esposizione riduce il rischio (vaccini – malattie) ODD RATIO: o Valore = 1 assenza di associazione o Valore < 1 associazione negativa, il fattore può proteggere dalla malattia o Valore > 1 associazione positiva, il fattore può causare la malattia CRITERI DI CASUALITÀ INTERNA Congruenza temporale Coerenza interna dei risultati Specificità dell’associazione Forza dell’associazione Relazione dose-effetto CRITERI DI CASUALITÀ ESTERNA Coerenza con i risultati di altri studi Plausibilità biologica Effetto della rimozione della sospetta causa STUDI DI COORTE (VEDI SU) INTERVALLO DI CONFIDENZA 95% L’intervallo (95%) entro cui è compreso il valore reale del parametro esaminato, accettiamo un margine d’errore del 5% Ex. Odd ratio 2,5 con l’intervallo di confidenza (IC) 95% (1,5 – 3,7) l’associazione è significativa Odd ratio 1,0 con IC 95% (0,8 – 1,2) nessuna associazione significativa Dunque, indica la precisione della stima e il range plausibile del vero valore P VALUE: è un valore di probabilità di sbagliare 5% STUDI PROSPETTICI E RETROSPETTIVI: STUDI DI COORTE (prospettici) RR due gruppi, uno esposto ai fattori di rischio, uno non esposto, vengono seguite nel tempo (follow up) per valutare l’incidenza di una malattia; all’inizio tutte le persone sono sane, alla fine del follow up dividerò in sane e non sane; quindi, in questo studio vengono confrontate le probabilità di sviluppare la malattia tra individui esposti e non esposti STUDI CASO CONTROLLO (retrospettivi) ODD RATIO Parte dai malati e va verso il passato per vedere chi era esposto e chi no. L’obiettivo non è valutare il rischio di sviluppare la malattia cioè l’incidenza, ma il rischio di esposizione a un determinato fattore, si mettono a confronto le probabilità di essere stati esposti al fattore d’interesse tra i casi (malati) e i controlli (sani) STUDI OSSERVAZIONALI: descrittivi e analitici STUDI TRASVERSALI O DI PREVALENZA Rilevazione istantanea, in un preciso momento, dei dati sui fattori di rischio, non è adatto per le malattie rare REVISIONI E METANALISI Dalla base verso l'apice (salendo, aumenta il livello di fiducia su quel lavoro) sono: STUDI SU ANIMALI, IN VITRO, IN LABORATORIO Studi in grande quantità che non coinvolgono gli esseri umani. STUDI SENZA UN DISEGNO: à Casi report o serie di casi. à Revisione narrativa. à Opinione dell’esperto. à Editoriali. STUDI PRIMARI: prendendo in considerazione direttamente l’uomo: ▪ Studi osservazionali analitici (di coorte e caso-controllo) ▪ Studi controllati randomizzati mira a ridurre i bias (errori) durante la sperimentazione attraverso la randomizzazione (uso di grandi gruppi e scelta casuale di chi andrà nei casi e nei controlli) STUDI SECONDARI: (revisioni) non vi è reclutamento di persone ma vengono effettuati sfruttando gli studi primari, di cui sintetizzano i risultati META ANALISI: analisi statistica che si svolge in seguito a una revisione, che fornisce un'unica misura del rischio (fa una media delle misure di rischio degli studi primari) LINEE GUIDA: da eseguire per ottenere la massima conoscenza su un argomento specifico REVISIONI Articoli con cui l’autore effettua una rassegna (scegli i migliori) degli studi primari e una sintesi dei loro risultati. Tipi di revisione: Narrative: revisione della letteratura scientifica che offre una panoramica critica di un determinato argomento, senza specificare le fonti. Sistematiche: si vuole rispondere a un quesito scientifico usando studi primari presenti in letteratura sintetizzando i risultati e conclusioni di 2 o più pubblicazioni o Umbrella reviews: revisione della revisione (insieme di tante revisioni) → (META ANALISI). REVISIONE SISTEMATICA Prende in considerazione la qualità, la rilevanza clinica, e l’eterogeneità Perché sono utili? 1. Presenza di un numero troppo elevato di pubblicazioni e ricerche su un determinato argomento. 2. Per evitare errori nel considerare solo una parte delle informazioni disponibili. 3. Per la disomogeneità della qualità metodologica. 4. Per differenze tra i risultati di studi su uno stesso argomento. PROTOCOLLO RS 1. Scelta del topic e dell’obiettivo: si da un titolo, si utilizza il PICO (paziente, interventi, controllo, risultati) 2. Creazione del protocollo (Come svolgere una revisione), 3. Ricerca degli studi, 4. Screening/lista degli studi inclusi ed esclusi 5. Valutazione degli studi. 6. Estrapolazione dei dati. 7. Sintesi dei risultati 8. Pubblicazione. LINEE GUIDA Viene fuori dai risultati di ricerche scientifiche fatte negli anni, perciò, andando avanti con la ricerca, deve essere rivista e implementata con raccomandazioni. META-ANALISI Analisi statistica dei risultati di vari studi indipendenti che ha come obiettivo quello di produrre una singola stima numerica dell'effetto del trattamento (per ottenere un'unica misura del rischio complessiva). FOREST PLOT Risultato riportato in grafici detti FOREST PLOT: o Linea orizzontale → rappresenta il rischio. o Linea verticale → rappresenta la non-differenza (di solito a 1). Quadratini → rischi della meta-analisi (più grande è il campione usato nello studio, più grande è la dimensione del quadrato) Diamante → simboleggia il rischio complessivo. Se i risultati sono dicotomici (2 valori): la linea di non differenza corrisponderà ad 1 (si usa RR e ODD RATIO) Se i risultati sono continui (infiniti valori): la linea di non differenza corrisponderà a 0 (si usa MEDIA e DEVIAZIONE STANDARD) ETEROGENEITÀ = gli studi uniti sono tutti diversi. MODELLI: A effetti fissi: esclude l’eventuale eterogeneità A effetti casuali o random: includono l’eterogeneità PUBBLICAZIONI BIAS Errore di pubblicazione, da dichiarare attraverso un grafico detto FUNNEL PLOT → a cono rovesciato con: Ascisse → misura dell’effetto. Ordinate → misura del campione. BIOSTATISTICA ANALISI DEI DATI: se facciamo un questionario cartaceo, le informazioni verranno raccolte in database e alla fine si scaricano su un foglio excel (foglio excel in cui si inseriscono le informazioni estrapolate da questionari statistici decodificati) molte parole devono essere trasformate in numeri (esempio: Sì = 1; No = 2). CLEANING DEI DATI: Preparazione dei dati, che prevede dei controlli. In caso di "dato mancante", bisognerà capire il motivo INIZIO DELL’ANALISI STATISTICA ELABORAZIONE DEI DATI attraverso: Statistica descrittiva: riassunto sintetico delle informazioni raccolte durante l’analisi statistica descrittiva. Statistica inferenziale: prevede la generalizzazione dei risultati ottenuti da un campione, attraverso un test statistico per determinare una differenza statisticamente significativa. (i risultati valgono per l’intera popolazione) RAPPRESENTAZIONE DEI DATI: in base alla variabile (qualitativa o quantitativa) avremo diversi modi di rappresentazione o Variabili quantitative: Attraverso "misure di posizione" o di "tendenza centrale" per attestare il valore più frequente. come si disperdono i dati? Secondo dei grafici "a campana" o "Gaussiani". DISPERSIONE: quanto i valori si discostano dalla media (quanto sono vicini o meno) INDICATORI DI DISPERSIONE Range: campo di variazione (differenza tra valore massimo e minimo) SVANTAGGI Si basa soltanto sui valori estremi della distribuzione e non tiene conto dei valori intermedi Tende ad aumentare al crescere del numero delle osservazioni E' molto influenzato da osservazioni anomale (outliers) Range interquartile: usato per la mediana, divido il campione in 4 "quartili" e prendo in considerazione il Q1 (25%) e il Q3 (75%). In questo intervallo ricade la metà dei valori, posta esattamente al centro della distribuzione Non è molto influenzata da osservazioni anomale o estreme (statistica robusta) E adatta a esprimere la variabilità di distribuzioni asimmetriche Q1 o 25° percentile = 7 significa che il 25% del campione ha valori inferiori o uguali a 7 Q2 o 50° percentile o mediana significa che il 50% del campione ha valori inferiori o uguali a 10 e l’altro 50% ha valori superiori o uguali a 10 Q3 o 75° percentile = 12 significa che il 75% del campione ha valori inferiori o uguali a 12 Deviazione standard o omega: ci dice se quei valori sono più o meno vicini alla media Il 68% circa delle osservazioni cade entro 1 ds dalla media. Il 95% circa delle osservazioni cade entro 2 ds dalla media. Il 99% circa delle osservazioni cade entro 3 ds dalla media. Curva asimmetrica (positiva o negativa). Curva simmetrica: moda, media e mediana sono sovrapponibili. Curva più o meno schiacciata: curtosi. La curtosi, dunque, è una misura di dispersione VALORI ESTREMI E ANOMALI Si definiscono valori estremi i valori più grandi o più piccoli di una distribuzione. In senso più generale, l’espressione significa i valori prossimi alla coda di una distribuzione. Con valori anomali (in inglese, outlier) ci si riferisce invece ai valori estremi di una distribuzione che si caratterizzano per essere estremamente elevati o estremamente bassi rispetto al resto della distribuzione e che rappresentano perciò casi isolati rispetto al resto della distribuzione. In generale, per stabilire se un valore è estremo o anomalo, si fa riferimento alle misure di sintesi della posizione e di dispersione Vengono considerati possibili valori anomali della media (aritmetica) quei valori che si discostano da essa per più di tre volte la deviazione standard (scarto quadratico medio) VALORI ESTREMI E ANOMALI DELLA MEDIANA: Estremi = pallini bianchi o pieni. Anomalo = * (si scosta dal Q3 o dal Q1 per un valore di 3 DS). INFERENZA: estensione dal campione dal particolare al generale dei dati raccolti da uno studio, a cui può esservi associato un errore (ogni stima può prevedere un'incertezza, accertabile solo al 5%). Quanto il nostro risultato è significativo? Ad ogni valore associamo un INTERVALLO DI CONFIDENZA: un range di valori accettabili al 95%, delineato da due rette verticali. In esso sono inseriti pallini neri (= errori); i pallini fuori dalle due rette corrispondono a valori estremi. VERIFICA DELL’IPOTESI Nel rispondere a un quesito scientifico, l’ipotesi è che ci sia un rischio (es: differenza di peso tra bambini di madri fumatrici rispetto alle non fumatrici). Ma devo confrontarmi con altre ipotesi contrarie: Esempio: verificare se due trattamenti sono egualmente efficaci. o H0: ipotesi nulla → non c’è differenza tra i due trattamenti. o H1: ipotesi alternativa → il primo trattamento è più efficace del secondo Possibili errori: 1. Errore di I tipo: rifiuto l'ipotesi nulla quando questa è vera. 2. Errore di II tipo: accetto l'ipotesi nulla, ma questa è falsa. La probabilità di sbagliare: Va decisa all'inizio dello studio, per permettere di commettere un errore di I o II tipo (la P Value). Accetto o rifiuto l’ipotesi nulla? Dipende dalla P Value (= probabilità di sbagliare) e dall’IC (intervallo di confidenza). o Se P < 0,05 → la probabilità di sbagliare è bassa (0,5%), perciò accetto la differenza → la differenza è statisticamente significativa, cioè il risultato non è dovuto al caso. (accetto la mia ipotesi) N.B se la p value è inferiore a 0,05 rifiuto l’ipotesi nulla STATISTICA DESCRITTIVA si occupa di raccogliere, organizzare, riassumere e rappresentare i dati in modo semplice e comprensibile. È utilizzata per descrivere e analizzare un insieme di dati senza trarre conclusioni generalizzabili per tutta la popolazione (che invece è compito della statistica inferenziale). INDICI SINTETICI: o TENDENZA CENTRALE: media, moda, mediana o DISPERSIONE: dispersione della media, range interquartile o FORMA: curtosi GRAFICI: o Grafico a barre e grafico a torta (qualitative) o Istogramma e box plot (quantitative) TABELLE DI FREQUENZA: Le tabelle di frequenza sono il primo strumento per la sintesi dei dati, ma diventano inefficaci se vi sono numerose modalità di rappresentazione. Semplici: riferiscono a un solo carattere Doppie: riferiscono a due caratteri Stratificate: riferiscono a più di due caratteri àSemplici per caratteri sconnessi Le variabili non ordinabili non possono essere messe in un ordine razionale (es. colore degli occhi, sesso, stato civile). Per queste variabili si calcolano: Frequenze assolute: Il numero di volte in cui ogni categoria si presenta, influenzate dalla numerosità del campione. Frequenze relative: Proporzione rispetto al totale (frequenza assoluta divisa per il totale). Frequenze percentuali: Frequenze relative moltiplicate per 100, espresse in percentuale. Frequenze valide (SPSS): Percentuali calcolate solo sui rispondenti effettivi, escludendo eventuali mancate risposte. Per variabili ordinabili (es. livelli di istruzione: "elementare", "media", "superiore"), oltre alle frequenze assolute, relative e percentuali, si calcola anche: Semplici per caratteri ordinabili Frequenza cumulata: Somma progressiva delle frequenze, utile per capire la distribuzione fino a una certa categoria. Può essere: o Cumulata assoluta: Somma progressiva delle frequenze assolute. o Cumulata percentuale: Somma progressiva delle percentuali. Semplici per caratteri quantitativi raggruppati in classi Per variabili quantitative continue o discrete (es. età, peso), i dati vengono spesso raggruppati in classi per costruire tabelle di frequenza. Regole per costruire le classi: o Evitare classi con basse frequenze. o Preferire classi di ampiezza uniforme per facilitare l'interpretazione. Tabelle di frequenza doppie (2x2) Utilizzate per confrontare due caratteri relativi alla stessa unità statistica (es. sesso e preferenza politica). Sintetizzano la distribuzione con righe e colonne per rappresentare le due variabili ANALISI BIVARIATA Serve a studiare la relazione fra coppie di variabili. Le sue funzioni sono: stabilire se tra due variabili esiste una relazione di indipendenza o associazione in caso di associazione, quantificare il grado di associazione tra coppie di variabili mediante coefficienti Le variabili sono associate se il valore di p è inferiore a 0,05 (p < 0,05). Nella maggior parte dei casi si utilizzano delle tabelle di contingenza (o a doppia entrata, o incrocio) Il tipo di percentualizzazione: Si sceglie la percentuale di colonna quando si vuole analizzare l'influenza che la variabile posta in colonna ha sulla variabile posta in riga; Si sceglie la percentuale di riga quando si vuole analizzare l'influenza che la variabile posta in riga ha sulla variabile posta in colonna. MISURE DI ASSOCIAZIONE - Test del Chi-quadrato: misura il livello di associazione tra due variabili qualitative, ossia se il cambiamento di una determina quello dell'altra (se sono legate o meno). - Correlazione: associazione di due variabili quantitative. Livello di correlazione: o Grafico di dispersione: per vedere come varia una variabile al variare dell'altra e se c'è una proporzionalità tra le variabili. Poiché il test del Chi-quadrato può essere difficile da interpretare, si usano misure di associazione per tabelle 2x2: Coefficiente V di Cramer (o PHI) Correzione di Yates: per variabili qualitative, in cui non si deve considerare un numero troppo basso. Test esatto di Fisher: si usa se in una tabella 2x2 abbiamo una frequenza assoluta inferiore a 5. TRA VARIABILI QUANTITATIVE Si utilizzano i grafici di dispersione (ogni punto rappresenta un dato) per controllare l'andamento lineare (della retta). Coefficiente di correlazione lineare: permette di confrontare due gruppi e calcolare la forza di associazione tra variabili quantitative, attraverso due test: Test di Pearson (parametrico) Test di Spearman (non parametrico). Test Parametrici I test parametrici sono utilizzati per variabili quantitative continue quando il campione è superiore a 30 e le varianze sono uguali (per verificarlo, si usa il Test di Levine). Tipi di test: T-student test: per confrontare due medie di campioni indipendenti o dipendenti. ANOVA (Analisi della varianza): per confrontare le medie di due o più gruppi. Test Non Parametrici Sono utilizzati quando almeno una delle condizioni dei test parametrici è violata. Esistono test non parametrici equivalenti ai test parametrici. Tipi di test: Chi-quadrato Test di Mann-Whitney: confronto tra due campioni indipendenti. Test di Wilcoxon: confronto tra due campioni dipendenti. Test di Kruskal-Wallis: confronto tra tre o più campioni indipendenti. STATISTICA MULTIVARIATA ANALISI FATTORIALE Usata per: Ridurre la dimensione del campione Analisi di raggruppamento Analisi discriminante REGRESSIONE MULTIPLA Regressione multipla logistica Dati di sopravvivenza Regressione Lineare multipla VARIABILE: caratteristica rilevata su ogni unità. Fattore: variabile categorica (qualitativa) Covariata: variabile quantitativa VARIABILE DIPENDENTE (Y o Vd): effetto (es. malattia); predetta dalla variabile X in una regressione. VARIABILE ESPLICATIVA (X o Vi): presunta causa (es. fattore di rischio); predice la variabile Y in una regressione. Esempio di Quesito clinico: LA PRESSIONE ARTERIOSA DIPENDE DALL’ETÀ? R-quadrato: valore che indica quale percentuale di Y cambia variando X. ANOVA: analisi della varianza. B: quanto varia Y per variazioni unitarie di X. Sig.: P-value. REGRESSIONE LOGISTICA Modello statistico per calcolare la forza di relazione tra più variabili qualitative e quantitative insieme. Es. Relazione tra studio, età, ipertensione ed evento cardiovascolare (assenza 0 o presenza 1). Y dipende da una variabile dicotomica (evento cardiovascolare). Uso di un grafico a dispersione per calcolare l'assenza (0) o la presenza (1) di infarto: Esponente di B: misura del rischio = Odds ratio (OR).

Use Quizgecko on...
Browser
Browser