Introduzione alle variabili e definizioni di base PDF
Document Details
Uploaded by SophisticatedExpressionism516
Università degli Studi di Milano
2024
Alberto Bertoncini
Tags
Summary
Il documento fornisce informazioni su un corso di Informatica e Biostatistica, presso l'Università degli Studi di Milano, per l'anno accademico 2024-2025, includendo orari, materiale didattico ed informazioni sull'esame. Contiene una panoramica introduttiva alla statistica e alle variabili.
Full Transcript
INFORMATICA E BIOSTATISTICA Anno Accademico 2024-2025 Dott. Alberto Bertoncini Informazioni sul corso Orario lezioni (fino al 28 ottobre): Teoria: Lunedì 13:30 – 16:30 Orario lezioni (dal 4 novembre al 13 novembre): Labor...
INFORMATICA E BIOSTATISTICA Anno Accademico 2024-2025 Dott. Alberto Bertoncini Informazioni sul corso Orario lezioni (fino al 28 ottobre): Teoria: Lunedì 13:30 – 16:30 Orario lezioni (dal 4 novembre al 13 novembre): Laboratorio: Lunedì 13:30 – 17:30 Teoria: Mercoledì 13:30 – 16:30 Orario lezioni (dal 13 novembre): Laboratorio: Lunedì 13:30 – 17:30 Teoria: Mercoledì 9:30 – 12:30 Esame: scritto teorico + laboratorio Materiale didattico: Slide + Analisi statistica dei dati biologici, Michael Whitlock, Dolph Schluter Dott. Alberto Bertoncini MEDICINA VETERINARIA E STATISTICA Statistica: insieme di metodi scientifici finalizzati alla conoscenza quantitativa e qualitativa dei fenomeni collettivi mediante la raccolta, l’ordinamento, la sintesi e l’analisi dei dati Perchè ad un corso di medicina veterinaria vi ritrovate lezioni di statistica? Qualcosa è andato storto nella scelta del vostro corso di studio? Ha un senso questa materia per noi? Dott. Alberto Bertoncini MEDICINA VETERINARIA E STATISTICA La statistica serve a capire se esistono delle relazioni di causa-effetto o se invece quello che si osserva è solo frutto del caso Dal momento in cui si ha a che fare con sistemi complessi, le entità biologiche sono un esempio perfetto, la componenete non controllabile di un esperimento è elevata Nella meccanica newtoniana, ad esempio, possiamo effettuare più esperimenti ponendoci sempre nelle medesime condizioni. Nelle scienze biologiche, qualora si operi su delle entità complesse è pressochè impossibile ripetere l’esperimento nello stesso identico modo: ci serve uno strumento per capire se la riuscita dell’esperimento è frutto del caso o meno. Dott. Alberto Bertoncini MEDICINA VETERINARIA E STATISTICA Quindi, perchè studiare e comprendere la statistica? Consultazione di letteratura scientifica Studi di epidemiologia Uso nella diagnostica Sicurezza alimentare EVIDENCE BASED VETERINARY MEDICINE → uso consapevole ed esplicito di test per dare informazioni riguardanti i risultati clinici e le attività decisionali da intraprendere nella cura degli animali Dott. Alberto Bertoncini STATISTICA STRUMENTO INDISPENSABILE NELL’APPLICAZIONE DEL METODO SCIENTIFICO OCCORRE: DEFINIRE IL PROBLEMA FORMUALRE IPOTESI PRECISA IMPOSTARE IL DISEGNO SPERIMENTALE RACCOGLIERE E ANALIZZARE I DATI IN MODO DA PRENDERE UNA DECISIONE IL PIÙ POSSIBILE OBIETTIVA CIRCA L’IPOTESI FORMULATA Dott. Alberto Bertoncini STATISTICA PASSI DELL’ANALISI STATISTICA RACCOLTA DEI DATI (“DATI GREZZI”) ELABORAZIONE DEI DATI INFORMAZIONI DEI DATI VALUTAZIONE CRITICA DEI DATI PRESENTAZIONE DEI RISULTATI Dott. Alberto Bertoncini STATISTICA DUE BRANCHE PRINCIPALI: 1)STATISTICA DESCRITTIVA TECNICHE PER TABULAZIONE, RAPPRESENTAZIONE GRAFICA DEI DATI (solitamente un campione della popolazione), PER SINTESI DI DATI GREZZI IN INDICI INFORMATIVI (e.g. media) 2)STATISTICA INFERENZIALE DEFINIZIONE DELLE CARATTERISTICHE DELLA POPOLAZIONE ATTRAVERSO LO STUDIO DI UN CAMPIONE DA ESSA ESTRATTO Dott. Alberto Bertoncini STATISTICA DESCRITTIVA INSIEME = COLLEZIONE DI OGGETTI, INDIVIDUI, ANIMALI CON ALMENO UNA CARATTERISTICA COMUNE VARIABILE = È UNA CARATTERISTICA CHE PUÒ ASSUMERE DIVERSI VALORI. PARTICOLARE ASPETTO DELLE UNITÀ STATISTICHE CHE COSTITUISCE L’OGGETTO DELL’INDAGINE ESEMPI DI VARIABILI CHE POSSONO ESSERE RILEVATE SU UN INSIEME DI PERSONE SONO: L’ETÀ, LO STATO CIVILE, LA RELIGIONE, LA PROFESSIONE, IL REDDITO, IL NUMERO DI AUTOMOBILI POSSEDUTE, etc. 1)VARIABILE QUALITATIVA: NON SONO RAPPRESENTATE DA UN VALORE NUMERICO, MA SUDDIVISIBILE IN CATEGORIE. AD ESEMPIO LO STATO CIVILE (SINGLE, CONIUGATO, DIVORZIATO, VEDOVO) È UNA VARIABILE A 4 STATI 2)VARIABILE QUANTITATIVA: MISURA A CUI È ASSOCIATO UN VALORE NUMERICO. UNA VARIABILE SI DICE QUANTITATIVA QUANDO LE SUE DETERMINAZIONI (VALORE O INTENSITÀ) SONO ESPRESSE MEDIANTE VALORI NUMERICI. ESEMPI POSSIBILI SONO IL REDDITO, IL NUMERO DI FIGLI, IL RENDIMENTO DI UN TITOLO AZIONARIO, IL VOTO DI MATURITÀ. Dott. Alberto Bertoncini SCALE DI MISURA: VARIABILI QUALITATIVE NOMINALE: I VALORI RIENTRANO IN CATEGORIE O CLASSI NON ORDINATE DATI BINARI: VIVO/MORTO, MASCHIO/FEMMINA CON UNO O PIÙ CRITERI DI CLASSIFICAZIONE: GRUPPO SANGUIGNO ORDINALE: L’ORDINE TRA LE CATEGORIE È IMPORTANTE VARIABILI QUALITATIVE CON ASSEGNAZIONE DI UN ORDINE LOGICO COLORE MANTELLO DA PIÙ CHIARO A PIÙ SCURO STATO DI SALUTE: 0= ATTIVO; 1 = LAVORO LEGGERO; 2 = AUTOSUFFICIENZA PER PIÙ DEL 50% DI ORE DI VEGLIA; 3 = COSTRIZIONE A LETTO PER PIÙ DEL 50% DI ORE DI VEGLIA; 4 = INABILITÀ Dott. Alberto Bertoncini SCALE DI MISURA: VARIABILI QUANTITATIVE DISCRETA: ASSUME SOLO VALORI ISOLATI ES. NUMERO DI CANI, NUMERI INTERI CONTINUA: ASSUME TUTTI I POSSIBILI VALORI ES. PESO, ALTEZZA Dott. Alberto Bertoncini SCALE DI MISURA: VARIABILI QUANTITATIVE IDENTIFICA IL TIPO DI VARIABILE NOMINALE, ORDINALE, DISCRETA, CONTINUA: N, O, D, C IL COLORE DEL MANTELLO NEI GATTI: IN UNA COLONIA DI 35 GATTI CI SONO 1 BIANCO, 3 NERI, 7 ARANCIO, 7 AGOUTI, 11 SQUAMA DI TARTARUGA, 7 DI ALTRI COLORI LA PERCENTUALE DI SPERMATOZOI MOTILINELL’EIACULATO DI 6 TORI IN UN CENTRO DI IA; I VALORI SONO 73, 81, 64, 76, 69 E 84% LA MISURA DELL’ASSORBANZA A 280 NM DI SOLUZIONE DI PROTEINE DI TUORLO D’UOVO; I VALORI SONO 0.724, 0.591, 0.520 LA MOTILITÀ DI CAMPIONI DI SPERMATOZOI STIMATA SU UNA SCALA CHE VA DA 0 A 10 (0 INDICA COMPLETA IMMOTILITÀ) I LIVELLI DI PROGESTERONE (NG/ML) MISURATI MEDIANTE RADIOIMMUNO ASSAY IN PECORE GRAVIDE DURANTE LA GESTAZIONE I GATTINI CLASSIFICATI UNA SETTIMANA DOPO LA NASCITA PER LA PROFONDITÀ TORACICA: ANORMALI E NORMALI LA NUMEROSITÀ DELLA NIDIATA DI CONIGLI IL NUMERO MEDIO DI CONIGLI PER NIDIATA LA CONDIZIONE CORPOREA (BCS) NELLE CAPRE: I PUNTEGGI SONO 1, 2, 3, 4 E 5 IL NUMERO DI MORTI IN UN ANNO PER UNA PARTICOLARE MALATTIA DURANTE UNO STUDIO EPIDEMIOLOGICO LA RADIOATTIVITÀ DETERMINATA PER SCINTILLAZIONE: CONTE PER MINUTO Dott. Alberto Bertoncini SCALE DI MISURA: VARIABILI QUANTITATIVE IDENTIFICA IL TIPO DI VARIABILE NOMINALE, ORDINALE, DISCRETA, CONTINUA: N, O, D, C IL COLORE DEL MANTELLO NEI GATTI: IN UNA COLONIA DI 35 GATTI CI SONO 1 BIANCO, 3 N NERI, 7 ARANCIO, 7 AGOUTI, 11 SQUAMA DI TARTARUGA, 7 DI ALTRI COLORI LA PERCENTUALE DI SPERMATOZOI MOTILINELL’EIACULATO DI 6 TORI IN UN CENTRO DI IA; C/D I VALORI SONO 73, 81, 64, 76, 69 E 84% LA MISURA DELL’ASSORBANZA A 280 NM DI SOLUZIONE DI PROTEINE DI TUORLO D’UOVO; I C VALORI SONO 0.724, 0.591, 0.520 LA MOTILITÀ DI CAMPIONI DI SPERMATOZOI STIMATA SU UNA SCALA CHE VA DA 0 A 10 O (0 INDICA COMPLETA IMMOTILITÀ) I LIVELLI DI PROGESTERONE (NG/ML) MISURATI MEDIANTE RADIOIMMUNO ASSAY IN C PECORE GRAVIDE DURANTE LA GESTAZIONE I GATTINI CLASSIFICATI UNA SETTIMANA DOPO LA NASCITA PER LA PROFONDITÀ N TORACICA: ANORMALI E NORMALI LA NUMEROSITÀ DELLA NIDIATA DI CONIGLI D IL NUMERO MEDIO DI CONIGLI PER NIDIATA C LA CONDIZIONE CORPOREA (BCS) NELLE CAPRE: I PUNTEGGI SONO 1, 2, 3, 4 E 5 O IL NUMERO DI MORTI IN UN ANNO PER UNA PARTICOLARE MALATTIA DURANTE UNO STUDIO EPIDEMIOLOGICO D LA RADIOATTIVITÀ DETERMINATA PER SCINTILLAZIONE: CONTE PER MINUTO C Dott. Alberto Bertoncini CATEGORIZZAZIONE (DISCRETIZZAZIONE) DA VARIABILE QUANTITATIVA A VARIABILE CATEGORICA UNA VARIABILE CONTINUA PUÒ ESSERE TRASFORMATA IN UNA VARIABILE DISCRETA DIVIDENDO L’INTERVALLO DEI SUOI POSSIBILI VALORI (RANGE) IN DUE O PIÙ INTERVALLI LA SCELTA DEGLI INTERVALLI È ARBITRARIA, MA DEVE COPRIRE TUTTI I CASI POSSIBILI SENZA SOVRAPPOSIZIONI Eg. L’ETÀ PUÒ ESSERE SUDDIVISA IN 3 CLASSI: =61 LA VARIABILE RISULTANTE È DI TIPO NOMINALE ORDINALE PASSO 1: ORDINARE I VALORI DELLA VARIABILE DAL PIÙ PICCOLO AL PIÙ GRANDE PASSO 2: DIVIDERE IN INTERVALLI CIASCUN INTERVALLO HA UN LIMITE INFERIORE E UNO SUPERIORE IL LIMITE SUPERIORE DI UNA CLASSE NON DEVE COINCIDERE CON QUELLO INFERIORE DELLA CLASSE SUCCESSIVA Dott. Alberto Bertoncini Suddividere il peso di 40 cani di razza Boxer nelle seguenti classi (o categorie): minore di 18 kg 18.1 –20 kg 20.1 –22 kg 22.1 –24 kg 24.1 –28 kg maggiore di 28.1 kg Peso (kg) N 28 2 Total 40 Dott. Alberto Bertoncini VARIABILITÀ DELLE MISURAZIONI Nell’osservazione e quantificazione di un particolare fenomeno biologico, le misurazione molto raramente sono identiche ma esiste VARIABILITÀ Dovuta a: Variazione biologica (fattori genetici e ambientali) Errori di misurazione Dott. Alberto Bertoncini QUALITÀ DELLE MISURAZIONI ACCURATEZZA Il grado di accordo tra il valore osservato e il valore vero Nella pratica è valutata misurando la frequenza con cui il risultato di un test è confermato da un test di riferimento (goldstandard) PRECISIONE Rappresenta la vicinanza o dispersione deirisultati ottenuti per uno stesso campione Il tiro al bersaglio può chiarire la relazione tra precisione e accuratezza. Dott. Alberto Bertoncini QUALITÀ DELLE MISURAZIONI Colpi raggruppati, ma lontani dal centro indicano un tiro preciso, ma non accurato Colpi dispersi intorno al centro indicato un tiro accurato, ma impreciso Colpi dispersi lontanti dal centro indicano un tiro non accurato e impreciso Infinine colpi raccolti intorno al centro indicato un tiro accurato e preciso Dott. Alberto Bertoncini TIPI DI ERRORE CASUALE Quando si ripete la misura della stessa grandezza col medesimo strumento, nelle medesime condizioni e seguendo la stessa procedura, la presenza di varie cause di errore produce delle differenze tra il valore misurato ed il valore vero I risultati di misure ripetute fluttuano in maniera casuale in un certo intervallo, la cui ampiezza definisce la precisione delle misure stesse SISTEMATICO Il valore della misura di una grandezza o sempre in eccesso o sempre in difetto La discrepanza da valore misurato e valore vero si riproduce inalterata nelle misure ripetute Dott. Alberto Bertoncini QUALITÀ DELLE MISURAZIONI: ESEMPIO Si vuole verificare l’accuratezza di un metodo di determinazione della glicemia del cane. Si esamina per 9 volte una soluzione di glucosio a concentrazione nota (90mg/dl) e si ottengono i seguenti valori: 94, 90, 93, 86, 96, 98, 88, 90, 93 Media delle misurazioni : 828/9 = 92 mg/dl Deviazione standard (DS) delle misurazioni : 3.841mg/dl Accuratezza : media - valore vero = 92 90 = 2 mg/dl Inaccuratezza = Accuratezza/valore vero = 2/90 = 0.022 (2.22%) Precisione : si calcola il coefficiente di variabilità: CV = DS/valore vero DS = 3.841 CV =3.841/90 = 0.0427 (4,27%) Dott. Alberto Bertoncini POPOLAZIONE E CAMPIONE POPOLAZIONE: INSIEME DI ELEMENTI SU CUI SI EFFETTUA L’ANALISI STATISTICA CAMPIONE: SOTTOINSIEME DELLA POPOLAZIONE Occorre Scegliere il campione in modo corretto (per evitare bias, distorsione dello stimatore). As esempio la scelta RANDOM = OGNI INDIVIDUO DEVE AVERE LA STESSA PROBABILITÀ DI ESSERE SELEZIONATO → RIDUZIONE DELL’ERRORE SISTEMATICO Utilizzare un adeguato numero di unità campionarie → RIDUZIONE DELL’ERRORE CASUALE Elaborare in modo corretto gli stimatori Dott. Alberto Bertoncini