Introduzione al Modulo di Metodi Statistici - Corso B - PDF

Document Details

EducatedMagic6592

Uploaded by EducatedMagic6592

Università degli Studi di Torino

Davide Zucco

Tags

statistical methods statistics mathematical statistics introduction to statistics

Summary

This document provides an introduction to statistical methods, including topics such as descriptive statistics, probability calculations, and statistical inference. It also mentions the software R and its use in statistical analysis.

Full Transcript

Istituzioni di matematiche e metodi statistici Introduzione al modulo di metodi statistici - Corso B Davide Zucco Corso di Laurea Triennale in Scienze Naturali Il Modulo Quale? Metodi Statistici Quanto? 48 ore (fra lezioni ed esercitazioni) Quando? C...

Istituzioni di matematiche e metodi statistici Introduzione al modulo di metodi statistici - Corso B Davide Zucco Corso di Laurea Triennale in Scienze Naturali Il Modulo Quale? Metodi Statistici Quanto? 48 ore (fra lezioni ed esercitazioni) Quando? Corso B lunedì 10.30 – 13.00 giovedì 16.30 – 18.00 (ogni due settimane, iniziando il 3 ottobre) Il calendario delle lezioni è aggiornato settimanalmente su Moodle: https://naturali.i-learn.unito.it/course/view.php?id=1128 Per ogni informazione relativa all’insegnamento fare sempre riferimento a questa pagina Moodle. Con chi? Prof. Davide Zucco: I email: [email protected] I Qualsiasi comunicazione da parte del docente avverrà tramite Moodle, la piattaforma Campusnet, Esse3. Controllare frequentemente la casella email di Ateneo [email protected] I Ricevimento su appuntamento I Si risponde solo a mail provenienti da account istituzionali (no ad indirizzi privati) Perché? Intervalli di confidenza Come ottenere un intervallo per la media del peso / dell’apertura alare / della lunghezza / del numero di uova covate nella popolazione della specie upupa? 1. Scelta del parametro da stimare 1. Media peso upupa 2. Raccolta dati attraverso un 2. Raccolta dei pesi da un campione di campione della popolazione upupa 3. Costruzione dell’intervallo che 3. Calcolo media del campione, costruzione contiene il parametro dell’intervallo, ad esempio (50, 90) g. Attenzione pericolo: l’intervallo costruito potrebbe non contenere il parametro da stimare! Nella procedura potremmo commettere degli errori (ad esempio con il campionamento). Urrà la probabilità! Gli errori si controllano con la probabilità: si fissa un livello di fiducia, ad esempio 0.95, e si afferma I l’intervallo (50, 90) g contiene il valore della media del peso degli upupa con probabilità 0.95 I ovvero se costruissimo gli intervalli di confidenza di altri campioni (nelle stesse condizioni di quello utilizzato), il 95% di questi conterrebbe il valore della media I ovvero 95 campioni su 100 conterrebbero il vero valore della media Test di significatività Quanto è significativa una determinata affermazione? “É una specie abbastanza solitaria [...]” 1. Formulare un’ipotesi sulla 1. La specie degli upupa è abbastanza popolazione solitaria 2. Raccolta dati attraverso un 2. Raccolta informazioni in un campione campione della popolazione di upupa 3. Confronto con quello che ci si 3. Confronto e mi aspetterei di vedere aspetterebbe se l’ipotesi fosse vera spesso gli upupa in solitaria. 4. Accettazione o rifiuto dell’ipotesi 4. Accetto o rifiuto l’ipotesi che l’upupa iniziale sia una specie solitaria. Attenzione pericolo: la decisione (accettare/rifiutare) potrebbe essere errata. Urrà la probabilità! Gli errori si controllano con la probabilità: si fissa un livello di significatività, ad esempio 5% e diciamo I la specie di upupa è abbastanza solitaria con probabilità del 5% di sbagliare nel caso io rifiuti e non lo sia Programma 1. Statistica descrittiva: 1.1 variabili univariate, rappresentazioni, frequenze; 1.2 indici riassuntivi di posizione, di variabilità; 1.3 variabili bivariate, misure di associazione, rappresentazioni. 2. Calcolo delle probabilità: 2.1 fenomeni aleatori e variabili aleatorie (v.a.); 2.2 v. a. discrete: uniforme, Bernoulli, binomiale, Poisson 2.3 v. a. continue: uniforme, normale, di Student, χ2. 3. Statistica inferenziale. 3.1 stima intervallare per proporzione, media e varianza; 3.2 test di ipotesi su proporzione, media e varianza; 3.3 test di ipotesi su confronto di proporzione e media; 3.4 test di ipotesi per due campioni (indipendenza); 3.5 test di adattamento (χ2 , Kolmogorov-Smirnov, Shapiro-Wilk); 3.6 test ANOVA ad una via e Kruskal-Wallis 3.7 regressione lineare, stima dei parametri, bontà del modello. Il software Cosa è? è un linguaggio di programmazione per il calcolo statistico. Perchè utilizzarlo? Permette di semplificare calcoli e visualizzare grafici. Come lo utilizzeremo? Mediante l’uso dell’interfaccia grafica RStudio. Dove trovarlo? I Sul proprio pc, previa installazione (vedere prossima slide) I Su internet, previa registrazione online (vedere la seconda prossima slide) Installazione su computer (no tablet o smarthphone) Esistono versioni per Windows, macOS, e Linux. Connettersi ai seguenti link e seguire le istruzioni a seconda del sistema operativo del proprio pc. I Software R https://cran.mirror.garr.it/CRAN/ I RStudio https://www.rstudio.com/products/rstudio/download/ Compito: installare i programmi sul proprio PC e portarlo a lezione Lavorare online (anche per tablet e smarthphone) Connettersi al seguente link I Posit Cloud https://posit.cloud Seguire le istruzioni per registrarsi o accedere (log in) I Cliccare su Get Started I Scegliere Posit Free $0 / forever per un utilizzo gratuito I Scegliere Learn More I Per registrarsi scegliere Sign Up ed inserire mail e password, oppure scegliere un account personale (Google, etc...) I Se già registrati scegliere Log in ed inserire le credenziali, oppure scegliere un account personale (Google, etc...) I Aprire New Project Compito: registrarsi a Posit Cloud e portare pc o tablet a lezione

Use Quizgecko on...
Browser
Browser