Distribuți de Probabilitate. Intervale de Încredere PDF
Document Details
Uploaded by RelaxedPhiladelphia
Universitatea de Medicină și Farmacie Carol Davila
Tags
Summary
Acesta este un document despre distribuții de probabilitate, intervale de încredere și aplicatiile lor în statistică medicală. Conține notițe de curs.
Full Transcript
UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Distribuții de Probabilitate. Intervale de Încredere...
UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Distribuții de Probabilitate. Intervale de Încredere 1 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică CUPRINS Despre distribuții de probabilitate Distribuția Gaussiană Intervale de Încredere Concluzii 2 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică REAMINTIRE Probabilități Un concept care răspunde la întrebarea: „Se va produce un anumit eveniment?” iar răspunsurile ”DA” / ”NU” este înlocuit cu o valoare [0,1] unde o = categoric NU și 1 = categoric DA. numărul de cazuri favorabile 𝑃= numărul de cazuri total posibile Dimensiunea setului de date trebuie să fie suficient de mare J. Kerrich, matematician sud-african și prizonier în Al Doilea Război Mondial, a aruncat o monedă de 10.000 de ori. De 5067 ori a obținut “cap” și de 4933 a obținut ”pajură” (sursa: Statistics, Ed. 11, Witte et al, Ed. Wiley, 2017) 3 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică DISTRIBUȚII Probabilitatea = cât de frecvent (des) așteptăm rezultate diferite prin repetarea experimentului. Distribuția de probabilitate = o funcție statistică care descrie toate valorile posibile și probabilitățile aferente pentru o variabilă într-un anumit interval. Densitatea de probabilitate = o funcție care exprimă probabilitatea cu care o variabilă se încadrează într-un anumit interval y Densitate Probabilitate 4 valori variabilă x UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică DISTRIBUȚII Valoarea așteptată: media unei distribuții de probabilitate. Ø Valoarea așteptată se calculează folosind media ponderată, adică fiecare valoare este ponderată (cuantificată) cu probabilitatea de apariție Ø In MS-Excel / Numbers: sumproduct Exemplul #1: Prezentări la CPU: x 18 20 22 25 26 30 p(x) 0.3 0.2 0.2 0.1 0.1 0.1 5 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică DISTRIBUȚII Care este media prezentarilor? Strategia #1: Media aritmetică a valorilor din fiecare zi 18 20 22 25 26 30 6 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică DISTRIBUȚII Care este media prezentarilor? Strategia #2: Valoarea așteptată x 18 20 22 25 26 30 p(x) 0.3 0.2 0.2 0.1 0.1 0.1 E = 18 x 0.3 + 20 x 0.2 + 22 x 0.2 + 25 x 0.1 + 26 x 0.1 + 30 x 0.1 7 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică DISTRIBUȚII Campania de screening pentru infecția cu HIV/SIDA Prevalența: 10% Cost test: 100 $ Dimensiunea populației: 100 (pentru simplificarea demonstrației) Opțiunea #1: Testare individuală: 100 teste x 100$ = 10.000 $ 8 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică DISTRIBUȚII Opțiunea #2: Pooling 1, dacă toate testele sunt negative x= 21, dacă cel puțin un test este pozitiv (0.9)20, dacă toate testele sunt negative p(x) = (1- 0.9)20, dacă cel puțin un test este pozitiv E(x) = (0.9)20 x 1 + (1 – (0.9)20) * 21 = 12.2% * 1 + 87.8% * 21 = 18.56 teste Cost: 18.56 x 5 (pool-uri) x 100 = 9280 $ 9 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică DISTRIBUȚII y Densitate Probabilitate Aria totala = 1 !!! valori variabilă x 10 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică DISTRIBUȚII 11 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Distribuția gaussiană (normală) 12 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică IMPORTANȚA μ – media aritmetică π – 3.14159.... f σ – deviația standard e – 2.71828.... x 13 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică IMPORTANȚA Mare parte din testele statistice inferențiale presupun ca setul de date respecte distribuția gaussiană Aplicații practice în diverse domenii de activitate 14 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică PROPRIETĂȚI Distribuție a unei variable continue Setul de date: media aritmetică = mediana = modul Cele 2 ramuri sunt simetrice în jurul medie aritmetice a setul de date Poate fi definită doar cu 2 parametri (media și deviația standard) 15 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică PROPRIETĂȚI 16 sursa: https://www.isixsigma.com/dictionary/normal-distribution/ UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică PARAMETRI sursa: Statistics, Ed. 11, Witte et al, Ed. Wiley,17 2017 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică PARAMETRI Sursa: Note Curs: 2021 / 2022 18 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică APLICAȚIE www.obiectivinfo.ro Context: În vederea evaluării performanței unei ferme, se dorește evaluarea greutății ouălelor de găină Observație: Se cântărește un număr suficient de mare de ouă (100) și se constată ca distribuția este gaussiană (μ = 44g, σ = 5g) 19 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică APLICAȚIE Care este probabilitatea ca un ou să aibă o greutate de cel putin 41 g ? Aria = ? 20 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică APLICAȚIE 21 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică APLICAȚIE Pasul 1: Aleg o alta distribuție gaussiană (standard): μ = 0, σ = 1 Pasul 2: Calculez scorul Z (numărul de deviații standard de la valoarea medie) 41 − 44 𝑍= 𝑍 = −0.6 5 22 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică APLICAȚIE 1. Probabilitatea ca un ou să aibă o greutate mai mică de 41g este: 27,4 % 2. Probabilitatea ca un ou să aibă o greutate de cel putin 41g este: 72,6% 23 sursa: Statistics, Ed. 11, Witte et al, Ed. Wiley, 2017 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Problema Sursa: www.gov.ro În vederea alocării de resurse financiare prin Casa Națională de Asigurări de Sănătate – se solicită o estimare a numărului mediu de carii dentare la copiii cu vârsta între 0 – 13 ani 24 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Strategii Ø Control stomatologic pentru toți tinerii cu vârsta între 0 – 13 de ani. Sursa: www.stock.adobe.com 3052479 pacienți (cf. INS, în 2018) Resurse financiare (100 RON x 3052479 = 305247900) => ~62 mil. EUR Resurse umane Complianța familiei / copiilor Etc Statistici DESCRIPTIVE 25 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Strategii Ø Construirea unui EȘANTION REPREZENTATIV Sursa: www.stock.adobe.com Ø Analiză eșantion. Concluzionare pentru întreaga populație 26 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Erori de eșantionare Ø Neînțelegerea problemei Sursa: www.stock.adobe.com Ø Erori de selectare a valorilor eșantionate Ø Erori de încadrare Ø Dimensiune insuficientă a eșantionului 27 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Analiza Eșantionului Sursa: www.stock.adobe.com Ø Calcul: tendința centrală prin media artimetică (in Excel: AVERAGE) Ø Calcul: Deviația standard (in Excel: STDEV) 28 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Definiție Ø Un interval de valori în care suntem suficient de siguri că valoarea căutată Sursa: www.stock.adobe.com (reală) se regăsește § Ce înseamnă suficient de sigur ? § Ce înseamnă valoarea reală ? § O probabilitate (uzual > 95%) § Valorea ideală (niciodată cunoscută) 29 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Formula Sursa: www.stock.adobe.com - media aritmetică s – deviația standard n – dimensiunea setului de date 30 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Nivelul de Încredere z Sursa: www.stock.adobe.com 31 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Dacă dimensiunea eșantionului este > 30 !!! 32 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Exemplu Ø Tabelul de mai jos arată numărul de ore petrecute în fața TV (pe săptămână) de către un Sursa: www.stock.adobe.com eșantion de studenți. Construiți intervalul de încredere (98%) care să conțină media orelor petrecute de către toți studenții în fața TV 33 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Formula ! 𝑥 ± 𝑡∗( " ) Sursa: www.stock.adobe.com x - media aritmetică s – deviația standard n – gradele de libertate (dimensiune set date – 1) t – valoarea distribuției T Dacă dimensiunea eșantionului este < 30 !!! 34 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Sursa: www.stock.adobe.com 35 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică Intervale de Încredere Sursa: www.stock.adobe.com Sursa: https://saylordotorg.github.io/text_introductory- statistics/s16-appendix.html 36 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică CONCLUZII Am recapitulat elemente importante care stau la baza Biostatisticii Am definit Distribuțiile de Probabilitate Am definit Distribuția Gaussiană Experimentat calculul probabilității pornind de la o distribuție gaussiană Construit intervale de încredere 37 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică 38 UNIVERSITATEA DE MEDICINĂ ȘI FARMACIE “CAROL DAVILA” din București Facultatea de Stomatologie, Calea Plevnei nr. 17 – 21, Sector 1, București Disciplina Informatică Medicală și Biostatistică [email protected] 39