Biostatistiek 1 College 9 PDF
Document Details
Uploaded by ImpressedSnake3464
null
2024
Tags
Summary
This document contains lecture notes on biostatistics, focusing on hypotheses, normal distributions, types of errors, p-value, and different sampling methods.
Full Transcript
Biostatistiek 1 College 9 19-01-2024 Onderwerpen 1. Soorten hypothesen 2. Normale verdeling 3. Fout van de 1e en 2e soort 4. p-value 5. Steekproefmethoden Lesdoelen Aan het eind van de les kan de student: 1. het verschil tussen een nulhypothese en alternatiev...
Biostatistiek 1 College 9 19-01-2024 Onderwerpen 1. Soorten hypothesen 2. Normale verdeling 3. Fout van de 1e en 2e soort 4. p-value 5. Steekproefmethoden Lesdoelen Aan het eind van de les kan de student: 1. het verschil tussen een nulhypothese en alternatieve hypothese benoemen 2. een nulhypothese en alternatieve hypothese formuleren 3. uitleggen wat een normale verdeling inhoudt 4. fout van de 1e soort (type 1 fout) en de 2e soort (type 2 fout) uitleggen 5. de rol van de p-value kunnen uitleggen 6. de verschillende steekproefmethoden kunnen uitleggen Statistische Methoden Statistische methoden Beschrijvende Verklarende statistiek statistiek Schatten Toetsen Hypothese toetsing Ik geloof dat de Populatie gemiddelde leeftijd van de populatie 50 jaar is (hypothese) ☺ ☺☺ ☺ ☺ ☺ Een hypothese is een veronderstelling of conclusie die ☺ ☺ ☺ wordt getrokken voordat alle feiten bekend zijn en tentatief als juist ☺☺ ☺ wordt aangenomen als een basis voor verder onderzoek. Een hypothese kan na onderzoek worden aangenomen of verworpen. Hypothese toetsing Ik geloof dat de Verwerp de gemiddelde leeftijd hypothese! Populatie van de populatie 50 jaar is (hypothese ☺ ☺ ☺ ☺ ☺ ☺ Aselecte ☺ ☺ ☺ steekproef ☺ ☺ ☺ ☺ ☺ X = 20 Wat is een hypothese? Ik geloof dat het gemiddeld Een bewering over een populatie tentamencijfer van Statistiek parameter van deze klas 8.0 zal zijn! Een parameter is een populatie gemiddelde, fractie, variantie (spreiding) Moet worden geformuleerd voordat de analyse wordt gepleegd o.b.v. een steekproef Nul hypothese 1. “geen effect”, “geen verschil”, “geen invloed” of “geen verband” 2. Heeft altijd de volgende tekens: =, , of 3. Wordt aangegeven als: H0 4. Zoals: H0: = numerieke waarde Met de tekens =, , of bijv, H0: = 3 5. Heeft een belangrijke impact indien een onjuiste beslissing genomen wordt Alternatieve hypothese 1. Tegenovergestelde van de nulhypothese 2. Heeft altijd een van de volgende tekens: , , of 3. Wordt aangegeven als Ha of H1, bijv. Ha: < 3 of H1 : < 3 4. Indien H0 wordt verworpen, wordt Ha geaccepteerd als de gegevens overtuigend wijzen op zijn juistheid 5. De Ha vertegenwoordigt de waarden van de parameter waarvoor de onderzoeker bewijs zoekt Voorbeeld Toets dat het populatie gemiddelde ongelijk is aan 3. Statistisch betekent dat : H0: = 3; de null hypothese H1: 3; de alternatieve hypothese Quiz: Formuleer de nul en de alternatieve hypothese 1. Crossectioneel onderzoek naar de aanwezigheid van gewrichtsklachten bij verpleegkundigen. Onderzoeksvraag: hebben vrouwen vaker last van gewrichtsklachten dan mannen? 2. Onderzoeksvraag: Heeft een random sample van 80 plussers een diastolische bloeddruk van hoger dan 85 mmHg? 3. Een gerandomizeerde studie met 2 armen, specifiek dieet versus geen dieet. In beide armen worden de deelnemers gewogen bij start van de studie en op het einde van de studie. Onderzoeksvraag: is er een verschil in gewichtsverlies tussen beide groepen? Basisgedachte: Normale verdeling Steekproef verdeling Basisgedachte: Normale verdeling steekproefverdeling Het is onwaarschijnlijk o.b hiervan... dat wij een wordt de nul gemiddelde van hypothese 20 zullen verworpen dat = krijgen... 50.... Als het populatiegemiddelde 20 = 50 Sample Mean Significantie niveau Ook wel het kritieke gebied of alpha genoemd () verzameling van alle waarden van de toetsingsgrootheid waarbij de null hypothese wordt verworpen (en de alternatieve hypothese wordt geaccepteerd) (alpha) is het niveau waarop dit gebeurd Typisch waarden van alpha zijn :.01,.05,.10 (99%, 95%, 90% betrouwbaarheid) Het kritieke gebied (tweezijdige toets) Betrouwbaarheidsniveau/ gebied Kritieke-gebied Kritieke-gebied Rejection Rejection Region Region 1/2 1/2 Nonrejection Region Ho Sample Statistic Critical Value Critical Value Value Beslissingsrisico’s Fouten bij het nemen van beslissingen 1. Type I fout (fout van de eerste soort) Verwerp de nulhypothese, terwijl die waar is (je concludeert dat de nulhypothese onjuist is, terwijl het aangenomen moet worden) De kans op type I fout is (Alpha), ook wel significantie niveau genoemd 2. Type II fout (fout van de tweede soort) Verwerp de onjuiste nulhypothese niet (m.a.w. je accepteert de onjuiste H0) De kans op Type II fout is (Beta) Voorbeeld fout 1e en 2e soort Je besluit je te laten testen op corona, omdat je milde symptomen hebt. Er zijn twee fouten die mogelijk kunnen optreden: Type I-fout (Type I error): het testresultaat laat zien dat je corona hebt, maar dat heb je eigenlijk niet. (fout-positief) Type II-fout (Type II error): het testresultaat laat zien dat je geen corona hebt, maar dat heb je eigenlijk wel. (fout-negatief) Type I-fout en Type II-fout Type I-fout: Het risico dat je deze fout maakt, is gelijk aan het significantieniveau (alfa of α), de maximale kans dat je de nulhypothese ten onrechte verwerpt Het significantieniveau is meestal 0.05 of 5%. Er is een maximale kans van 5% is dat je resultaten zou vinden die leiden tot het verwerpen van de nulhypothese als de nulhypothese echt waar zou zijn Om het risico op een Type I-fout te verkleinen, kun je een lager significantieniveau kiezen. Type II-fout: je concludeert dat er geen effect is, terwijl dit effect in werkelijkheid wel bestaat; weinig statistische power om een effect te detecteren (≥80% acceptabel) & hebben een inverse relatie Beide fouten KAN JE NIET gelijktijdig verkleinen! p-value Overschrijdingskans/ probability value; de waarschijnlijkheid van een mogelijke gebeurtenis of eigenschap binnen een populatie p-waarde is steekproef afhankelijk een getal tussen 0 en 1, waarmee je bepaalt of een steekproefuitkomst statistisch significant is Als de p-waarde lager is dan het significantieniveau, betekent dit dat je resultaten statistisch significant zijn en dat ze in overeenstemming zijn met de alternatieve hypothese. Als de p-waarde hoger is dan het significantieniveau, zijn de resultaten niet significant. De p-waarde van 0.035 betekent echter dat er een kans is van 3.5% dat de nulhypothese onterecht wordt verworpen. Er is dus nog steeds een klein risico dat je een Type I-fout maakt. Steekproefmethoden Aselecte steekproef: gebaseerd op de theorie van waarschijnlijkheid, iedereen in de populatie heeft dezelfde kans heeft om te worden gekozen. ❑ Enkelvoudige aselecte steekproef: participanten uit de populatie kiezen m.b.v. bijv. een software of ander programma; loterijmethode ❑ Systematische steekproef: ieder lid van de populatie krijgt een nummer en de respondenten worden geselecteerd op basis van regelmatige intervallen. ❑ Gestratificeerde steekproef: Stratificatie zorgt voor een goed beeld van de verschillende groepen (deelpopulaties, oftewel strata) binnen je steekproef, intern zijn ze homogeen. (vb o.b.v. geslacht, etniciteit, leeftijd, inkomen etc.) Steekproefmethoden Selecte steekproef: niet iedereen heeft de kans om te worden geselecteerd, omdat vooraf bepaalt wordt wie tot de selectie behoort ❑ Quotumsteekproef: de onderzoekspopulatie wordt in een aantal subpopulaties verdeeld; er zijn duidelijke doelen om van iedere subpopulatie een bepaald aantal personen te onderzoeken (vb 20 kinderen, 20 volwassenen, 20 ouderen) ❑ Gemakssteekproef: selecteer geschikte respondenten die eenvoudig te bereiken zijn (vb verkennend onderzoek) ❑ Sneeuwbalsteekproef: gebruik de al geworven respondenten om nieuwe respondenten te werven (lastig bereikbare onderzoeksgroepen) Samenvatting Nul- en alternatieve hypothese Normale verdeling Fout van de 1e en 2e sort p-value Soorten steekproeven Huiswerk PPT bestuderen