College 2 en 3 Public Health Biostatistiek PDF
Document Details
Uploaded by ImpressedSnake3464
Tags
Summary
This document details public health biostatistics concepts, focusing on descriptive and analytical statistics, central tendency measures (mean, median, mode), dispersion measures (variance, standard deviation), and percentiles. The content includes examples, calculations, and exercises related to the topic.
Full Transcript
Public Health Biostatistiek College 2 1 Aan het einde van dit college kan de student het gemiddelde, de mediaan, de modus, de variantie, de standaardafwijking, de kwartielen uitrekenen, en verschillen tussen de maten benoemen De student is verder in st...
Public Health Biostatistiek College 2 1 Aan het einde van dit college kan de student het gemiddelde, de mediaan, de modus, de variantie, de standaardafwijking, de kwartielen uitrekenen, en verschillen tussen de maten benoemen De student is verder in staat de frequentie van variabelen grafisch weer te geven 2 Het weergeven van statistisch verzamelde informatie Beschrijvende statistiek Analytische statistiek Tussenvorm: exploratieve 3 Beschrijvende statistiek De beschrijvende statistiek houdt zich in principe bezig met de beschrijving van bepaalde gegevens van een populatie. Als voorbeeld kan men denken aan een volkstelling. 4 Analytische statistiek In de analytische statistiek tracht men aan de hand van een steekproef informatie over de gehele populatie te verkrijgen. Hierbij maakt men gebruik van hypothesen om statistisch significante verschillen op te sporen. Bekende methoden zijn toetsen, schattingsmethoden en als combinatie van beide: betrouwbaarheidsintervallen. 5 Beschrijvende Statistiek In het kort 6 Beschrijvende Statistiek Centrummaten Spreidingsmaten Mean: Gemiddelde Spreidingsbreedte Rekenkundig gemiddelde Standaard(deviatie)/ afwijking Meetkundig gemiddelde Variantie Modus/Mode: resultaat dat het meest voorkomt. Bijzondere maten Mediaan: Middelste resultaat Percentage Procentuele verandering Percentiel Rate Ratio 7 REKENKUNDIG GEMIDDELDE Bij gebruik zonder specificatie verwijst gemiddelde naar het rekenkundig gemiddelde. Dit is de meest gebruikte maatstaf voor centrale ligging. Om het gemiddelde te berekenen, tel je alle waarden in de dataset bij elkaar op en deel je het door het aantal waarnemingen. Hoewel dit een eenvoudige procedure is, is de notatie voor toekomstig gebruik belangrijk. 8 Opdracht Dit zijn 10 geobserveerde leeftijden van winkelbezoekers. - 21, 42, 5, 11, 30, 50, 28, 27, 24, 52 omdat er een aantal is van 10 (n) cijfers - n staat voor de steekproefomvang (n = 10) die hier dus 10 is - xi staat voor de waarde van de i-de waarneming in de dataset - (bijv. x = 21, x2 = 42) 1 eerste waarneming tweede waarneming - Wat betekent ∑x?? En bereken gemiddelde 9 Zwaartekrachtcentrum. Het gemiddelde is het zwaartepunt van de verdeling; het is waar de gegevens in evenwicht zouden zijn als ze op een wip werden geplaatst. 10 Compenseert voor scheeftrekkingen (skewness). Omdat het gemiddelde een evenwichtspunt is, zal een klein gewicht ver van het midden een groot gewicht compenseren nabij het centrum. Dit maakt het gemiddelde zeer vatbaar voor de invloed van uitzonderingen en scheeftrekkingen. paars : mediaan blauw : modus 11 Het steekproefgemiddelde kan drie aspecten weergeven: (1) het kan worden gebruikt om een willekeurige waarde, getrokken uit de steekproef, te voorspellen. (2) het kan worden gebruikt om een willekeurig waarde, uit de populatie te voorspellen. (3) het kan worden gebruikt om het populatiegemiddelde voorspellen. 12 De Mediaan De mediaan is het middelpunt van de verdeling - het punt dat groter is dan of gelijk is aan de helft van de getallen/waarden in de dataset. Het is het middelste getal in de waarnemingen na het plaatsen van de getallen op volgorde Om de mediaan te vinden, rangschikt u de gegevens in rangorde (d.w.z. creëer een geordende array van de gegevens) en tel vervolgens in vanaf beide uiteinden van de array tot de helft (het midden). Als n oneven is, beland je op de mediaan. Als n even is je komt tussen twee waarden terecht. Gemiddelde van deze waarden bepalen dan de werkelijke mediaan. 13 Bereken de mediaan en het gemiddelde van de volgende 5 getallen De mediaan is beter bestand tegen uitzonderingen dan het gemiddelde. De mediaan blijft 8, maar het gemiddelde gaat van 8 naar 29,6. De mediaan bleef hetzelfde, terwijl het gemiddelde meer dan verdrievoudigde. *gegevens geef je aan van laag naar hoog oneven : beland je op mediaan 52 bepaal je je mediaan door vanuit uiteinde te tellen naar binnen. Je komt op middelste cijfer (26ste en 27ste student) 14 Voorbeeld 1: Wat is de mediaan? Gegeven is de rij: 8, 8, 7, 1, 3, 2, 6, 2, 3, 4, 5, 6, 6, 6, 7, 1 , 2 15 Voorbeeld 1: Wat is de mediaan? Gegeven is de rij: 8, 8, 7, 1, 3, 2, 6, 2, 3, 4, 5, 6, 6, 6, 7, 1 , 2 Waarneming frequentie 1 2 2 3 3 2 4 1 mediaan 5 1 modus 6 4 7 2 8 2 16 Voorbeeld 2: Wat is de mediaan? Wat is de mediaan bij even waarnemingen? Getallenreeks: 1, 6, 4, 3, 2, 8, 7, 6, 12, 3 17 Voorbeeld 2: Wat is de mediaan? Bij even waarnemingen is het ideaal om +1 op te tellen Wat is de mediaan bij even waarnemingen? Getallenreeks: 1, 6, 4, 3, 2, 8, 7, 6, 12, 3 Eerst op volgorde zetten: 1, 2, 3, 3, 4, 6, 6, 7, 8, 12 omdat het ideaal is om geen even getal te hebben Middelste waarnemingsgetal = aantal waarnemingen +1 10 + 1 = 5,5e getal De middelste waarnemingsgetallen zijn 4 en 6 De mediaan is (4 + 6)/2 = 5 18 Modus De modus is de meest voorkomende waarde in de dataset. De volgende dataset heeft bijvoorbeeld een modus van 7: Note Bij kleine datasets verdient het vaak de voorkeur om een interval te rapporteren als modus 19 mean Het gemiddelde, de mediaan en de modus zullen samenvallen in unimodale oftewel normale verdelingen deze zijn symmetrisch. Dit is vaker zo in grote data sets. Bij asymmetrie wordt het gemiddelde naar de scheef getrokken meer dan de mediaan. Hierdoor kan je de vorm van een verdeling voorspellen door het gemiddelde en de mediaan te vergelijken. 20 Percentielen en kwartielen percentiel is vb 1/100 of 1/10 Het gemiddelde en de mediaan zijn speciale gevallen van een familie van parameters die bekend staan als locatieparameters. Deze beschrijvende maatregelen worden locatieparameters genoemd omdat ze kunnen worden gebruikt om bepaalde posities op de horizontale as te weergeven wanneer de verdeling van een variabele in een grafiek wordt weergegeven. In die zin "lokaliseren" de zgn locatieparameters de verdeling op de horizontale as. 21 Bijvoorbeeld, een verdeling met een mediaan van 100 bevindt zich rechts van een verdeling met een gemiddelde van 50 wanneer de twee distributies in een grafiek worden weergegeven. Andere locatieparameters zijn onder meer percentielen en kwartielen. Een percentiel is de afbakening van waarnemingen binnen een populatie in honderdste delen. Het is de waarneming die een honderdste deel van een populatie weergeeft. Een kwartiel een van de drie waarden (25ste, 50ste, 75ste) die een geordende set data, de steekproef of populatie, in vier gelijke delen opdeelt. 50ste percentiel is je mediaan 22 Percentielen * 50/100ste = 50ste kwartiel (percentiel) * middelste : 100 +1 = 50,5 modus : 120 * interkwartaal range : 25ste tot 75ste percentiel (mediaan ligt ertussen) * 120 ( 70 - 180 ) 75ste percentiel 50ste percentiel (kwartiel) 25ste percentiel 23 Spreidingsmaten Geven aan in welke mate de metingen rond het gemiddelde variëren. 1. Range of spreidingsbreedte (= bereik): van het minimum naar het maximum, dus alle waarden in dit bereik van een onderzoek. 2. Deviatie is de afstand tussen elk van de gemeten variabelen en het gemiddelde van de variabelen in een bepaald onderzoek. Standaard deviatie is het gemiddelde van de deviatie SD: 3. Variantie: 𝑆 2 4. Standaard fout (standard error)(SE) 24 Mean Student A Student B Cijfer 1: 8 Cijfer 1: 8,5 Cijfer 2: 9,5 Cijfer 2: 8,5 Cijfer 3: 7,5 Cijfer 3: 8 Cijfer 4: 8,5 Cijfer 4: 9 Cijfer 5: 9 Cijfer 5: 8.5 Gemiddelde = 8,5 Gemiddelde = 8,5 df = 4 = (n-1) 25 Spreiding/Afwijking Student A Student B X1: 8 – 8,5 = -0,5 X1: 8,5 – 8,5 = 0,0 X2: 9,5 – 8,5 = +1,0 X2: 8,5 – 8,5 = 0,0 X3: 7,5 – 8,5 = -1,0 X3: 8 – 8,5 = -0,5 X4: 8,5 – 8,5 = 0,0 X4: 9 – 8,5 = +0,5 X5: 9 – 8,5 = +0,5 X5: 8,5 – 8,5 = 0,0 Totaal = 0,0 Totaal = 0,0 Spreidingsbreedte = 9,5 – 7,5 = Spreidingsbreedte = 9,0 – 8,0 = 2,0 (grootste getal- kleinste 1,0 getal) 26 Spreiding/Afwijking Student A Student B ΔX1: (-0,5)2 = 0,25 ΔX1: (0,0)2 = 0 ΔX2: (+1,0)2 = 1,0 ΔX2: (0,0)2 = 0 optellen en delen door Df ΔX3: (-1,0)2 = 1,0 ΔX3: (-0,5)2 = 0,25 ΔX4: 0,0 = 0 ΔX4: (+0,5)2 = 0,25 ΔX5: (+0,5)2 = 0,25 ΔX5: (0,0)2 = 0 Totaal = 2,50 Totaal = 0,5 27 Gemiddelde Spreiding/Afwijking = Standaard deviatie (n-1) 28 STDEV formule STDEV2 = S2 = Variantie 29 Gausscurve 30 31 32 33 Overschrijdingskansen Ga uit van hemoglobinegehalte M=6.4 en sd=1.1 Hoeveel procent van de populatie heeft een Hb >7.8? Hoeveel procent van de populatie heeft een Hb tussen 4.8 en 7.8? (4.8