Samenvatting Quantitative Methods PDF
Document Details
Uploaded by GuiltlessReal1528
Erasmus University Rotterdam
Tags
Summary
This document is a summary of quantitative methods, including topics such as data analysis, statistics, central tendency, and probability. It provides an overview of key concepts and methods used in quantitative research.
Full Transcript
Samenvatting Quantitative Methods Inhoudsopgaven ============== [Inhoudsopgaven 1](#_Toc1083388175) [Lijst met onderwerpen 3](#_Toc2102451842) [Week 1 -- Meetniveaus en maatstaven van central tendency 4](#_Toc1663246121) [Opfrissen: steekproef versus populatie 4](#_Toc903416779) [Willekeurige...
Samenvatting Quantitative Methods Inhoudsopgaven ============== [Inhoudsopgaven 1](#_Toc1083388175) [Lijst met onderwerpen 3](#_Toc2102451842) [Week 1 -- Meetniveaus en maatstaven van central tendency 4](#_Toc1663246121) [Opfrissen: steekproef versus populatie 4](#_Toc903416779) [Willekeurige bemonstering 4](#_Toc1857895226) [NOIR-meetniveau 4](#_Toc430592160) [Waarom zijn meetniveaus belangrijk? 4](#_Toc452663668) [Gegevens samenvatten (1) 4](#_Toc649908406) [Richtlijnen voor het maken van Tabellen 5](#_Toc1778643614) [Waarom Figuren gebruiken? 5](#_Toc874131801) [Grafieken en figuren maken 5](#_Toc1434404923) [Grafieken en meetniveau 6](#_Toc1133917841) [Distributies beschrijven 6](#_Toc472291217) [Verdelingen beschrijven: centrale tendens 6](#_Toc134422291) [Centrale tendens en vormen van distributies 7](#_Toc502413230) [Samenvatting: vormen van distributies 7](#_Toc1352874819) [Week 2 -- Variabiliteit, normal distribution en het standaardiseren van gegevens 8](#_Toc1796986041) [Gegevens samenvatten (2) 8](#_Toc263907520) [Bereik 8](#_Toc1332493925) [Standaardafwijking in 7 stappen! (En bonus! Je krijgt de variantie onderweg!) 8](#_Toc806610513) [Maatregelen van variabiliteit 8](#_Toc1921217715) [De normale verdeling 9](#_Toc1127501399) [Eigenschappen van de normale verdeling: 9](#_Toc1417737488) [Gegevens standaardiseren 9](#_Toc1500900150) [Eén methode om te standaardiseren: Z-Scores 9](#_Toc48067977) [Eigenschappen van Z-scores 10](#_Toc216796852) [Opmerkingen over voorzichtigheid 10](#_Toc27327502) [Samenvatting: Z-scores 10](#_Toc503516310) [Week 3 - Kansen en waarschijnlijkheidsverdelingen, Z-tabel en van een steekproef naar een populatie 11](#_Toc996877535) [Kansen en waarschijnlijkheidsverdelingen 11](#_Toc2098735016) [Hoe zit het met andere kansen? 11](#_Toc1004462692) [De Z-tabel 11](#_Toc529441345) [Stappen van X-waarde naar waarschijnlijkheid 12](#_Toc1047365035) [Pro-tip! Waarschijnlijkheid tussen twee waarden 12](#_Toc19368972) [Normaal verdeeld 12](#_Toc451552163) [Samenvatting 12](#_Toc540390278) [Beoordeling (CLT) 13](#_Toc1152169203) [Standaardfouten (herzien) 13](#_Toc336612623) [Standaardfouten (herzien) 13](#_Toc1305969842) [Statistische gevolgtrekking 14](#_Toc2042221903) [De tirannie van CLT en kleine ns 14](#_Toc1756424339) [Hypotheses testen 15](#_Toc1700890859) [Onderzoeksvragen en hypothese 15](#_Toc1813788437) [Hypotheses formuleren - een voorbeeld 15](#_Toc977832251) [Hypotheses testen 15](#_Toc1136362631) [Wat is een nulhypothese? 16](#_Toc874092529) [Hypotheses: H 0 en H 1 16](#_Toc2083343110) [Hypotheses testen: Falsificatie 16](#_Toc1918666788) [Hypothesen testen: het uiteindelijke doel 16](#_Toc1632819910) [Hypotheses verwerpen 17](#_Toc1700127398) [Demonstreren van nulhypothesetesten 17](#_Toc1650994636) [Bereken een teststatistiek 17](#_Toc283246323) [Vind de waarschijnlijkheid 18](#_Toc456725847) [Vind de waarschijnlijkheid en verwerp de nulhypothese 18](#_Toc1567614590) [Mate van belangrijkheid 18](#_Toc1738746729) [We zijn er niet in geslaagd de nulhypothese te verwerpen! 19](#_Toc341232768) [De nadelen van p-waarde 19](#_Toc2040514338) [Soorten fouten 20](#_Toc2098161436) [Niet-/directionele hypothesen 20](#_Toc1628966446) [Samenvatting 21](#_Toc1460428576) Lijst met onderwerpen ===================== **Beschrijvende statistiek** (is het verzamelen, bewerken, interpreteren samenvatten en presenteren van de belangrijkste kenmerken van een kwantitatieve dataset) - Gegevens (data) en meetniveaus - Vormen van distributie - Central tendency (algemene drang) - Maatstaven van variabelen - Normale verdeling (normal distribution) - Z-scores **Inferentiële statistiek** (gebruikt steekproefdata om conclusies te trekken over een gehele populatie. Deze conclusies zijn statistische proposities): - Sampling en central limit theorie - Hypothese testen - T-test - Chi-squared test - Correlatie - Bivariabel lineair - Multivariatie lineaire regressie Week 1 -- Meetniveaus en maatstaven van central tendency ======================================================== Opfrissen: steekproef versus populatie -------------------------------------- - Steekproef: een kleine groep uit de populatie waarin wij geïnteresseerd zijn - ALS de steekproef representatief is voor de populatie, DAN kunnen we er een maken \"geïnformeerde gok\" over populatiewaarden op basis van steekproefwaarden Willekeurige bemonstering ------------------------- De beste manier om de steekproeffout (onzekerheid) te minimaliseren, is door een willekeurige steekproef te nemen, waarbij elk individu in de populatie een gelijke kans heeft om opgenomen te worden. NOIR-meetniveau --------------- U kunt zich het geheugensteuntje herinneren: 'n o i r' = 'zwart' in het Frans **Categorisch** - Nominaal - Ordinaal **Continu** - Interval - Verhouding ↓ Steeds grotere hoeveelheden informatie over de variabel ### Verschillende soorten meetniveaus - **Nominaal niveau:**Dit is het laagste meetniveau. De gegevens op dit niveau worden gecategoriseerd in niet-ordelijke, onderscheidbare categorieën. Voorbeelden zijn geslacht (man/vrouw), bloedgroep (A, B, AB, O), enz. Er is geen inherente volgorde tussen de categorieën. - **Ordinaal niveau:** Op dit niveau hebben de gegevens een natuurlijke ordening, maar de afstand tussen de waarden is niet bekend of betekenisvol. Voorbeelden zijn opleidingsniveau (lagere school, middelbare school, universiteit), klanttevredenheidsscores (laag, gemiddeld, hoog), enz. De verschillen tussen de waarden zijn niet uniform of meetbaar. - **Intervalniveau:** Op dit niveau hebben de gegevens een natuurlijke ordening en is de afstand tussen de waarden betekenisvol en uniform, maar er is geen absoluut nulpunt. Voorbeelden zijn temperatuur gemeten in Celsius of Fahrenheit (0 graden betekent niet dat er geen temperatuur is), IQ-scores, enz. - **Ratio niveau:** Dit is het hoogste meetniveau. Op dit niveau hebben de gegevens een natuurlijke ordening, de afstand tussen de waarden is betekenisvol en uniform, en er is een absoluut nulpunt dat aangeeft afwezigheid van de eigenschap. Voorbeelden zijn lengte, gewicht, leeftijd, inkomensniveau, enz. ### Waarom zijn meetniveaus belangrijk? - Het selecteren van de beste manieren om ze te beschrijven (bijvoorbeeld metingen van de centrale tendens) - Welke soorten analyses kunnen we doen\... Gegevens samenvatten (1) ------------------------ Je zal in staat zijn: - Beschrijf uw gegevens met tabellen en grafieken en selecteer een passende visualisatie op basis van het meetniveau van de variabele; - Selecteer een geschikte maatstaf voor de centrale tendens op basis van het meetniveau en de vorm van uw gegevens; - Beschrijf de vorm van uw gegevens op basis van grafische presentaties van gegevens en maatstaven van centrale tendens. ### Richtlijnen voor het maken van Tabellen - Titels moeten duidelijk en informatief zijn: - Zorg altijd voor een duidelijke titel - Geef tafels altijd een nummer (bijvoorbeeld Tabel 1) - Geef passende en betekenisvolle labels aan rijen en kolommen (bijvoorbeeld 'Man' en 'Vrouw', niet 'M' en 'F') - Wees voorzichtig met lay-out en formaat (wees op uw hoede voor standaardinstellingen in Word, Excel) - Raadpleeg de bron van de gegevens - Vermeld expliciet de meeteenheden (bijv. %, £, gemiddelde) - Tafels moeten 'op zichzelf staan' - Voorkomen: - Te veel decimalen - Ophoping! ### Waarom Figuren gebruiken? Figuren kunnen op een zeer economische manier veel informatie weergeven Met 'foto's' zijn trends en verschillen in veel gevallen makkelijker te ontdekken Er moeten figuren worden gebruikt om gegevens onder de aandacht te brengen 'Om de data te laten zingen' (Hans Rosling) Streef naar eenvoud in plaats van 'flitsende' graphics. - Gebruik geen 3D-effecten Er moeten verschillende cijfers worden gebruikt op basis van het type gegevens ### Grafieken en figuren maken - Net als bij tabellen moeten grafieken/figuren: - Getiteld, genummerd - Er wordt naar verwezen in de tekst - Vermeld de bron waar de gegevens vandaan komen - Zorg voor verstandige bijlen - De meeste software heeft standaardopties die verschillen accentueren\... - Goed getekend (en vrij van rommel!) - Duidelijk en kan op zichzelf staan ### Grafieken en meetniveau **Vuistregel**: als u een meetniveau op interval- of rationiveau heeft, gebruik dan een histogram **Histogrammen** - Continu gegevens - Bij ongelijke intervallen vertegenwoordigt het gebied het aantal (vergeet niet om de frequentiedichtheid op de y-as te gebruiken) - Bars raken elkaar! **Vuistregel**: Als u een nominaal of ordinaal meetniveau heeft, gebruik dan een staafdiagram Staafdiagrammen **Categorische data** - Hoogte vertegenwoordigt % of telt - Staven raken elkaar niet\... Distributies beschrijven ------------------------ 1. Centrale tendens - Gemeen - Mediaan - Modus 2. Scheefheid, voor histogrammen (d.w.z. continue variabelen) ### Verdelingen beschrijven: centrale tendens **Vuistregels**: Als u een interval- of ratio-meetniveau heeft, gebruik dan gemiddelde of mediaan **Maar welke?** - Dit is afhankelijk van of er uitschieters zijn - We moeten meer weten over de verdeling van gegevens voordat we een maatstaf kiezen! - Het gemiddelde wordt beïnvloed door uitschieters, omdat het alle waarden omvat\ \*Pas op met kleine datasets! - Mediaan alleen het middelste getal, dus niet beïnvloed door uitschieters - Als u een nominaal meetniveau heeft, gebruik dan de **modus** - Als u een ordinaal meetniveau heeft, is het mogelijk om **gemiddelde, mediaan of modus** te gebruiken ### Centrale tendens en vormen van distributies ### Central tendency definitie Central tendency, in het Nederlands ook wel centrale neiging genoemd, verwijst naar de centrale, typische, of gemiddelde waarde die een set van gegevens probeert te beschrijven. Het geeft aan waar de \"gemiddelde\" waarde in de gegevens zich bevindt. Er zijn verschillende maatstaven voor central tendency, waarvan de meest voorkomende zijn: - **Gemiddelde (Mean):** - Het gemiddelde is de som van alle waarden in een dataset gedeeld door het aantal waarden. - Het wordt vaak gebruikt voor interval- en ratio-gegevens. - Berekening: *Gemiddelde=Som van waardenAantal waarden*Gemiddelde=Aantal waardenSom van waarden. - **Mediaan (Median):** - De mediaan is het middelste getal van een gesorteerde lijst van waarden. - Het wordt minder beïnvloed door extreme waarden dan het gemiddelde en is geschikt voor ordinaal, interval- en ratio-gegevens. - Als de dataset een even aantal waarden heeft, is de mediaan het gemiddelde van de twee middelste waarden. - **Modus (Mode):** - De modus is de waarde die het vaakst voorkomt in een dataset. - Het kan meerdere modi hebben (unimodaal, bimodaal, multimodaal) of helemaal geen modus als alle waarden uniek zijn. - Geschikt voor nominaal, ordinaal, interval- en ratio-gegevens. Elke maat voor central tendency heeft zijn eigen toepassingsgebied en is geschikt voor verschillende soorten gegevens. Het hangt af van de aard van de dataset en het doel van de analyse welke maat het meest geschikt is om een representatieve centrale waarde te bepalen. Het is ook belangrijk om te onthouden dat geen enkele maat perfect is, en het is vaak nuttig om meerdere maten te gebruiken om een vollediger beeld van de centrale tendens te krijgen. ### Samenvatting: vormen van distributies ![](media/image2.png) **Normale distributie (Gaussische distributie of klokkromme):** De normale distributie is symmetrisch en heeft een karakteristieke klokvormige curve. Het merendeel van de gegevens bevindt zich rond het gemiddelde, met een afname van frequentie naarmate je verder van het gemiddelde gaat. Veel natuurlijke fenomenen vertonen een normale distributie, zoals lengte, gewicht, IQ-scores, etc. **Scheve (skewed) distributie:** Een scheve distributie heeft een niet-symmetrische vorm. Positief scheef betekent dat de staart aan de rechterkant langer is, terwijl negatief scheef betekent dat de staart aan de linkerkant langer is. Bijvoorbeeld, als de meeste mensen in een populatie een lager inkomen hebben en een klein percentage een zeer hoog inkomen, kan dit een negatief scheve distributie veroorzaken. **BI-modal distributie:** Een bimodale distributie is een statistische verdeling die twee duidelijk onderscheiden pieken of modi heeft. In andere woorden, de gegevens in een bimodale distributie vertonen twee verschillende centrale tendensen, waardoor er twee prominente groepen of clusters van waarden ontstaan. Deze pieken kunnen symmetrisch of asymmetrisch zijn. Een klassiek voorbeeld van een bimodale distributie is het geval waarin er twee subpopulaties zijn met verschillende eigenschappen, en wanneer de gegevens worden samengevoegd, ontstaat er een distributie met twee modi. Week 2 -- Variabiliteit, normal distribution en het standaardiseren van gegevens ================================================================================ Gegevens samenvatten (2) ------------------------ Nog meer rommelen met onze drie variabelen voor variabiliteit: - Bereik; - Variantie; En - Standaardafwijking. ### Bereik Het bereik (**range**) is het interval tussen de laagste en de hoogste waarde in de dataset \+ Eenvoudig te berekenen − Alleen de kleinste en grootste waarden dragen bij − Gevoelig voor extreme waarden ### Standaardafwijking in 7 stappen! (En bonus! Je krijgt de variantie onderweg!) ### Maten van variabiliteit **Bereik**: afstand tussen de kleinste en grootste waarde van uw gegevens \+ Eenvoudig te berekenen − Alleen de kleinste en grootste waarden dragen bij − Gevoelig voor extreme waarden **Variantie**: gemiddelde kwadratische afwijking van het gemiddelde \+ Alle waarden dragen bij \+ Bestraft grotere afwijkingen − Moeilijk te interpreteren (eenheden2) **Standaarddeviatie**: gemiddelde afwijking van het gemiddelde \+ Alle waarden dragen bij \+ Gemakkelijker te interpreteren dan de variantie (eenheden) #### Verschillende maten van variabelen Maten van variabiliteit geven aan in welke mate de waarden van een variabele verspreid zijn rond de centrale tendens. Hier zijn enkele veelgebruikte maten van variabiliteit: - **Bereik (Range):** - De eenvoudigste maat van variabiliteit, het bereik, is het verschil tussen de hoogste en laagste waarden in een dataset. - Berekening: *Bereik=Hoogste waarde−Laagste waarde*Bereik=Hoogste waarde−Laagste waarde. - **Variantie (Variance):** - De variantie meet de gemiddelde kwadratische afwijking van elk datapunt tot het gemiddelde van de dataset. - Hoe hoger de variantie, hoe meer spreiding er is in de gegevens. - Berekening: *Variantie=∑(Waarde−Gemiddelde)2/Aantal waarden* - **Standaardafwijking (Standard Deviation):** - De standaardafwijking is de vierkantswortel van de variantie. - Het geeft een maat voor de gemiddelde afstand van elke waarde tot het gemiddelde. - Berekening: *Standaardafwijking=* √ *Variantie*. - **Variantiecoëfficiënt (Coefficient of Variation, CV):** - De variantiecoëfficiënt is de standaardafwijking als percentage van het gemiddelde. - Het wordt gebruikt om de relatieve spreiding van gegevens te meten. - Berekening: *CV=(StandaardafwijkingGemiddelde)×100*CV=(GemiddeldeStandaardafwijking )×100. De keuze van de meest geschikte maat van variabiliteit hangt af van de aard van de gegevens en het doel van de analyse. Het helpt bij het begrijpen van de mate van dispersie of spreiding van de gegevenspunten rond de centrale tendens. De normale verdeling -------------------- ### Eigenschappen van de normale verdeling: - De normale verdeling wordt beschreven door 𝜇 en 𝜎 - Het is symmetrisch - Het gemiddelde en de mediaan zijn hetzelfde - De staarten zijn asymptotisch (in het Engels: ze naderen nul) ### Definitie Een normale distributie, ook wel bekend als de Gaussische distributie of klokkromme, is een wiskundige verdeling van een continue variabele waarbij de meeste waarden zich concentreren rond het gemiddelde, en de rest van de waarden symmetrisch verdeeld zijn aan beide zijden van het gemiddelde. De vorm van de normale distributie wordt gekenmerkt door een klokvormige curve. Kenmerken van een normale distributie zijn: - **Symmetrie:** De curve is symmetrisch rond het gemiddelde, wat betekent dat de helft van de waarden zich aan de linkerkant en de andere helft aan de rechterkant van het gemiddelde bevindt. - **Centrale tendens:** Het gemiddelde, de mediaan en de modus (het meest voorkomende getal) vallen samen en bevinden zich in het midden van de distributie. - **Standaardafwijking:** De spreiding van de waarden wordt beïnvloed door de standaardafwijking. Een grotere standaardafwijking resulteert in een bredere curve, terwijl een kleinere standaardafwijking leidt tot een smallere curve. - **68-95-99.7 Regel:** Ongeveer 68% van de waarden bevindt zich binnen één standaardafwijking van het gemiddelde, 95% binnen twee standaardafwijkingen, en 99.7% binnen drie standaardafwijkingen. De normale distributie komt in veel natuurlijke fenomenen voor, zoals lengte, gewicht, intelligentie, enz. De centrale limietstelling, een belangrijk concept in de statistiek, stelt dat als je voldoende willekeurige variabelen toevoegt, hun som of gemiddelde zal convergeren naar een normale distributie, zelfs als de oorspronkelijke variabelen niet normaal verdeeld zijn. Gegevens standaardiseren ------------------------ Je zal in staat zijn: beschrijf de eigenschappen van z-scores; een z-score berekenen en interpreteren; bereken 'x-waarden' op basis van een z-score; het concept van standaardisatie toepassen om ongelijkheid te vergelijken. ### Eén methode om te standaardiseren: Z-Scores Trek het gemiddelde af van de waarde van een waarneming en deel dit door de standaarddeviatie **De (magische) formule van de Z-score** Z = (X - 𝜇)/ 𝜎 De Z-score voor een observatie (Z) bereken je zo: - Neem de waarde van de observatie (𝜇) - Trek hiervan het gemiddelde (X) af - Deel dit getal door de standaardafwijking (𝜎) Hierdoor wordt de waarde van een waarneming omgezet in een 'Z-score' Een variabele waarvan de waarnemingen zijn omgezet in Z-scores, wordt een gestandaardiseerde variabele genoemd De meeteenheden van een gestandaardiseerde variabele zijn standaarddeviaties #### Z-scores: definitie Z-scores, ook wel standaardscores genoemd, zijn een manier om de positie van een individuele gegevenswaarde in een gegevensverzameling te kwantificeren in termen van standaardafwijkingen van het gemiddelde. Een z-score geeft aan hoeveel standaardafwijkingen een specifieke waarde verwijderd is van het gemiddelde van de gegevensverzameling. De z-score geeft informatie over hoe ver een specifieke waarde afwijkt van het gemiddelde, gemeten in standaardafwijkingen. Hier zijn enkele belangrijke punten met betrekking tot z-scores: - **Interpretatie:** - Een z-score van 0 geeft aan dat de waarde precies gelijk is aan het gemiddelde. - Positieve z-scores duiden op waarden boven het gemiddelde, terwijl negatieve z-scores duiden op waarden onder het gemiddelde. - **Standaardeenheden:** - De z-score wordt uitgedrukt in standaardeenheden, waardoor het gemakkelijk is om de positie van een waarde te vergelijken in verschillende gegevensverzamelingen, zelfs als ze verschillende meeteenheden hebben. - **Normalisatie:** - Z-scores worden vaak gebruikt bij statistische analyses om gegevens te normaliseren, zodat vergelijkingen tussen verschillende datasets mogelijk zijn. - **Uitschieters identificeren:** - Z-scores kunnen ook worden gebruikt om uitschieters (extreme waarden) in een dataset te identificeren. Waarden met een z-score verder dan een bepaalde grens (bijvoorbeeld ±3) worden vaak beschouwd als uitschieters. Z-scores zijn nuttig bij het begrijpen van de relatieve positie van individuele gegevenspunten ten opzichte van de gemiddelde en spreiding van de gegevensverzameling. Ze worden veel gebruikt in statistiek, data-analyse en bij het interpreteren resultaten van gestandaardiseerde tests. ### Eigenschappen van Z-scores Meet het aantal standaarddeviaties dat een waarneming afwijkt van het gemiddelde Positieve Z: Waarneming is groter dan het gemiddelde Negatieve Z: Waarneming is kleiner dan het gemiddelde Nul Z: Waarneming is gelijk aan het gemiddelde De meeste Z-scores liggen tussen -2 en +2 (uitgaande van een normale verdeling) - Waarden boven deze limieten worden behandeld als uitschieters - Als ze hoger of lager zijn dan dit, is dat geen probleem, maar het is de moeite waard om dit nogmaals te controleren Een gestandaardiseerde variabele heeft: Gemiddelde = 0 SD = 1 ### Opmerkingen over voorzichtigheid Kunnen we met gestandaardiseerde variabelen (z-scores) twee willekeurige contexten vergelijken? - Sommigen zouden nee zeggen! Is iemand in het ene land met \$200 per week (z-score van 1,5) echt beter af dan iemand met \$1000 per week (z-score van 1) in een ander land? - Wat is belangrijker: absolute of relatieve rijkdom? - Uiteindelijk zijn dit eerder filosofische dan statistische vragen Datatransformatie gebeurt alleen goed als het passend is en over de implicaties is nagedacht ### Samenvatting: Z-scores Z-scores meten simpelweg 'SD weg van het gemiddelde' Z-score altijd uitgedrukt in standaardafwijkingen (eenheden) - We kunnen verschillende distributies vergelijken\... - \... en we kunnen indices bouwen door verschillende z-scores bij elkaar op te tellen! Week 3 - Kansen en waarschijnlijkheidsverdelingen, Z-tabel en van een steekproef naar een populatie =================================================================================================== Kansen en waarschijnlijkheidsverdelingen ---------------------------------------- ### Samenvatting Met behulp van de 'Empirische regel' kunnen we de normale verdeling gebruiken om het percentage, de proportie of de waarschijnlijkheid te berekenen dat uitkomsten plaatsvinden ### Hoe zit het met andere kansen? Het is duidelijk dat we in de meeste gevallen geïnteresseerd zullen zijn in kansen voor waarden die niet perfect overeenkomen met 1 of 2 standaarddeviaties. Maar\... - Z-scores worden uitgedrukt in standaardafwijkingen - En jij weet hoe je X-scores om kunt zetten naar Z-scores! - Dus gewapend met een Z-score en een handige tabel (volgende dia & op Canvas), kun je de overeenkomstige waarschijnlijkheid vinden voor elke waarde van een variabele die\ \~ Normaal verdeeld! De Z-tabel ---------- Je zal in staat zijn: beschrijf de relatie tussen de z-tabel en de normale verdeling; gebruik de z-tabel om kansen boven, onder en tussen waarden in de normale verdeling te vinden; ### Stappen van X-waarde naar waarschijnlijkheid ![](media/image4.png) 1\. Standaardiseer de X-waarde: Bereken de Z-score. Hoeveel standaardafwijkingen boven/onder het gemiddelde? 2\. Welk deel onder de curve moeten we vinden? Het aandeel groter dan of kleiner dan de Z-score? De verhouding tussen twee Z-scores? - Een tekening maken helpt! 3\. Zoek de waarschijnlijkheid in de tabel #### Pro-tip! Waarschijnlijkheid tussen twee waarden Controleer altijd dezelfde richting: 2x naar rechts, of 2x naar links! Logische test: \- Is de waarschijnlijkheid plausibel? (bijvoorbeeld tussen 0 en 1) \- Klopt de waarschijnlijkheid gezien het beeld dat je hebt getekend? ### Normaal verdeeld \*\* Onthoud dat deze waarschijnlijkheidsberekeningen ervan uitgaan dat de variabele normaal verdeeld is! Waarschuwing: niet elke variabele is normaal verdeeld! Inspecteer uw variabele (histogram) visueel voordat u Z-scores gebruikt om kansen te berekenen ### Samenvatting Gewapend met een normale verdeling, het gemiddelde en de standaardafwijking ervan, en een Z-tabel, kunnen we nu de waarschijnlijkheid berekenen dat welke uitkomst dan ook plaatsvindt! Drie eenvoudige stappen: 1\. Bereken Z-score (standaardiseer de X-waarde) 2\. Maak een tekening: Welk deel onder de curve moeten we vinden? 3\. Zoek de waarschijnlijkheid in de tabel Beoordeling (CLT) ----------------- De steekproefverdeling is de verdeling van de steekproefgemiddelden (of proporties) van alle mogelijke steekproeven Volgens de Centrale Limietstelling: 1. Het gemiddelde van de steekproefverdeling is ongeveer gelijk aan het populatiegemiddelde (of proportie) 2. De steekproefverdeling is Normaal 3. De standaardfout is de standaardafwijking van de steekproefverdeling ### Central limit theorem en sampling definitie **Sampling (Steekproeftrekking):**\ Sampling verwijst naar het proces waarbij een deel (steekproef) wordt genomen uit een grotere populatie om conclusies te trekken over de hele populatie. In veel gevallen is het onpraktisch of onmogelijk om gegevens van een volledige populatie te verzamelen, dus wordt een steekproef gebruikt om generaliseerbare informatie te verkrijgen. Er zijn verschillende methoden voor het nemen van steekproeven, waaronder willekeurige steekproeftrekking, systematische steekproeftrekking, enz. **Central Limit Theorem (CLT):**\ Het Central Limit Theorem is een fundamenteel concept in de statistiek dat de eigenschappen van de som of het gemiddelde van een groot aantal onafhankelijke, identiek verdeelde willekeurige variabelen beschrijft, ongeacht de oorspronkelijke verdeling van de variabelen zelf. Het CLT stelt het volgende: - Wanneer je steekproeven trekt uit een populatie en de grootte van deze steekproeven toeneemt, zal de verdeling van de steekproefgemiddelden benaderend normaal worden, ongeacht de oorspronkelijke verdeling van de populatie. - De vorm van deze normale verdeling wordt bepaald door de populatieverdeling en wordt nauwkeuriger naarmate de steekproefgrootte toeneemt. Het is belangrijk op te merken dat het CLT van toepassing is, zelfs als de oorspronkelijke populatieverdeling niet normaal is. Dit is een krachtige eigenschap omdat het betekent dat we vaak normale verdelingen kunnen gebruiken om statistische inferenties te maken, zelfs als we niet weten hoe de populatie is verdeeld. In de context van steekproeven betekent het CLT dat als we herhaaldelijk steekproeven nemen van een populatie en het gemiddelde van elke steekproef berekenen, dan zullen de steekproefgemiddelden zelf benaderend normaal verdeeld zijn, ongeacht de oorspronkelijke verdeling van de populatie. Dit maakt het mogelijk om inferenties te maken over populatieparameters op basis van de verdeling van steekproefstatistieken, zoals het gemiddelde, zelfs als we de vorm van de populatieverdeling niet exact kennen. ### Standaardfouten (herzien) We kunnen standaardfouten heel eenvoudig berekenen met behulp van voorbeeldstatistieken SEm = s/√n s -- de standaardafwijking van de steekproef\ n -- de grootte van de steekproef SD in de teller: Als de variabiliteit in de steekproef enorm is, heeft de populatie waarschijnlijk ook een hoge variabiliteit, dus zal er meer variabiliteit zijn in de steekproefgemiddelden (grotere SE). We delen door de wortel van N: hoe groter mijn steekproef is, hoe dichter het gemiddelde bij het populatiegemiddelde moet komen (minder variabiliteit in de steekproefverdeling, dat wil zeggen kleinere SE). ### Standaardfouten (herzien) We kunnen standaardfouten heel eenvoudig berekenen met behulp van voorbeeldstatistieken Voor een deel: ![](media/image6.png) Opnieuw delen we door n: hoe groter mijn steekproef is, hoe dichter het gemiddelde bij de populatieaandeel moet komen (minder variabiliteit in de steekproefverdeling, d.w.z. kleinere SE). ### Statistische gevolgtrekking Als we observaties willen generaliseren naar een populatie\... - Neem één monster - Wat kan er over de hele bevolking worden gezegd? De voorbeeldstatistiek is misschien precies goed\...\ \... maar het kan dichtbij zijn, of het kan totaal WaCkY zijn! Het gemiddelde van elk van de steekproeven die we nemen zal ons een ander antwoord opleveren -- wat niet het populatiegemiddelde zal zijn (meestal) We zullen nooit weten of ons steekproefgemiddelde juist is\...\ Statistici hebben het bijna altijd bij het verkeerde eind! \...maar we weten hoe waarschijnlijk het is dat we het bij het verkeerde eind hebben! De standaardfout is de sleutel om te begrijpen hoe fout we zouden kunnen zijn\... ### De tirannie van CLT en kleine ns Om de centrale limietstelling te kunnen waarmaken, moet de grootte (n) van elk van de monsters 30 of groter zijn Het kan moeilijk zijn om kleine groepen met willekeurige steekproeven te onderzoeken: - Studentenenquête: - Geslacht niet-binair: n = 9 - Grote uitgebreide families (neven \> 40): n = 12 - Europees sociaal onderzoek: - Bepaalde minderheidsgroepen of geboortelanden (2016): Indonesië: n = 10 Somalië: n = 16 Eén oplossing: overbemonstering + gewichten - **Gewapend met deze kennis kunnen we nu conclusies trekken over populaties op basis van steekproeven!** Hypotheses testen ----------------- Je zal in staat zijn: - Het formuleren van de bijbehorende nul- en onderzoekshypotheses voor een gegeven onderzoeksvraag; - Onderscheid maken tussen directionele en niet-directionele hypothesen; - Gebruik de juiste terminologie en wiskundige notatie voor het formuleren en beoordelen van een hypothese. - Gebruik de steekproefverdeling om p-waarden te vinden en het significantieniveau te beoordelen; - Type I- en Type II-fout definiëren ### Onderzoeksvragen en hypothese **Onderzoeksvraag**: de kern van elk onderzoeksproject. - Formuleert je onderzoeksprobleem - Begeleidt het formuleren van uw hypothese **Hypothese**: de verwachtingen van onderzoekers over een populatie - Vertaal de onderzoeksvraag naar een toetsbare vorm - Geformuleerd als statement ### Hypotheses formuleren - een voorbeeld Onderzoeksvraag: Verdienen hoogopgeleide vrouwen minder dan hoogopgeleide mannen? Hypothese: Het inkomen van hoogopgeleide vrouwen verschilt van het inkomen van hoogopgeleide mannen. = **niet-directionele hypothese** Hypothese: Hoogopgeleide vrouwen verdienen minder dan hoogopgeleide mannen. Hypothese: Hoogopgeleide vrouwen verdienen meer dan hoogopgeleide mannen. = **directionele hypothesen** ### Hypotheses testen MAAR! Omdat we gegevens uit een steekproef hebben en niet uit de bevolking, is het onmogelijk te bewijzen dat hoogopgeleide vrouwen minder verdienen dan hoogopgeleide mannen. Omdat we deze onderzoekshypothese niet rechtstreeks kunnen testen, hebben we met behulp van de gegevens uit onze steekproef willen aantonen dat het tegenovergestelde zeer onwaarschijnlijk is. =\> we zullen een nulhypothese formuleren #### Wat is een nulhypothese? ***[GEBRUIKELIJK]***: Een representatie van geen verschil/geen associatie/geen effect. ***[ALTIJD]***: Een nulhypothese wordt altijd zo geformuleerd dat deze wederzijds exclusief is met de onderzoekshypothese. De nulhypothese wordt aangeduid als H0. De hypothese waarin we echt geïnteresseerd zijn, wordt een onderzoekshypothese of een alternatieve hypothese genoemd. De notatie voor deze hypothese is H1 of Ha. #### Hypotheses: H 0 en H 1 - H0: Verschil/associatie/effect is nul/nul (nulhypothese). - H1: Verschil/associatie/effect is anders dan/groter/kleiner dan nul (alternatieve hypothese). #### Hypotheses testen: Falsificatie In de wetenschap moeten we toetsbare hypothesen formuleren die kunnen worden gefalsificeerd. Al het andere is onwetenschappelijk. **Probleem**: We kunnen bijvoorbeeld niet bewijzen dat er een verschil bestaat tussen mannen en vrouwen in de bevolking, tenzij we de hele bevolking "bemonsteren". **Oplossing**: We voeren dit kleine schakeltrucje uit en testen een nulhypothese: wat is de kans dat we dit verschil in onze steekproef vinden, als er geen verschil is in de populatie? Wat is de waarschijnlijkheid van de steekproefstatistiek GEGEVEN dat de nulhypothese waar is, p(data\|H0) #### Hypothesen testen: het uiteindelijke doel - We proberen uitspraken te doen over de bevolking - Ons doel is altijd om de nulhypothese te verwerpen (= aantonen dat het ZEER onwaarschijnlijk is dat er geen verschil/associatie/effect is in de populatie) ### Hypotheses verwerpen Als we ontdekken dat onze gegevens onder H0 zeer onwaarschijnlijk zijn, Dan verwerpen we H0 - Dit suggereert dat er mogelijk een effect is in de populatie, H1 wordt dus ondersteund. - We gaan echter niet zo ver dat we zeggen dat we H1 accepteren. Er is altijd onzekerheid bij het doen van beweringen over de populatie op basis van een steekproef (onthoud: steekproefvariabiliteit, de standaardfout) **Waarom is H 0 de beste keuze?** - Wetsvoorbeeld: "Vermoeden van onschuld" = men wordt als onschuldig beschouwd tenzij schuld bewezen is - Laten we aannemen dat H0 waar is en proberen bewijs te vinden dat een dergelijke situatie hoogst onwaarschijnlijk is. =\> ons doel is om de nulhypothese te verwerpen ### Demonstreren van nulhypothesetesten We tekenen de steekproefverdeling, met het gemiddelde van de nulhypothese in het midden en de standaardfout als standaarddeviatie ### Bereken een teststatistiek Teststatistiek = een gestandaardiseerde vorm van onze waargenomen waarde (een beetje zoals een Z-score) **Voorbeeld**. - H0: Er is geen verschil in het inkomen van hoogopgeleide vrouwen en mannen, dat wil zeggen het verschil tussen het inkomen van hoogopgeleide vrouwen en hoogopgeleide mannen is = 0 We hebben onze steekproef verkend en vastgesteld dat hoogopgeleide mannen gemiddeld verdienen € 10.000 meer dan hun vrouwelijke tegenhangers (per jaar). =\> standaardiseer deze voorbeeldstatistiek (volgende week!) #### Vind de waarschijnlijkheid Wij gaan op zoek naar\... - de kans op het trekken van een steekproef waarbij het gemiddelde inkomensverschil tussen hoogopgeleide vrouwen en mannen minstens zo extreem is als bij ons (€ 10.000), terwijl het klopt dat er geen inkomensverschil is tussen hoogopgeleide vrouwen en mannen in de bevolking. - = P-waarde Meer in het algemeen: de waarschijnlijkheid dat de waargenomen of extremere waarde wordt gevonden (dat wil zeggen in de staart(en) van de steekproefverdeling) als de nulhypothese waar is. Hoe verder de gestandaardiseerde teststatistiek (t\... volgende week!) van het gemiddelde afwijkt (en verder in de staart zit), hoe kleiner de kans is dat we ooit een steekproef zouden trekken waarin we zo\'n gemiddelde waarde zouden vinden (€ 10.000) als de H0 waar zou zijn, p(𝛥𝜇\|H0). #### Vind de waarschijnlijkheid en verwerp de nulhypothese Wat betekent p = 0,0968? - Als er geen verschil is tussen het inkomen van hoogopgeleide vrouwen en mannen in de bevolking (H0), hebben we ongeveer 9,6% kans dat we willekeurig een steekproef trekken waarbij het gemiddelde verschil tussen het inkomen van hoogopgeleide vrouwen en mannen € 10.000 of hoger. - Hoe kleiner de P-waarde, hoe sterker het bewijs tegen H0. - Moeten we de nulhypothese verwerpen? #### Mate van belangrijkheid Betekenisniveau (α-niveau): Een drempel voor het verwerpen van een nulhypothese. Een algemeen aanvaarde p-waarde waaronder het acceptabel is om de nulhypothese te verwerpen. De norm is α = 0,05. Verwerp H0 als p \< α We kunnen H0 verwerpen als de kans op het waarnemen van een statistiek minstens zo extreem is als de H0 waar is als p kleiner is dan 5%. Moeten we H0 dus verwerpen als p = 0,0968? Nee! De kans op een inkomensverschil van € 10.000 (zelfs als het gemiddelde verschil in de bevolking € 0 is) is te groot om H0 te verwerpen. #### We zijn er niet in geslaagd de nulhypothese te verwerpen! Als we vinden dat de gegevens zeer waarschijnlijk onder H0 liggen, slagen we er niet in om H0 te verwerpen - We hebben geen bewijs dat er een verschil is in de populatie - Dit zou kunnen betekenen dat er geen verschil is in de populatie, OF dat we niet genoeg macht hebben om een effect te vinden dat wel bestaat in de populatie - Onze steekproef was niet groot genoeg - Het effect is te klein Daarom gaan we niet zo ver dat we zeggen: "we accepteren de nulhypothese" ### (De nadelen van) p-waarde Een p-waarde is een statistische maat die aangeeft hoe waarschijnlijk het waargenomen resultaat is als de nulhypothese waar is. De nulhypothese stelt dat er geen effect is. Als de p-waarde klein is (bijvoorbeeld \< 0,05), wordt vaak geconcludeerd dat er voldoende bewijs is om de nulhypothese te verwerpen. Het significantieniveau (*α*) bepaalt de drempelwaarde; als de p-waarde lager is dan *α*, wordt de nulhypothese vaak verworpen. Belangrijk om te onthouden: een klein p-waarde betekent niet automatisch dat het effect groot is, en andere statistische en wetenschappelijke overwegingen moeten worden meegenomen bij interpretatie. p = 0,01 dus p \< α, met α = 0,05 We zullen H0 verwerpen en concluderen dat de gegevens Ha ondersteunen. MAAR! Wanneer we de nulhypothese verwerpen, accepteren we ook het feit dat er a is 1 op 100 (p=0,01) kans dat het werkelijke verschil tussen inkomen van hoogopgeleide vrouwen en mannen inderdaad 0 is. Meer in het algemeen accepteren we met α = 0,05 een risico van maximaal 5% dat de nulhypothese wordt verworpen wanneer de nulhypothese waar is in de populatie. ### Soorten fouten Bij het testen van hypothesen kunnen we twee soorten fouten maken: **[Type I-fout (𝛼)]** - Het ten onrechte verwerpen van H0, ook al is H0 WAAR in de populatie ('False positive') - 𝛼 is de kans die we accepteren om een type I-fout te maken - Drugstesten in de sport: - H0 De sporter gebruikt geen prestatiebevorderende medicijnen - Type I-fout: een atleet faalt voor een drugstest, ook al gebruikt hij geen doping. Bij het testen van hypothesen kunnen we twee soorten fouten maken: ***Type II-fout (𝛽)*** - Het niet kunnen verwerpen van H0, ook al is H0 NIET WAAR in de populatie ('False-negatief') - Drugstesten in de sport: - H0 De sporter gebruikt geen prestatiebevorderende middelen - Type II-fout: Lance Armstrong Het niet kunnen verwerpen van H0, ook al is H0 NIET WAAR in de populatie ('False-negatief') We weten niet hoe waarschijnlijk het is dat we een Type II-fout maken, omdat dit afhangt van de effectgrootte in de populatie! Vuistregel: De kans op het maken van een Type II-fout neemt af als: - Het effect in de populatie is groot - Uw steekproefomvang is groot ### Niet-/directionele hypothesen Als je een niet-directionele hypothese hebt, wordt deze 𝛼 = 0,05 verdeeld over beide staarten van de waarschijnlijkheidsverdeling. Als je een directionele hypothese hebt, bevindt deze 𝛼 = 0,05 zich allemaal aan één kant van de verdeling. ![](media/image8.png) Met een eenzijdige test heb je meer macht om een nulhypothese te verwerpen als het effect in de verwachte richting is. Maar je hebt niet de macht om de nul te verwerpen als het effect in de tegenovergestelde richting is Samenvatting ------------ - Het testen van hypothesen ligt ten grondslag aan een groot deel van de wetenschap - Met behulp van steekproeven uit populaties en hypothesetoetsen op deze gegevens kunnen we ontdekken wat er in de populatie gebeurt - Het testen van hypothesen helpt ons ook om te beslissen of een steekproef waarschijnlijk uit een bepaalde populatie komt of dat een steekproef echt verschilt van de populatie - Door het testen van hypothesen kunnen we tot een besluit komen op basis van bewijsmateriaal uit de steekproefgegevens, maar we moeten ons altijd bewust zijn van mogelijke fouten in onze conclusies: - Type I, 'valse positieven' - Type II, 'valse negatieven Week 4 -- T-distribution en Hypothese testen ============================================ Standaard normale verdeling --------------------------- Als we het (populatie)gemiddelde en de standaarddeviatie van een normaal verdeelde variabele kennen, kunnen we deze standaardiseren (dat wil zeggen transformeren in een \'Z-score\') en de standaard normale verdeling gebruiken om te zeggen hoe waarschijnlijk een waarde zou kunnen zijn (dat wil zeggen de waarschijnlijkheid van het vinden van enige waarde) Z-scores en de normale verdeling -------------------------------- Waarom gebruiken we deze? - Om de positie van elk datapunt in de distributie te begrijpen Wat kunnen we ermee doen? - Om de positiegegevenspunten in verschillende distributies te vergelijken - Onthoud: student in Groot-Brittannië versus student in Argentinië (lezing 2) - Weten hoe gebruikelijk een waarde is (De 'Empirische Regel', Lezing 2 & 3) Wanneer kunnen we ze gebruiken? - Wanneer we een ongeveer normaal verdeelde variabele hebben - Beschrijvende statistieken (steekproef; populatie, als populatieparameters (μ, 𝜎) bekend zijn!) Van beschrijvende naar inferentiële statistiek ---------------------------------------------- Maar wat gebeurt er als de populatieparameters onbekend zijn? - In de meeste gevallen worden populatieparameters μ, 𝜎 niet waargenomen - We hebben slechts één steekproef en de bijbehorende statistieken: \"𝑋 en s\... \... hieruit moeten we afleiden (of raden) over de populatie. Hoe denken we dat de populatie eruitziet, gegeven onze steekproef? Centrale limietstelling: 1\. Het gemiddelde van de steekproefverdeling is ongeveer gelijk aan het populatiegemiddelde (of proportie) M \~ 𝜇 2\. De steekproefverdeling is normaal 3\. De standaardfout is de standaardafwijking van de steekproefverdeling - Gewapend met deze kennis kunnen we onze voorbeeldstatistieken gebruiken om conclusies te trekken over populaties! De t-verdeling -------------- Je zal in staat zijn: Voer onafhankelijke steekproef-t-tests uit; de resultaten van t-toetsen met één en twee steekproeven rapporteren en interpreteren; de resultaten interpreteren van t-tests uitgevoerd in SPSS. ### Voorbeeld - Stel je voor dat ik je vertel dat het gemiddelde cijfer voor ALLE studenten vorig jaar een 7,3 was. Je bent hier niet zeker van, dus vraag je het (willekeurig) aan 30 oud-studenten en ontdek dat het gemiddelde van hun cijfers \"𝑋 = 7 en s = 0,9 was - Hoe waarschijnlijk is het dat je deze steekproef hebt getrokken, met \"𝑋 = 7 en s = 0,9, als het gemiddelde cijfer voor alle leerlingen 7,3 (μ) was? - Met andere woorden: hoe waarschijnlijk is het dat het gemiddelde cijfer daadwerkelijk een 7,3 was? Inferentie over een populatie uit een steekproef ------------------------------------------------ We weten hoe we de waarschijnlijkheid kunnen berekenen dat we een bepaalde waarde vinden, gegeven een normale verdeling met een bepaald gemiddelde en een bepaalde standaarddeviatie. Als de toets scores bijvoorbeeld normaal verdeeld zijn, hoe waarschijnlijk is het dan dat u deze steekproef hebt getrokken, met \'X = 7 en s = 0,9, als het gemiddelde cijfer voor alle leerlingen 7,3 (μ) was? Laten we het even hebben over de wijze waarop we deze vraag zullen beantwoorden, aangezien we slechts deze ene steekproef hebben, maar we willen conclusies trekken over de populatie. Om dit te doen, zullen we hypothesen moeten formuleren en testen. Hypotheses testen ----------------- Je zal in staat zijn: - Het formuleren van de bijbehorende nul- en onderzoekshypotheses voor een gegeven onderzoeksvraag; - Onderscheid maken tussen directionele en niet-directionele hypothesen; - Gebruik de juiste terminologie en wiskundige notatie voor het formuleren en beoordelen van een hypothese. - Gebruik de steekproefverdeling om p-waarden te vinden en het significantieniveau te beoordelen; - Type I- en Type II-fout definiëren. Onderzoeksvragen en hypothese ----------------------------- Onderzoeksvraag: de kern van elk onderzoeksproject. - Formuleert je onderzoeksprobleem - Begeleidt het formuleren van uw hypothese Hypothese: de verwachtingen van onderzoekers over een populatie - Vertaal de onderzoeksvraag naar een toetsbare vorm - Geformuleerd als statement ### Hypotheses formuleren - een voorbeeld Onderzoeksvraag: Als de toetsscores normaal verdeeld zijn, hoe waarschijnlijk is het dan dat u deze steekproef hebt getrokken, met \'X = 7 en s = 0,9, als het gemiddelde cijfer voor alle leerlingen 7,3 (μ) was? Hypothese: Het gemiddelde cijfer wijkt af van een 7,3.\ = niet-directionele hypothese Hypothese: Het gemiddelde cijfer is lager dan een 7,3.\ Hypothese: Het gemiddelde cijfer ligt hoger dan een 7,3.\ = directionele hypothesen Hypotheses testen ----------------- MAAR! Omdat we gegevens uit een steekproef hebben en niet uit de populatie, is het onmogelijk om te bewijzen dat het cijfer anders/hoger/lager is dan een 7,3. Omdat we deze onderzoekshypothese niet direct kunnen testen, hebben we met behulp van de gegevens uit onze steekproef willen aantonen dat het tegendeel zeer onwaarschijnlijk is. =\> we zullen een nulhypothese formuleren ### Hypotheses testen: Falsificatie In de wetenschap moeten we toetsbare hypothesen formuleren die kunnen worden gefalsificeerd. Al het andere is onwetenschappelijk. Probleem: We kunnen bijvoorbeeld niet bewijzen dat er een verschil bestaat tussen mannen en vrouwen in de bevolking, tenzij we de hele bevolking "bemonsteren". Oplossing: We voeren dit kleine schakeltrucje uit en testen een nulhypothese: wat is de kans dat we dit verschil in onze steekproef vinden, als er geen verschil is in de populatie? Wat is de waarschijnlijkheid van de steekproefstatistiek GEGEVEN dat de nulhypothese waar is, p(data\|H0) - Ons doel is altijd om de nulhypothese te verwerpen (= aantonen dat het ZEER onwaarschijnlijk is dat er geen verschil/associatie/effect is in de populatie) Hypotheses verwerpen -------------------- Als we ontdekken dat onze gegevens onder H0 zeer onwaarschijnlijk zijn, Dan verwerpen we H0 - Dit suggereert dat er mogelijk een effect is in de populatie, H1 wordt dus ondersteund. - We gaan echter niet zo ver dat we zeggen dat we H1 accepteren. Er is altijd onzekerheid bij het doen van beweringen over de populatie op basis van een steekproef (onthoud: steekproefvariabiliteit, de standaardfout) #### De nulhypothese verwerpen? Hoe? Weet u nog de steekproefverdeling? De CLT zegt: ongeacht de vorm van de verdeling van de variabele in de populatie, als de omvang, n, van elk van de steekproeven ongeveer 30 of meer bedraagt: 1\. Het gemiddelde van de steekproefverdeling zal (ongeveer) gelijk zijn aan het populatiegemiddelde 2\. De vorm van de steekproefverdeling van het gemiddelde zal ongeveer normaal zijn 3\. De standaardfout is de standaardafwijking van de steekproefverdeling College 4 videoclip 1 --------------------- Hoe waarschijnlijk is het dat het gemiddelde cijfer daadwerkelijk een 7,3 was? Stappen voor een t-test met één monster 1\. Formuleer een hypothese, nu over de (niet-geobserveerde) populatie H0: μ0 = 7,3 H1: μ0 ≠ 7,3 2\. Bereken de teststatistiek, gebaseerd op de steekproefverdeling 𝑡 = \"𝑋 − 𝜇! 𝑆𝐸\" 3\. Vind de kritische waarde voor uw 𝛼 4\. Vergelijk de teststatistiek met de kritische waarde en trek een conclusie #### Niet-directionele hypothesen Als je een niet-directionele hypothese hebt, wordt de 𝛼 = 0,05 verdeeld over beide staarten van de waarschijnlijkheidsverdeling. #### Directionele hypothesen Als je een directionele hypothese hebt, bevindt deze 𝛼 = 0,05 zich allemaal aan één kant van de verdeling #### Niet-/directionele hypothesen Als je een niet-directionele hypothese hebt, wordt de 𝛼 = 0,05 verdeeld over beide staarten van de waarschijnlijkheidsverdeling. Als je een directionele hypothese hebt, bevindt deze 𝛼 = 0,05 zich allemaal aan één kant van de verdeling. Eenzijdige versus tweezijdige tests ----------------------------------- In de praktijk testen onderzoekers vaak niet-directionele hypothesen omdat: ze zijn conservatiever; als je de tweezijdige test kunt afwijzen, kun je ook een conclusie trekken over de richting van de vereniging; eenzijdige toetsing kan het vermoeden wekken dat u uw onderzoekshypothese heeft afgestemd op uw gegevens. De nadelen van p-waarde ----------------------- Als p \< α, met α = 0,05 We zullen H0 verwerpen en concluderen dat de gegevens Ha ondersteunen. MAAR! Bij het verwerpen van de nulhypothese aanvaarden we ook dat er een kans van 1 op 20 (p = 0,05) is dat het bevolkingsexamencijfer niet 7,3 is. Meer in het algemeen accepteren we met α = 0,05 een risico van maximaal 5% dat de nulhypothese wordt verworpen wanneer de nulhypothese waar is in de populatie. Een significantieniveau kiezen ------------------------------ Hoe conservatief moeten we zijn? - Volg bij twijfel de norm: α = 0,05 Maar\... het kan zijn dat we niet genoeg macht hebben om een effect te vinden dat in de populatie bestaat \- Onze steekproef was niet groot genoeg \- Het effect is te klein - Minder conservatief: α = 0,1 Of\... misschien hebben we enorme effecten of enorme steekproeven en willen we laten zien dat we EXTRA zeker zijn van onze conclusies - Conservatiever: α = 0,01 (of zelfs α = 0,001!) T-testen -------- ### Definitie en uitleg een t-test is een statistische methode die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen. Het is met name geschikt voor kleine steekproeven, waarbij de verdeling van de gegevens niet noodzakelijk normaal hoeft te zijn. De t-test is ontwikkeld door de Britse statisticus William Sealy Gosset en wordt daarom ook wel de Student\'s t-test genoemd. Er zijn verschillende varianten van de t-test, afhankelijk van het type gegevens en het doel van de analyse. Hier zijn twee veelvoorkomende typen t-tests: - **Onafhankelijke t-test:** - Deze wordt gebruikt wanneer je de gemiddelden van twee onafhankelijke, niet-gekoppelde groepen wilt vergelijken. - Bijvoorbeeld, je zou een onafhankelijke t-test kunnen gebruiken om te bepalen of er een significant verschil is in de gemiddelde scores van twee groepen studenten die verschillende onderwijsmethoden hebben gevolgd. - **Gepaarde t-test:** - Deze wordt gebruikt wanneer je de gemiddelden van twee gekoppelde (afhankelijke) groepen wilt vergelijken, zoals wanneer je dezelfde groep mensen voor en na een interventie meet. - Bijvoorbeeld, je zou een gepaarde t-test kunnen gebruiken om te bepalen of er een significant verschil is in de prestaties van studenten vóór en na een trainingsprogramma. De t-test produceert een t-waarde en een p-waarde. De t-waarde geeft de grootte van het verschil tussen de groepsgemiddelden aan, aangepast voor de variabiliteit binnen de groepen. De p-waarde geeft de kans aan om een verschil van die grootte (of groter) te verkrijgen als er in werkelijkheid geen verschil is. Als de p-waarde lager is dan een vooraf ingesteld significantieniveau (bijvoorbeeld 0,05), dan wordt het resultaat als statistisch significant beschouwd. Dit suggereert dat er voldoende bewijs is om aan te nemen dat er een echt verschil is tussen de groepen. Anders wordt het verschil als niet significant beschouwd. T-toetsen kunnen voor verschillende doeleinden worden gebruikt: - Eén-sample t-test: we hebben dit net gedaan ### T-toetsen met één monster Hoe waarschijnlijk is het dat een bepaald steekproefgemiddelde wordt gevonden, ALS het populatiegemiddelde gelijk zou zijn aan een bepaalde waarde? Bijvoorbeeld de examenvragentest die we net hebben gedaan. T-toetsen kunnen voor verschillende doeleinden worden gebruikt: - Eén-sample t-test: we hebben dit net gedaan - Onafhankelijke steekproeven t-test: vergelijking van gemiddelden van twee groepen - Afhankelijke steekproeven t-test: het vergelijken van gemiddelden van dezelfde groep, met herhaalde metingen (bijvoorbeeld waarden over de tijd) Voor al deze tests doen we een aanname: uw gegevens moeten \~normaal verdeeld zijn! ### T-test met twee steekproeven T-test van onafhankelijke monsters = t-test van twee monsters Hoe waarschijnlijk is het dat we een gemiddeld verschil in onze steekproef vinden, ALS het gemiddelde verschil in de populatie nul is? ### Aannames 1\. Continue of ordinale gegevens\ (NB voor ordinale variabelen interpreteren we ze alsof het intervalvariabelen zijn. Dit vereist een aanvullende aanname dat de stappen tussen categorieën even groot zijn) 2\. Normaal verdeeld 3\. Willekeurige bemonstering 4\. Grote steekproefomvang (20+ per groep) 5\. Varianties (s2) van de groepen moeten gelijk zijn in de populatie Deze laatste veronderstelling gaat zelden op Oplossing: SPSS biedt automatisch een test voor deze aanname: Levene\'s test, en een correctie (straf) als s2 niet gelijk is - We zullen dit zo in de praktijk zien\... Twee middelen vergelijken ------------------------- Het verschil tussen gemiddelden volgt ook een t-verdeling. Teststatistiek voor t-test van onafhankelijke monsters: Vrijheidsgraden (de straf voor het schatten) -------------------------------------------- We hebben twee steekproeven en TWEE schattingen van de variantie (één voor elke steekproef); elk 'kost' je één graad van vrijheid. Dus voor beide monsters berekenen we df = n -- 1 Vervolgens tellen we de df uit de twee groepen op = df1 + df2 df = (n1 -1) + (n2 -1) Chi-squared test ---------------- ### Definitie en uitleg Een chi-kwadraat (chi-squared) test is een statistische test die wordt gebruikt om te bepalen of er een significant verschil is tussen de verwachte frequenties en de waargenomen frequenties in een of meer categorieën. Het wordt vaak toegepast bij categorische gegevens om te beoordelen of er een significante associatie is tussen twee variabelen. Er zijn verschillende varianten van de chi-kwadraat test, afhankelijk van het type gegevens en het specifieke onderzoeksdoel. Hier zijn twee veelvoorkomende vormen: - **Chi-kwadraat test voor homogeniteit:** - Deze test wordt gebruikt om te beoordelen of de verdeling van een categorische variabele hetzelfde is over verschillende groepen. - Bijvoorbeeld, je kunt deze test gebruiken om te bepalen of de verdeling van politieke voorkeur hetzelfde is onder mannen en vrouwen. - **Chi-kwadraat test voor onafhankelijkheid:** - Deze test onderzoekt of er een onafhankelijk verband is tussen twee categorische variabelen. - Bijvoorbeeld, je kunt deze test gebruiken om te onderzoeken of er een verband bestaat tussen roken (ja/nee) en het ontwikkelen van een bepaalde ziekte (ja/nee). **Hoe werkt de chi-kwadraat test:** - Stel een nulhypothese (H0) op die aangeeft dat er geen verschil is tussen de verwachte en waargenomen frequenties. - Verzamel gegevens en organiseer ze in een zogenaamde \"waarnemingstabel\" (observed table). - Bereken de verwachte frequenties op basis van de nulhypothese. - Bereken de chi-kwadraatstatistiek door het verschil tussen de waargenomen en verwachte frequenties te kwadrateren, te normaliseren en te sommeren. - Vergelijk de berekende chi-kwadraatstatistiek met een kritieke waarde uit de chi-kwadraatverdeling met de juiste mate van vrijheid. - Als de berekende chi-kwadraatstatistiek significant is (p-waarde lager dan het vastgestelde significantieniveau), verwerp je de nulhypothese en concludeer je dat er een significant verschil is. De chi-kwadraat test is nuttig bij het analyseren gegevens met betrekking tot categorieën, zoals enquêteresultaten, demografische gegevens of enquêteresultaten. Het is echter belangrijk om te erkennen dat de chi-kwadraat test enkele aannames heeft, waaronder de vereiste dat de waargenomen frequenties in elke categorie groot genoeg moeten zijn. Anders kunnen de resultaten van de test vertekend zijn. Week 5 - Correlatie & Causaliteit ================================= Correlatie en oorzakelijk verband (redux) ----------------------------------------- ### Oorzaak Als sociale wetenschappers zijn we geïnteresseerd in causaliteit: - Veroorzaakt armoede asociaal gedrag? - Veroorzaakt politieke apathie extremisme? - Zorgt de bevolkingsgroei voor druk op de hulpbronnen? Maar wat betekent 'veroorzaken'?! Een nuttige manier om over causaliteit na te denken is door 'tegen de feiten in te gaan' - Zou antisociaal gedrag afnemen als er een einde zou komen aan de armoede? - Zou extremisme niet bestaan als de apathie werd uitgeroeid? - Zouden hartaanvallen toenemen als een rookverbod zou worden opgeheven? ### Correlatie: definitie en uitleg Correlatie is een statistische techniek die wordt gebruikt om de mate van relatie of associatie tussen twee variabelen te meten. Met andere woorden, het geeft aan in hoeverre veranderingen in de ene variabele gepaard gaan met veranderingen in de andere variabele. Correlatie wordt vaak uitgedrukt in de vorm van een correlatiecoëfficiënt, die kan variëren van -1 tot 1. De belangrijkste correlatiecoëfficiënten zijn: - **Pearson-correlatiecoëfficiënt (r):** - Dit wordt vaak gebruikt bij continue variabelen. - De Pearson-correlatie meet de lineaire relatie tussen twee variabelen. Een waarde van 1 duidt op een perfect positieve lineaire relatie, -1 duidt op een perfect negatieve lineaire relatie, en 0 duidt op geen lineaire relatie. - **Spearman-rangcorrelatiecoëfficiënt (*** ρ***):** - Dit wordt gebruikt wanneer de relatie tussen de variabelen niet noodzakelijkerwijs lineair is of als de data rangordes bevatten. - Het meet de kracht en richting van de monotone (niet noodzakelijkerwijs lineaire) relatie tussen twee variabelen. - Het wordt vaak toegepast op rangordes van gegevens. Correlatie betekent niet noodzakelijkerwijs causaliteit. Het feit dat twee variabelen gecorreleerd zijn, impliceert niet automatisch dat de ene variabele de oorzaak is van veranderingen in de andere. Correlatie geeft alleen de sterkte en richting van de lineaire of monotone relatie aan tussen twee variabelen. Causale verbanden moeten apart worden onderzocht via experimenteel ontwerp of geavanceerdere statistische technieken. De mate waarin twee variabelen geassocieerd zijn (op een gestandaardiseerde schaal) Om ervoor te zorgen dat de ene variabele de andere veroorzaakt, moeten de twee variabelen gecorreleerd zijn - bijv. mensen die roken moeten een grotere kans hebben om kanker te krijgen dan mensen die niet roken Als twee variabelen niet eens gecorreleerd zijn, heeft het geen zin om over causaliteit te spreken Als twee variabelen echter gecorreleerd zijn, betekent dit niet noodzakelijkerwijs dat de een de ander veroorzaakt Correlatie ≠ causaliteit! #### Correlatie meten Spreidingsdiagrammen\ Correlatiecoëfficiënt - Berekening - Interpretatie - Verklaarde variantie 1\. Teken een spreidingsdiagram (grafische methoden) 2\. Bereken de correlatiecoëfficiënt (statistiek met één getal) ##### Afhankelijke en onafhankelijke variabelen Als je nadenkt over lengte en schoenmaat, heb je waarschijnlijk geen causale theorie over deze twee variabelen, maar je verwacht wel dat ze met elkaar verband houden. ##### Afhankelijke en onafhankelijke variabelen: wat veroorzaakt wat? Als we naar causaliteit zoeken, noemen we de twee variabelen: - De onafhankelijke variabele (X; uitgezet op x-as): de variabele die als eerste gebeurt en iets veroorzaakt - Chocoladeconsumptie: de chocoladeconsumptie van het land -- gemeten in kilogrammen per jaar per hoofd van de bevolking - De afhankelijke variabele (Y; uitgezet op de y-as): de variabele die later optreedt, d.w.z. wordt veroorzaakt - Landeninformatie: Nobelprijswinnaars per 10 miljoen inwoners Opmerking: als het alleen om associatie gaat, hoeven we niet te beslissen welke variabele onafhankelijk of afhankelijk is. Maar over het algemeen hebben we een idee over de richting van het oorzakelijk verband, gebaseerd op theorie, ander onderzoek of logica\... ### Correlatie **Correlatie**: De mate waarin twee variabelen met elkaar geassocieerd zijn - Bereikt van -1 tot +1 **Positief**: Gemiddeld zijn hogere waarden van X geassocieerd met hogere waarden van Y **Negatief**: Gemiddeld worden hogere waarden van X geassocieerd met lagere waarden\ van Y **Nul**: Er is geen verband tussen de waarden van X en Y #### Correlaties interpreteren **Hoe de correlatiecoëfficiëntgrootte interpreteren?** ± 1 perfect, je correleert een variabele met zichzelf Boven ± 0,8, Zeer sterk Tussen ± 0,6 en ± 0,8, Sterk Tussen ± 0,4 en ± 0,6, matig Tussen ± 0,2 en ± 0,4, zwak Tussen \ - Correlaties detecteren alleen lineaire (=rechtlijnige) relaties, bekijk uw gegevens in een spreidingsdiagram! Deze vier voorbeelden hebben allemaal een correlatiecoëfficiënt van 0,7! Pearson-correlatie (r) ---------------------- Samenvatten: - De 'normale' correlatiecoëfficiënt wordt Pearson's correlatie (r) genoemd. - Het weerspiegelt de lineaire associatie tussen twee continue (interval of ratio) variabelen. Spearman-correlatie ------------------- Spearman-correlatie is iets flexibeler: - Er wordt van uitgegaan dat de gegevens ordinaal zijn - Het kan daarom ook niet-lineaire correlaties verwerken, zolang de associatie maar monotoon is (altijd in dezelfde richting) - Twee 'ordinale' variabelen - Een niet-lineaire, monotone relatie Samenvatting ------------ Het verschil tussen associatie/correlatie en causaliteit Associatie/correlatie kan worden gemeten met behulp van de correlatiecoëfficiënt r varieert van +1 tot -1 (positieve tot negatieve correlatie) Soorten correlaties - Wij gebruiken meestal Pearson - Als een of beide variabelen ordinaal zijn, gebruik dan Spearman (hoewel vaak dezelfde omvang, conclusie als Pearson) - Als de relatie niet lineair is, moet u Spearman gebruiken - Je hoeft het niet met de hand te berekenen (maar het is gemakkelijk te doen als je de som van de kwadraten kunt berekenen) Soorten analyses voor het testen van hypothesen\... (tot nu toe!) ----------------------------------------------------------------- ![](media/image10.png) Week 6 -- Regressie =================== Regressie --------- **Regressie**: het voorspellen van de waarde van Y op basis van X. - Hoeveel neemt variabele Y toe als X met 1 stap omhoog gaat? \- Hoeveel gaat de schoenmaat omhoog per 1 cm lengte? \- Hoeveel stijgt het jaarinkomen per extra jaar onderwijs? \- Hoeveel stijgt de examenscore van een student voor elk extra uur studie per week? Bivariate lineaire regressie ---------------------------- Je zal in staat zijn: - De resultaten van een bivariate lineaire regressie interpreteren; - De concepten snijpunt (a) en helling (b) definiëren en interpreteren; - Voorspelfouten berekenen; - Dummyvariabelen berekenen en interpreteren. ### Definitie en uitleg Bivariabele lineaire regressie is een statistische techniek die wordt gebruikt om de relatie tussen twee continue variabelen te modelleren. Het doel is om te begrijpen hoe veranderingen in één variabele gepaard gaan met veranderingen in een andere variabele. In het bijzonder probeert bivariabele lineaire regressie een lineair verband te modelleren tussen de voorspellende variabele (onafhankelijke variabele) en de responsvariabele (afhankelijke variabele). Hier zijn de belangrijkste elementen van bivariabele lineaire regressie: - **Voorspellende variabele (X):** - Dit is de onafhankelijke variabele, ook wel bekend als de verklarende variabele. - Het is de variabele waarvan we willen weten hoe deze de veranderingen in de responsvariabele beïnvloedt. - **Responsvariabele (Y):** - Dit is de afhankelijke variabele, ook wel bekend als de uitkomstvariabele. - Het is de variabele waarvan we willen begrijpen hoe deze wordt beïnvloed door veranderingen in de voorspellende variabele. - **Lineair model:** - Het model dat wordt gebruikt is een lineaire vergelijking van de vorm *Y*=*β*0 +*β*1 ⋅*X*+*ϵ*. - Hierbij zijn: - *Y* de responsvariabele, - *X* de voorspellende variabele, - *0β*0 de intercept (het snijpunt met de y-as), - *1β*1 de helling (de coëfficiënt die de verandering in *Y* aangeeft voor een eenheidstoename in *X*), - *ϵ* de foutterm die de onverklaarde variabiliteit in *Y* vertegenwoordigt. - **Fitten van het model:** - Het doel is om de waarden van *0β*0 en *1β*1 te schatten die het model het best passen bij de gegeven data. - Dit wordt vaak gedaan door de methode van de kleinste kwadraten, waarbij de som van de gekwadrateerde verschillen tussen de voorspelde waarden en de werkelijke waarden wordt geminimaliseerd. - **Evaluatie van het model:** - De kwaliteit van het model kan worden geëvalueerd aan de hand van statistische maatstaven zoals de determinatiecoëfficiënt (*R*2), die aangeeft welk deel van de variabiliteit in de responsvariabele wordt verklaard door het model. Bivariabele lineaire regressie is geschikt wanneer we een lineair verband vermoeden tussen twee variabelen. Als er meer dan één voorspellende variabele is, wordt het model uitgebreid tot meervoudige lineaire regressie. ### Bivariate regressie = correlatie+ Bivariabel: Bi = twee; variate = variabele\... regressies met twee variabelen Bivariate regressie gaat verder dan correlatie\... - We onderzoeken nog steeds de lineaire relatie tussen twee variabelen - Vroeger konden we zeggen of de relatie positief of negatief was, en hoe sterk deze was - Nu gaan we uitzoeken hoeveel Y toeneemt (of afneemt) als X met 1 eenheid toeneemt #### Hoe ziet het eruit? De formule die deze lijn beschrijft, staat in het midden afgedrukt ELKE rechte lijn kan worden beschreven met de formule: 𝑌\'= 𝑎 + 𝑏𝑋 - b is de helling, hoe steil de lijn is. Dit is hoeveel Y verandert als X met 1 stijgt - a is het snijpunt, waar de lijn de Y-as kruist. Dit is de voorspelde waarde voor een score van 0 op X ### Voorspellingsfout De waargenomen waarden Y kunnen dus worden uitgedrukt als: 𝑌 = 𝑎 + 𝑏𝑋 + 𝜖 En ook: 𝑌 = 𝑌 \'+ 𝜖 - 𝜖 verwijst naar de voorspellingsfout. In woorden zegt de formule dus: "De waargenomen waarden voor Y zijn gelijk aan de voorspelde waarden, plus de voorspellingsfout" Regressie in R -------------- ### Onderwijsexpansie in Nederland H0: Nederlanders die later in de 20e eeuw zijn geboren, zullen een lager of hetzelfde opleidingsniveau hebben. H1: Nederlanders die later in de 20e eeuw zijn geboren, zullen een hoger opleidingsniveau hebben ### Bivariate lineaire regressie: Y-waarde wanneer X=0 𝑌! = 10,86 + 0,06𝑋 - Als X=0, dan is de voorspelde Y-waarde het snijpunt: 10,86 - Dit is waar de lijn de Y-as kruist - In de formule is dit de constante (a) Bivariate lineaire regressie: X neemt toe met 1 𝑌! = 10,86 + 0,06𝑋 Als X met 1 eenheid toeneemt, verandert Y\' met 0,06 De voorspelde verandering in Y\' is de helling (b) In dit voorbeeld is de verandering positief ### Betekenis van coëfficiënten 𝑌! 𝑦𝑒𝑎𝑟𝑠 𝑜𝑓 𝑒𝑑𝑢𝑐𝑎𝑡𝑖𝑜𝑛 = 10,86 + 0,06𝑋(𝑦𝑒𝑎𝑟 𝑜𝑓 𝑏𝑖𝑟 𝑡ℎ) - 𝑌 ! is het voorspelde aantal jaren onderwijs - 10,86 is de constante (a) We voorspellen dat een persoon met een geboortejaar '0' (in dit geval 1900, aangezien we de variabele hebben geschaald naar = 0 voor mensen geboren in 1900) 10,86 jaar onderwijs zal hebben 𝑌! = 10,86 + 0,06 ∗ 0 = 10,86 - 0,06 is de helling, (b) Voor elk jaar later dat iemand in de 20e eeuw wordt geboren, voorspellen we dat hij 0,06 jaar extra onderwijs zal hebben ### Analyse van variantie Laten we het stap voor stap bekijken. We beginnen eigenlijk onderaan\... De F-toets vertelt u of het model een significante hoeveelheid variantie in de uitkomst verklaart. Een F-toets vergelijkt twee varianties (de toets van Levene gebruikt ook F), in dit geval de totale variantie en de verklaarde variantie Rapporteer het als: F(1, 1283) = 85,07, p \