Summary

This document explains ANOVA (Analysis of Variance) and provides examples of how to apply this statistical analysis. It covers aspects such as setup and design of experiments, along with various formulas and calculations. The topics of hypotheses testing and analysis of variability within and between groups are also well-explained.

Full Transcript

19-02-2024  Terugblik college 16 februari  Variantie analyse Aan het eind van het college kan de student: - de variantie analyse toepassen en de uitkomsten interpreteren  ANOVA staat voor Analysis of Variance, oftewel variantieanalyse, en wordt gebruikt om gemiddelden van meer dan...

19-02-2024  Terugblik college 16 februari  Variantie analyse Aan het eind van het college kan de student: - de variantie analyse toepassen en de uitkomsten interpreteren  ANOVA staat voor Analysis of Variance, oftewel variantieanalyse, en wordt gebruikt om gemiddelden van meer dan twee groepen met elkaar te vergelijken  Parametrische test  One-way-ANOVA  Uitbreiding van de t-toets ▪ Response variabele : afhankelijke variabele (scale) ▪ Factoren (kwantitatief en kwalitatief): onafhankelijke/verklarende variabelen (vb geslacht, etniciteit) ▪ Factor niveaus (waarden van een factor, vb: man/vrouw) ▪ Behandelingen: alle niveau combinaties (vb: vrouw/man met hoge SES, vrouw/man met lage SES) ▪ Experimentele Unit: object waarvoor respons en factoren worden waargenomen/gemeten Voorwaarden voor toepassing van de variantie analyse (F-toets of ANOVA toets) zijn: 1. Onafhankelijke aselecte steekproeven 2. De populaties moeten normaal verdeeld zijn 3. De varianties van deze populaties moeten gelijk zijn (homogeneity of variance)  Ontwerp waarbij onafhankelijke, aselecte steekproeven van experimentele eenheden worden genomen voor elke behandeling  Ontwerp wordt gebruikt met de volgende hypothese vergelijking: H0:µ1=µ2=µ3.....=µi Ha: niet alle µi ’s zijn gelijk (tenminste 2 µ’s zijn verschillend)  Dehypothesen worden getoetst door verschillen in gemiddelden van de verschillende behandelingen met elkaar te vergelijken  Detoetsingsgrootheid wordt berekent door de variabiliteit tussen groepen (SST) en de variabiliteit binnen groepen (SSE) van behandelingen  Tussenvariantie: de afwijking van alle groepsgemiddelden tov het totale gemiddelde  Binnenvariantie: Spreiding binnen de groepen. De afwijking van alle waarnemingen tov hun groepsgemiddelde  ( ) k SST =  ni xi − x 2 i =1 Kwadratensom van de storingsterm (kwadratensom binnen behandelingen) Sum of Squares for Error (SSE)  Meet de variabiliteit binnen behandelingsgroepen; wordt ook wel de storingsterm genoemd, berekent door: ( ) + ( x ) ( ) n1 n2 nk SSE =  x1 j − x1 +... +  xkj − xk 2 2 2 2j − x2 j =1 j =1 j =1 Na substitutie krijgen we: SSE = ( n1 − 1) s12 + ( n 2 −1) s22 +... + ( nk − 1) sk2  Gemiddelde kwadratensom tussen behandelgroepen (MST) (Mean Square of treatments) ook wel ‘tussen variantie’ genoemd)  Meet de variabiliteit tussen groepsgemiddelden (k= aantal behandelingen) SST SSE MST = MSE = k −1 n−k  MSE meet de variabiliteit binnen groepsgemiddelden het gaat om de binnen variantie F-toets De verhouding van MST en MSE MST F= , with df (k − 1, n − k ) MSE  F-waarden dichtbij 1 geef een vermoeden dat er geen verschillen zijn tussen de populatie gemiddelden  F-waarden veel groter dan 1 geeft een vermoeden dat er wel significante verschillen zijn tussen de populatie gemiddelden, geeft indicatie voor verwerpen van H0  Format ANOVA tabel Format ANOVA (Variantie Analyse) Tabel voor volledig aselect ontwerp Bron df SS MS F SST MST Tussen groepen k −1 SST MST = k −1 MSE SSE Binnen groepen n−k SSE MSE = n−k Total n −1 SS (Total )  Voorbeeld Variantie Analyse (ANOVA) tabel: Excel output  Variantie Analyse uitvoeren voor een volledig aselect ontwerp  Ga de eigenschappen na: 1. Ga na of het ontwerp aselect is en de populaties onafhankelijk zijn van elkaar 2. Controleer de normaliteit en gelijke variantie aannames van de populatie 3. Maak ANOVA samenvattende tabel 4. Als H0 niet verworpen wordt, overweeg mogelijke verklaringen, rekening houdend met de mogelijkheid van een Type II fout ▪ Een significante F-test bij een ANOVA vertelt dat de behandeling als groep statistisch verschillend is ▪ Geef echter niet aan welke paren statistisch verschillend zijn van elkaar  Drie veel gebruikte technieken voor het maken van meerdere vergelijkingen uit een set van behandelingen: Tukey, Bonferonni en Scheffé  In elke techniek worden betrouwbaarheidsintervallen opgebouwd rond verschillen tussen gemiddelden  Selectie van techniek is gebaseerd op experimenteel ontwerp en gevraagde vergelijkingen  Tukey post-hoc test: make pairwise comparisons between group means when the sample sizes for each group are equal. (μA = μB, μA = μC, μB = μC)  Scheffe post-hoc test: make all possible contrasts between group means. This test allows you to compare more than just two means at once, unlike the Tukey post-hoc test. (μA – μB = μC – μD, μA + μD = μB + μC)  Bonferronipost-hoc test: you have a set of planned comparisons you would like to make beforehand. (μA = μB, μB = μC) Men wilt nagaan of de concentratie van plastic in bloed verschilt per woonwijk. Dit zijn de resultaten van 4 woonwijken. Woonwijk Aantal Gemiddelde sd personen concentratie van polimeren per persoon Woonwijk a 385 2.3 µg/ml 1.1 µg/ml Woonwijk b 270 3.0 µg/ml 1.3 µg/ml Woonwijk c 410 1,6 µg/ml 0.6 µg/ml Woonwijk d 390 1.9 µg/ml 0.9 µg/ml Reken uit of het verschil in gemiddelde concentratie plastic in bloed tussen de woonwijken statistisch significant is.

Use Quizgecko on...
Browser
Browser