VOS Samenvatting College 1: Factoranalyse PDF
Document Details
![AdequateDenver6457](https://quizgecko.com/images/avatars/avatar-9.webp)
Uploaded by AdequateDenver6457
Utrecht University
Tags
Summary
This document provides a summary of factor analysis, focusing on the concepts of internal and external validity, statistical validity, and construct validity. It details the different types of validity and how they relate to research design.
Full Transcript
**VOS samenvatting** **College 1: Factoranalyse** **Interne validiteit**; geeft aan in hoeverre je zeker kunt zijn dat het **geobserveerde effect** in je onderzoek daadwerkelijk veroorzaakt wordt door de **onafhankelijke variabele** en niet door andere factoren (confounders). Cruciaal voor experim...
**VOS samenvatting** **College 1: Factoranalyse** **Interne validiteit**; geeft aan in hoeverre je zeker kunt zijn dat het **geobserveerde effect** in je onderzoek daadwerkelijk veroorzaakt wordt door de **onafhankelijke variabele** en niet door andere factoren (confounders). Cruciaal voor experimenten en causale studies. Het bepaalt of je oorzaak-gevolg-relaties kunt vertrouwen. We hebben interne validiteit gedefinieerd als de mate waarin de onderzoeksmethode alternatieve verklaringen voor een effect kan uitsluiten. Dit 'effect' kan betrekking hebben op zowel een relatie tussen variabelen als een verschil tussen groepen. Interne validiteit gaat dus over de mogelijkheid om te bepalen of er sprake is van een causaal verband (oorzaak-gevolgrelatie). 1. Is er sprake van een relatie tussen twee of meer variabelen? 2. Gaat de oorzaak vooraf aan het gevolg (in tijd)? 3. Kunnen we andere verklaringen voor het gevonden verband uitsluiten? - Gebruik controlegroepen. - Randomisatie (willekeurige toewijzing van proefpersonen). - Beheersing van storende variabelen (bijvoorbeeld door matching of statistische controle). **Externe validiteit;** geeft aan in hoeverre de resultaten van een onderzoek **generaliseerbaar** zijn naar andere situaties, tijden, en populaties. Dit bepaalt of je onderzoeksresultaten ook nuttig zijn buiten de specifieke setting van het onderzoek. We hebben externe validiteit gedefinieerd als de mate waarin de onderzoeksresultaten gegeneraliseerd kunnen worden naar andere groepen, tijden en situaties. Externe validiteit gaat dus over de mogelijkheid om op basis van de onderzoeksresultaten iets te zeggen over situaties *buiten* het onderzoek, oftewel over situaties in een *real-world *setting. Om de externe validiteit van een wetenschappelijk onderzoek te beoordelen, kun je bijvoorbeeld de volgende vragen stellen: - Welke populatie wordt er onderzocht? - Welke steekproefmethode is er gebruikt? - Hoe representatief is de steekproef voor de populatie? - Wat kunnen we op basis van de onderzoeksresultaten zeggen over situaties in een *real-world *setting? - **Hoe verbeteren:** - Gebruik representatieve steekproeven. - Voer het onderzoek uit in realistische omstandigheden. - Herhaal de studie in verschillende populaties of omgevingen. Interne en externe validiteit staan los van elkaar. Als de interne validiteit laag is, kan de externe validiteit nog steeds vrij hoog zijn (en omgekeerd). **Statistische validiteit** We hebben statistische validiteit gedefinieerd als de mate waarin de resultaten van een statistische analyse nauwkeurig en goed gefundeerd zijn. Statistische validiteit gaat dus over de nauwkeurigheid en juistheid van de statistische analyses. \ Om de statistische validiteit van een wetenschappelijk onderzoek te beoordelen, kun je bijvoorbeeld de volgende vragen stellen: 1. Is de gekozen analysetechniek geschikt voor beantwoording van de onderzoeksvraag? 2. Is er voldaan aan de voorwaarden/assumpties van de uitgevoerde analyse? 3. Zijn de resultaten van de analyse op de juiste manier gerapporteerd en geïnterpreteerd? **Begripsvaliditeit;** beoordeelt in hoeverre een meetinstrument of een experiment daadwerkelijk het **theoretische construct** meet dat het hoort te meten. Het bepaalt of de gekozen meetmethode relevant en juist is voor het concept dat je wilt onderzoeken. We hebben begripsvaliditeit gedefinieerd als de mate waarin de gebruikte meetinstrumenten slagen in het meten van de concepten/constructen die onderzocht worden. In experimenteel onderzoek gaat het daarnaast om de mate waarin de bedoelde manipulatie geslaagd is. Begripsvaliditeit gaat dus over de overeenstemming tussen de operationalisatie (door middel van het meetinstrument) en het theoretisch begrip (zoals beschreven in de conceptuele definitie). Om de begripsvaliditeit van een wetenschappelijk onderzoek te beoordelen, kun je dus bijvoorbeeld de volgende vragen stellen: 1. Welke theoretische begrippen worden er gemeten of gemanipuleerd in het onderzoek (conceptuele definitie)? 2. Met welke meetinstrumenten worden de theoretische begrippen gemeten (operationele definitie)? 3. Meet het gekozen meetinstrument wel wat het beoogt te meten? 4. Is er een betrouwbaarheidsanalyse uitgevoerd? Zo ja, wat is hiervan het resultaat? - Gebruik bestaande, gevalideerde meetinstrumenten. - Controleer convergente en divergente validiteit. - Zorg dat de theorie achter het construct goed is onderbouwd. Wat helpt bij begripsvaliditeit is het volgende: (factoranalyse) **Factoranalyse** Voorbeeld: we testen herfstdepressie in kinderen aan de hand van deze items; Vermoeidheid, lusteloosheid, stemmingswisselingen, behoefte aan extra eten, somberheid, droefheid, behoefte aan extra slaap, sociaal isolement. Sommige van deze items hebben een relatie met elkaar, er zijn veronderstelde dimensies. De verschillende items kunnen dus gereduceerd worden, dit doen we door middel van factoranalyse. **Soorten factoranalyse:** - Hoofdcomponentenanalyse (PCA) als reductie het doel is van de factoranalyse. Kunnen we informatie uit groot aantal variabelen samenvatten in kleiner aantal nieuw te construeren variabelen (= factoren)? Doel: maximaliseren van de verklaarde variantie. Hierbij geldt factoren = componenten Afbeelding met diagram, lijn, cirkel, Lettertype Automatisch gegenereerde beschrijving - Exploratieve factoranalyse (EFA) als inhoudelijke interpretatie van nog onbekend aantal factor(en) het doel is van de factoranalyse. Doel: ontdekken van onderliggende relaties tussen variabelen. ![Afbeelding met diagram, lijn, cirkel, tekening Automatisch gegenereerde beschrijving](media/image3.png) - Confirmatieve factoranalyse (CFA) als beoordeling van de verwachte interne structuur (= validiteit) het doel is van de factoranalyse. Dus het beoordelen dimensionaliteit van test. Vinden we inderdaad het aantal theoretisch veronderstelde dimensies (= factoren) binnen de verzameling van testitems? Afbeelding met diagram, cirkel, lijn, Lettertype Automatisch gegenereerde beschrijving - ![](media/image5.png)X = individuele score op variabele - Zx = X getransformeerd naar z-score - ---X betekent gemiddelde van de groep - Factorlading (a) = Correlatie van variabele met factor. NB. De factorladingen a worden geschat. - Factor (F ) = Achterliggende verklaring voor variatie (variantie) in en samenhang (correlaties) tussen de variabelen. NB. In PCA spreekt men van componenten in plaats van factoren. - Unieke factor (u) = Unieke factor voor verklaring van specifieke en error variantie. **Vergelijking factorscore (F) :** Afbeelding met Lettertype, tekst, lijn, schermopname Automatisch gegenereerde beschrijving **Stap 0:** Een factoranalyse is zinvol wanneer er minimaal 1 factor is met een correlatiecoëfficiëntie van groter dan 0,3. **Eigenwaarde** Elke onderscheiden factor heeft zijn eigen eigenwaarde. Het is een kenmerk van een factor. De eigenwaarde drukt uit hoeveel variantie de betreffende factor verklaart van alle bij de factoranalyse betrokken variabelen (items). Factoren zijn relevant als ze een aanzienlijk deel van de variantie in de items verklaren en daarnaast duidelijk inhoudelijk geïnterpreteerd kunnen worden. Als criterium voor een relevante hoeveelheid verklaarde variantie door een factor, kunnen we het *eigenwaarde-criterium *gebruiken: - Als de eigenwaarde groter is dan 1, verklaart de factor meer variantie dan een afzonderlijk item uit de test. - Is de eigenwaarde kleiner dan 1, dan verklaart deze factor minder variantie dan elk van de gemeten items afzonderlijk. Factoren met een eigenwaarde kleiner dan 1 worden daarom als statistisch niet-relevant beschouwd. NB. In het Engels (in JASP) noemen we een eigenwaarde ***eigenvalue.*** NB. Eigenwaarden voor EFA zijn net iets anders dan eigenwaarden voor PCA. In de EFA staan ze onder \'SumSq. Loadings\'. Gebruik in een EFA deze waarden voor de verklaarde variantie in de items door een factor. ![](media/image7.png) **Methodologie** Factoranalyse verloopt in drie fasen: **Stap 1: Bepalen van het aantal factoren** - **Eigenwaardecriterium**: - Factoren met een eigenwaarde groter dan 1 worden behouden. - **Screeplot**: - Een grafiek toont een knikpunt waar de bijdrage van factoren sterk afneemt. Factoren vóór de knik worden geselecteerd. **Stap 2: Interpretatie van factorladingen** - **Factorladingen**: - Correlaties tussen variabelen en factoren. Dus: hoe goed representeerd de 'gereduceerde' factor de factor. - Een absolute (dus zowel positief als negatief) factorlading van \> 0.4 wordt als sterk beschouwd. - **Communaliteiten**: - Het percentage variantie in een variabele dat wordt verklaard door de factoren. **Stap 3: Rotatie** - **Orthogonaal (Varimax)**: - Factoren blijven onafhankelijk. - **Oblique (Oblimin)**: - Factoren mogen correleren. **Output en Toepassingen** - **Factorladingentabel**: Geeft aan hoe sterk variabelen op factoren laden. - **Praktische toepassing**: HR-afdelingen gebruiken factoranalyse om werktevredenheidsfactoren te identificeren en gericht beleid te voeren. **College 2: Multipele Lineaire Regressie** Multipele regressie gaat verder dan enkelvoudige correlatie door meerdere voorspellers tegelijk te analyseren. Het biedt een robuust kader om complexe relaties te modelleren. **Doel** Het doel van multipele regressie is om: 1. **Voorspellingen te maken**: - Hoe beïnvloeden meerdere onafhankelijke variabelen (X1, X2,...) een afhankelijke variabele (Y)? 2. **Verklaringen te geven**: - Welke voorspellers hebben de grootste invloed? **Praktijkvoorbeeld**: Welke factoren (leesmotivatie, opleidingsniveau ouders, boeken in huis) verklaren leesvaardigheid van kinderen? **De Regressievergelijking** De vergelijking voor multipele regressie is: Y = B0 + B1 x X1 + B2 x X2 +... + E - B0: Intercept, de waarde van Y als X = 0. - B1: Regressiecoëfficiënten, die het effect van Xi op Y beschrijven. - E: Residuen of error. **Modelvalidatie** - **Goodness-of-Fit (R2)**: - Toont het percentage verklaarde variantie in Y. - Bijvoorbeeld: R2 = 0.45 betekent dat 45% van de variantie in Y wordt verklaard door het model. - **t-Toets voor predictoren**: - Toetst of elke Bi significant verschilt van nul. - **F-Toets voor het model**: - Toetst of het model als geheel significant is (H0: R2 = 0) **Categorische Predictoren** Categorische variabelen worden omgezet in dummyvariabelen. Bijvoorbeeld, geslacht (man/vrouw) wordt gecodeerd als: - Man = 0 - Vrouw = 1 Dit kunnen ook meer groepen zijn. Als je een formule hebt, bijvoorbeeld: En je wil het salaris weten van een vrouw die een bachelor doet. Dan zet je een 1 bij bachelor en vrouw, en een 0 bij master. **College 3: Moderatie en Mediatie** Moderatie en mediatie bieden geavanceerde analysemogelijkheden om complexe relaties tussen variabelen te begrijpen. **Moderatie: Het Beïnvloeden van Verbanden** Een moderator (M) beïnvloedt de sterkte of richting van het verband tussen een onafhankelijke variabele (X) en een afhankelijke variabele (Y). **Toepassing** - Voeg een interactieterm (X×MX) toe aan het model: Y=B0 + B1 x X + B2 x M + B3(X×M) + E - Een significant interactie-effect (B3) wijst op moderatie. **Voorbeeld** De relatie tussen voorbereidingstijd (X) en rekenvaardigheid (Y) wordt gemodereerd door dyslexie (M). **Mediatie: Het Verklaren van Verbanden** Mediatie analyseert of een derde variabele (M) het verband tussen X en Y verklaart. **Padmodel** 1. **Totaal effect (c)**: - Toets het directe verband tussen XXX en YYY. 2. **Indirect effect (a×ba)**: - Analyseer hoe X M beïnvloedt (a) en hoe M Y beïnvloedt (b). 3. **Direct effect (c′)**: - Het resterende directe effect van XXX op YYY, gecontroleerd voor MMM. **Resultaat** - **Volledige mediatie**: c′ is niet significant. - **Partiële mediatie**: Zowel c′ als a×ba zijn significant. **Praktijkvoorbeeld**: Voedingsvoorlichting (X) leidt tot gewichtsverlies (Y) via verbeterd eetgedrag (M). **Bayesiaanse Evaluatie** Bayesiaanse statistiek biedt een flexibeler alternatief voor frequentistische methoden door waarschijnlijkheden toe te wijzen aan hypothesen. **Belangrijke Concepten** - **Bayes Factor (BF)**: - Geeft de verhouding tussen de kans op H1 en H0. - Bijvoorbeeld: BF10 = 3 betekent dat H1 drie keer waarschijnlijker is dan H0. - **Posterior Model Kansen (PMK)**: - Kans dat een model waar is, gegeven de data. **Vergelijking met Frequentistische Methoden**: **Aspect** **Frequentistisch** **Bayesiaans** ------------- ------------------------------- ------------------------------------- Resultaten p-waarden Bayes Factoren, PMK\'s Intervallen Betrouwbaarheidsinterval Credible Interval Evaluatie Dichotoom (H0 verwerpen/niet) Continu (sterkte van ondersteuning) **VOS Hoorcollege 4 ANOVA** **Wat is een Meerweg ANOVA?** Meerweg ANOVA (factorial ANOVA) onderzoekt de invloed van meerdere factoren en hun interacties op een afhankelijke variabele. - **Onderzoeksvraag**: Zijn er verschillen tussen groepen, gebaseerd op meer dan één factor, in het gemiddelde van een afhankelijke variabele (YYY)? - **Toepassingen**: - Bepalen of leeftijd en geslacht (twee factoren) de kennis van getallen (afhankelijke variabele) beïnvloeden. - Kwantificeren van hoofd- en interactie-effecten tussen factoren. **Voorbeeld**: In een studie over **Sesamstraat** wordt onderzocht hoe leeftijd (3 categorieën: jong, midden, oud) en geslacht (jongen/meisje) de kennis van getallen beïnvloeden. **Basisstructuur van ANOVA** **Eenweg ANOVA** Een eenweg ANOVA onderzoekt één factor (bijv. leeftijd) met meerdere categorieën. Het model vergelijkt gemiddelden van de afhankelijke variabele tussen deze groepen. **Meerweg ANOVA** Een meerweg ANOVA analyseert: 1. **Hoofdeffecten**: Het effect van individuele factoren, onafhankelijk van elkaar. 2. **Interactie-effecten**: Het gecombineerde effect van factoren op de afhankelijke variabele. **Voorbeeldmodel**: - Factoren: - Leeftijd (3 categorieën: jong, midden, oud) - Geslacht (2 categorieën: jongen, meisje) - Afhankelijke variabele: - Kennis van getallen De onafhankelijke variabele wordt een factor genoemd (bij regressieanalyse predictor) **Hoofdeffecten en Interactie-effecten** **Hoofdeffecten** Een hoofdeffect treedt op wanneer één factor (bijv. leeftijd) een significant verschil veroorzaakt in het gemiddelde van de afhankelijke variabele, ongeacht andere factoren. - **Voorbeeld**: - Leeftijd heeft een significant hoofdeffect op kennis van getallen (p\