Statistiek - Normaalverdeling en Spreidingsmaten
42 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Wat is de vorm van een normaalverdeling?

  • Rechthoekig
  • Ovale
  • Klok-vormig (correct)
  • Triangulair

Welke uitspraak over normaalverdelingen is correct?

  • Ze worden volledig bepaald door de mediaan.
  • Ze zijn altijd scheef.
  • Ze zijn unimodaal. (correct)
  • Ze hebben meerdere toppen.

Wat beschrijft de 68-95-99.7 regel in de normaalverdeling?

  • Alle observaties zijn gelijk verspreid over het bereik.
  • 99.7% van de observaties ligt binnen een bereik van 3 quartielen.
  • 68% van de observaties ligt tussen de mediaan en het quartiel.
  • 95% van de observaties ligt binnen 2 standaarddeviaties van het gemiddelde. (correct)

Wat bepaalt volledig de normaalverdeling?

<p>De verwachting (gemiddelde) en standaarddeviatie (D)</p> Signup and view all the answers

Welke waarde van de skewness (g1) is typerend voor een normaalverdeling?

<p>0 (A)</p> Signup and view all the answers

Wat is het kwartiel Q1?

<p>De waarde waarvoor de cumulatieve frequentie ¼ van het aantal waarnemingen bedraagt. (A)</p> Signup and view all the answers

Hoe wordt de interkwartielafstand gedefinieerd?

<p>Het verschil tussen Q1 en Q3, wat 50% van de data beschrijft. (B)</p> Signup and view all the answers

Wat beschrijft de interdecielafstand?

<p>De afstand tussen het 1e en het 9e deciel van een dataset. (C)</p> Signup and view all the answers

Wat is de cumulatieve frequentie van Q2?

<p>50% van het totaal aantal waarnemingen. (C)</p> Signup and view all the answers

Wat is de primaire functie van spreidingsmaten?

<p>Om de variabiliteit of spreiding van een dataset te beschrijven. (D)</p> Signup and view all the answers

Wat is een kenmerk van een correcte klassenindeling voor data-analyse?

<p>Klassen zijn exhaustief en disjunct. (C)</p> Signup and view all the answers

Welke grafische voorstelling is geschikt voor nominale data?

<p>Staafdiagram. (D)</p> Signup and view all the answers

Wat gebeurt er met de klassen tijdens het maken van een histogram voor ordinale data?

<p>Klassen moeten in stijgende volgorde worden weergegeven. (B)</p> Signup and view all the answers

Wat beschrijft een asymmetrische verdeling die scheef naar rechts is?

<p>De rechterzijde bevat de hoogste waarden met een langere staart. (A)</p> Signup and view all the answers

Wat is een belangrijke stap bij het analyseren van een dataset?

<p>Het bekijken van algemene patronen en opvallende afwijkingen. (D)</p> Signup and view all the answers

Wat is een definitie van een uitschieter in data-analyse?

<p>Een gegeven dat een bijzondere waarde heeft buiten het algemene patroon. (B)</p> Signup and view all the answers

Bij welke datatypes heeft de ruimte tussen kolommen betekenis in de grafische voorstellingen?

<p>Interval- en ratio data. (C)</p> Signup and view all the answers

Wat betekent het dat een verdeling symmetrisch is?

<p>De linker en rechter helften zijn elkaars spiegelbeeld. (D)</p> Signup and view all the answers

Wat geeft een z-score aan?

<p>Hoeveel standaardafwijkingen een meetwaarde boven het gemiddelde ligt (B)</p> Signup and view all the answers

Wat is een kenmerk van de standaard normale verdeling?

<p>De verwachting is gelijk aan 0 en de standaardafwijking is gelijk aan 1 (A)</p> Signup and view all the answers

Wat gebeurt er wanneer data op een continue schaal worden gegroepeerd in klassen?

<p>Afgeronde waarden worden aan de laagste klasse toegewezen (D)</p> Signup and view all the answers

Wat is de rol van de verklaarde variabele?

<p>Deze variabele meet een uitkomst van een studie (C)</p> Signup and view all the answers

Hoe wordt de samenhang tussen twee variabelen doorgaans gekarakteriseerd?

<p>Door de correlatiecoëfficiënt te meten (D)</p> Signup and view all the answers

Wat moet er in aanmerking worden genomen bij het afronden van continue gegevens?

<p>Gewone afrondingsregels (C)</p> Signup and view all the answers

Wat is het effect van de verklaring van de verklaarde variabele op de verklaarbare variabele?

<p>Het stelt ons in staat de waarde beter te voorspellen (A)</p> Signup and view all the answers

Waarom is de expectatie van een normaalverdeling belangrijk?

<p>Omdat het de locatie van de piek in de verdeling bepaalt (B)</p> Signup and view all the answers

Wat is extrapolatie?

<p>Het gebruik van een regressiemodel om voorspellingen te doen buiten het bereik van waarnemingen. (D)</p> Signup and view all the answers

Welke factor kan de relatie tussen X en Y beïnvloeden zonder dat deze wordt opgenomen in de analyse?

<p>Verborgen variabelen zoals genetica of voeding. (B)</p> Signup and view all the answers

Waarom zijn voorspellingen buiten het bereik van waarnemingen vaak onbetrouwbaar?

<p>De regressielijn kan afwijken van de werkelijke waarde. (A), De lineaire relatie tussen X en Y wordt verondersteld constant te blijven. (B)</p> Signup and view all the answers

Wat moet je doen voordat je een regressiemodel toepast?

<p>Een spreidingsdiagram gebruiken om het verband visueel te evalueren. (D)</p> Signup and view all the answers

Wat kan een uitschieter in de dataset beïnvloeden?

<p>De lineaire regressielijn. (D)</p> Signup and view all the answers

Wat is een belangrijk aandachtspunt bij het werken met correlatie en regressie?

<p>Blijven binnen het bereik van waarnemingen bij het doen van voorspellingen. (A)</p> Signup and view all the answers

Wat impliceert een lineaire correlatie tussen X en Y?

<p>Een verhoogde correlatie kan niet betekenen dat X Y beïnvloedt. (B)</p> Signup and view all the answers

Wat kan een indicatie zijn dat een lineair model mogelijk niet geschikt is?

<p>Duidelijke krommingen zichtbaar in het spreidingsdiagram. (A)</p> Signup and view all the answers

Wat betekent een χ²-waarde van 0?

<p>De variabelen zijn volledig onafhankelijk. (A)</p> Signup and view all the answers

Wat geeft een Φ-coëfficiënt van 0 aan?

<p>Er is geen verband tussen de variabelen. (C)</p> Signup and view all the answers

Hoe wordt de Φ-coëfficiënt berekend?

<p>Met de formule Φ = √(χ²/N). (C)</p> Signup and view all the answers

Wat geeft een hogere absolute waarde van Φ aan?

<p>Een sterkere relatie tussen de variabelen. (B)</p> Signup and view all the answers

Wat is een kenmerk van de contingentiecoëfficiënt (C)?

<p>C meet het verband tussen twee categorische variabelen. (A)</p> Signup and view all the answers

Wat betekent een positieve waarde van de Φ-coëfficiënt?

<p>Dat hogere waarden van de ene variabele samenhangen met hogere waarden van de andere. (C)</p> Signup and view all the answers

Wat duidt een χ²-waarde aan die groter is dan 0 aan?

<p>De variabelen vertonen een verband. (A)</p> Signup and view all the answers

Waarom is de Φ-coëfficiënt bijzonder voor 2×2 kruistabellen?

<p>Omdat het eenvoudig en intuïtief is voor deze tabellen. (C)</p> Signup and view all the answers

Flashcards

Boxplot

Een diagram dat de spreiding van data voorstelt door middel van een doos met een lijn in het midden (mediaan) en "snorharen" die de minimum- en maximumwaarden aangeven.

Kwantiel

Een waarde van een variabele die een bepaald percentage van de data representeert. Bijvoorbeeld, het 1e kwartiel (Q1) is de waarde die 25% van de data beneden zich heeft.

Interkwartielafstand

De afstand tussen Q1 en Q3, die de spreiding van het middelste 50% van de data aangeeft.

Interdecielafstand

De afstand tussen het 1e en 9e deciel, die de spreiding van het middelste 80% van de data aangeeft.

Signup and view all the flashcards

Spreidingsmaten

Spreidingsmaten zijn statistieken die de variabiliteit of spreiding van data beschrijven.

Signup and view all the flashcards

Klassenindeling van continue data

Het verdelen van meetwaarden in klassen, waarbij elke meetwaarde tot één klasse behoort en de klassen elkaar niet overlappen.

Signup and view all the flashcards

Frequentie in klassenindeling

De frequentie van een klasse geeft aan hoeveel meetwaarden in die klasse vallen.

Signup and view all the flashcards

Grafische voorstelling continue data

Het visualiseren van data met behulp van staafdiagrammen, histogrammen, frequentiepolygonen en/of cumulatieve grafieken.

Signup and view all the flashcards

Staafdiagram

Een grafische voorstelling met staven die de frequentie van elke klasse weergeeft.

Signup and view all the flashcards

Histogram

Een grafische voorstelling met staven die de frequentie van elke klasse weergeeft, waarbij de staven elkaar raken.

Signup and view all the flashcards

Cumulatief histogram

Een grafische voorstelling met een lijn die de cumulatieve frequentie van elke klasse weergeeft.

Signup and view all the flashcards

Frequentiepolygoon

Een grafische voorstelling met een lijn die de frequentie van elk punt weergeeft.

Signup and view all the flashcards

Cumulatieve frequentiecurve (ogief)

Een grafische voorstelling met een lijn die de cumulatieve frequentie van elk punt weergeeft.

Signup and view all the flashcards

Normaalverdeling

Een type waarschijnlijkheidsverdeling dat wordt gekenmerkt door een symmetrische, klokvormige curve. Deze verdeling is volledig bepaald door het gemiddelde (µ) en de standaarddeviatie (σ).

Signup and view all the flashcards

Gemiddelde (µ)

De waarde die het midden van een normaalverdeling aangeeft. Het is ook gelijk aan de verwachting van de verdeling.

Signup and view all the flashcards

Standaarddeviatie (σ)

Een maat voor de spreiding van gegevens in een normaalverdeling. Geeft aan hoeveel data punten gemiddeld van het gemiddelde afwijken.

Signup and view all the flashcards

68-95-99.7 regel

Een regel die laat zien hoeveel data punten in een normaalverdeling binnen een bepaald aantal standaarddeviaties van het gemiddelde vallen. Bijvoorbeeld: ongeveer 68% van de data valt tussen µ - σ en µ + σ.

Signup and view all the flashcards

N(µ; σ)

Een notatie die gebruikt wordt om een normaalverdeling te beschrijven, met µ als gemiddelde en σ als standaarddeviatie.

Signup and view all the flashcards

Oppervlakte onder de standaard normaalverdeling

De oppervlakte onder de standaard normaalverdeling die boven een bepaalde z-score ligt, geeft de kans aan dat een willekeurige waarneming groter is dan die z-score.

Signup and view all the flashcards

Z-score

Een z-score geeft aan hoeveel standaardafwijkingen een waarneming afwijkt van het gemiddelde.

Signup and view all the flashcards

Standaardiseren van variabelen

Het standaardiseren van een variabele x, met gemiddelde µ en standaardafwijking σ, naar z-scores maakt alle normaalverdelingen vergelijkbaar.

Signup and view all the flashcards

Standaard normaalverdeling

De standaard normaalverdeling is een speciale normaalverdeling met een gemiddelde van 0 en een standaardafwijking van 1.

Signup and view all the flashcards

Continue correctie

Bij het groeperen van continue data in klassen, moeten de klassegrenzen zorgvuldig worden gekozen om te voorkomen dat waarden aan de verkeerde klasse worden toegewezen.

Signup and view all the flashcards

Exacte klassegrenzen

Exacte klassegrenzen definiëren precieze intervallen van continue waarden die door eenzelfde meetwaarde op de discrete meetschaal worden voorgesteld.

Signup and view all the flashcards

Verklaarde variabele

Een variabele die de uitkomst van een studie meet.

Signup and view all the flashcards

Verklarende variabele

Een variabele die veranderingen in de verklaarde variabele verklaart of veroorzaakt.

Signup and view all the flashcards

Extrapolatie?

Extrapolatie is het gebruik van een regressiemodel om voorspellingen te doen voor waarden van X buiten het bereik van de waarnemingen in de steekproef.

Signup and view all the flashcards

Spreidingsdiagram voor extrapolatie?

Een spreidingsdiagram helpt je om het verband tussen variabelen te visualiseren en te controleren of een lineair model geschikt is voor extrapolatie.

Signup and view all the flashcards

Uitschieters en extrapolatie?

Uitschieters in de data kunnen de regressielijn sterk beïnvloeden, wat tot onnauwkeurige extrapolaties kan leiden.

Signup and view all the flashcards

Voorspellingen buiten het bereik?

Extrapolatie, het voorspellen buiten de data, is vaak onbetrouwbaar. De relatie tussen variabelen kan veranderen buiten het geobserveerde interval.

Signup and view all the flashcards

Verborgen variabelen en extrapolatie?

Verborgen factoren kunnen de relatie tussen variabelen beïnvloeden, wat de extrapolatie kan beïnvloeden.

Signup and view all the flashcards

Correlatie impliceert geen causaliteit?

Een sterke correlatie tussen variabelen betekent niet noodzakelijk dat de ene variabele de andere veroorzaakt.

Signup and view all the flashcards

Spreidingsdiagram controleren?

Gebruik altijd een spreidingsdiagram om de lineariteit van de relatie tussen variabelen te controleren voordat je extrapolatie toepast.

Signup and view all the flashcards

Uitschieters en regressie?

Uitschieters kunnen de regressielijn sterk beïnvloeden en extrapolatie misleidend maken.

Signup and view all the flashcards

χ²: Wat meet het?

De χ²-waarde is een maat voor de afwijking tussen de geobserveerde en verwachte frequenties in een kruistabel. Hoe groter de χ²-waarde, hoe groter de afwijking en hoe sterker het verband tussen de variabelen.

Signup and view all the flashcards

χ² = 0: Betekenis?

Als de χ²-waarde 0 is, betekent dit dat er geen verschil is tussen de geobserveerde en verwachte frequenties. Dit duidt op volledige onafhankelijkheid tussen de variabelen.

Signup and view all the flashcards

χ²: Hoe interpreteer je de waarde?

Hoe groter de χ²-waarde, hoe sterker het verband tussen de variabelen. Dit betekent dat er een significant verschil is tussen de geobserveerde en verwachte frequenties.

Signup and view all the flashcards

De Φ-coëfficiënt: Wat is het?

De Φ-coëfficiënt is een maat voor associatie die wordt gebruikt voor 2×2 kruistabellen (vier cellen) en meet de sterkte van het verband tussen twee nominale variabelen.

Signup and view all the flashcards

Φ = 0: Betekenis?

Als Φ = 0, betekent dit dat er geen verband is tussen de variabelen (volledige onafhankelijkheid).

Signup and view all the flashcards

Φ > 0: Betekenis?

Een positieve Φ-waarde (> 0) duidt op een positieve samenhang, wat betekent dat hogere waarden van de ene variabele samenhangen met hogere waarden van de andere.

Signup and view all the flashcards

De maximale Φ-waarde: Hoe bereken je?

De maximale waarde van Φ hangt af van het kleinste aantal rijen of kolommen in de kruistabel. De maximale Φ² wordt gegeven door: Maximale Φ² = L-1, waarbij L het kleinste aantal rijen of kolommen is.

Signup and view all the flashcards

Contingentiecoëfficiënt (C): Wat is het?

De contingentiecoëfficiënt (C) is een maat voor de sterkte van het verband tussen twee categorische variabelen. C = 0 betekent dat er geen verband is.

Signup and view all the flashcards

Study Notes

Statistische Meetniveaus en Beschrijvende statistiek

  • Meetniveaus: Categorische variabelen worden weergegeven met kolommendiagrammen, staafdiagrammen, strookdiagrammen, taartdiagrammen, enz.; kwantitatieve variabelen worden weergegeven met histogrammen, staafdiagrammen, frequentieveelhoeken, cumulatieve histogrammen, stamschrijvingsdiagrammen en tijdplots.
  • Verdeling van een variabele: geeft weer welke waarden die variabele kan aannemen en hoe vaak die waarden voorkomen.
  • Frequentieverdeling: een tabel waarin de frequentie van voorkomen van elke waarde van een variabele wordt weergegeven.
  • Samenvattende tabel: Geeft het aantal, het percentage meisjes en het gemiddelde van wiskundige scores van verschillende scholen weer.
  • Frequentietafel: toont de frequentie en het cumulatieve percentage van waarden voor een variabele. Cumulatieve frequentie: frequentie tot en met die specifieke waarde. Cumulatief percentage: percentage van waarnemingen tot en met die specifieke waarde.

Grafische voorstellingen van kwalitatieve data

  • Kolommendiagram: gebruik voor categorische variabelen met vaak voorkomende waarden.
  • Strookdiagram: goed alternatief voor kolommendiagrammen.
  • Taartdiagram: geeft verhoudingen weer als stukken van een cirkel.
  • Pictogram: vertegenwoordigt waarden door symbolen, maar kan misleidend zijn als grootte niet correct is vastgesteld.

Grafische voorstellingen van kwantitatieve data

  • Histogram: geeft de verdeling van frequenties weer in klassen.
  • Staafdiagram: alternatief voor histogram.
  • Frequentieveelhoek: een lijnplot van de frequenties.
  • Cumulatieve histogram: cumulatieve frequenties per klasse, geschikt voor accumulatieve data.
  • Stam-en-blad diagram: beschrijft de verdeling van data in een geordende manier.
  • Tijdplot: verandert waarden van een variabele in de tijd, bijv. aandelenkoersen.

Besluit grafische voorstellingen

  • Sommige mooie grafische voorstellingen zijn ronduit misleidend!
  • Kolommen- en strookdiagrammen zijn vaak de beste keuze.
  • 3D-voorstellingen zijn vaak lastig af te lezen, vermijd pictogrammen waar grootte onduidelijk is.
  • Zorg ervoor dat je de grafische voorstelling kiest die het beste aansluit bij de aard van de gebruikte variabele.

Centrummaten

  • Rekenkundig gemiddelde: de som van de waarden gedeeld door het aantal observaties. Gevoelig voor uitschieters.
  • Mediaan: de middelste waarde in een geordende dataset. Minder gevoelig voor uitschieters
  • Modus: de waarde met de hoogste frequentie.

Spreidingsmaten

  • Variatiebreedte: verschil tussen de grootste en kleinste waarde.
  • Interkwartielafstand (IKA): Verschil tussen Q1 en Q3; midden 50% van de data.
  • Standaarddeviatie: Gemiddelde afstand van de data tot het gemiddelde
  • Variantie: Gemiddelde van de gekwadrateerde afstanden van de data tot het gemiddelde

Kwartielen

  • Q1 en Q3: Delen de dataset in kwartalen: Q1 bevat 25% van de laagste waarden, Q3 bevat 75%.

Uitschieters

  • Uitschieters: observaties die sterk afwijken van de andere waarnemingen.
  • Regel: Uitschieters zijn waarnemingen die buiten Q1-1.5IKA en Q3+1.5IKA vallen.

Regressie en correlatie

  • Spreidingsdiagram: Visualiseert de relatie tussen twee kwantitatieve variabelen.
  • Correlatiecoëfficiënt (r): meet de sterkte en richting van een lineaire relatie. Waarden liggen tussen -1 en +1.
  • Determinatiecoëfficiënt (r²): Fractie verklaarde variantie in variabele Y door variabele X.
  • Regressielijn: "best passende lijn" door datapoints, voorspelling van Y op basis van X
  • Residuen: De verschillen tussen de waargenomen Y-waarden en de voorspelde Y-waarden op basis van de lineaire regressie lijn.

Normale verdelingen

  • Normaalverdeling: symmetrische klokvormige verdeling.
  • 68-95-99,7 regel: Geschat percentage observaties binnen bepaalde afstanden van het gemiddelde in een normaal verdeelde dataset (bijv. 1, 2, en 3 SD van het gemiddelde).
  • Z-score: Gestandaardiseerde waarde van een observatie, uitgedrukt in standaarddeviaties ten opzichte van het gemiddelde.
  • Proportie onder of boven een bepaalde z-score: Normale verdelingstabel gebruiken.

Contingency Tables

  • Marginale verdelingen: Totaal aantal of percentages per categorie voor de afzonderlijke variabelen, zonder rekening te houden met de andere variabelen.
  • Voorwaardelijke verdelingen: Beschrijft hoe de verdeling van een variabele verandert afhankelijk van een waarde van een andere variabele.
  • Simpson's paradox: verband tussen twee variabelen kan veranderen of zelfs omkeren wanneer je een derde variabele in acht neemt.
  • χ²-test: Test de statistische onafhankelijkheid tussen twee categorische variabelen. Vergelijk de geobserveerde frequenties met de verwachte frequenties, gegeven onafhankelijkheid.
  • Contingentiecoëfficiënt (C): maat voor associatie die wordt gebruikt in kruistabellen met meerdere categorieën. Waarden liggen tussen 0 en 1, waarbij 0 geen verband duidt.
  • Rangcorrelatiecoëfficiënt (Ï„ van Kendall, γ, rs (Spearman)): Maten voor associatie tussen variabelen, gebaseerd op rangordes i.p.v scores. Nuttig bij sterk niet-lineaire verbanden en nominale variabelen.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Statistiek - Hfst 1 (PDF)

Description

Test je kennis over normaalverdelingen en spreidingsmaten in deze quiz. Leer over belangrijke concepten zoals de 68-95-99.7 regel, skewness, en de betekenis van kwartielen. Ideaal voor studenten die de basisprincipes van statistiek willen begrijpen.

More Like This

Use Quizgecko on...
Browser
Browser