Statistiek - Normaalverdeling en Spreidingsmaten
42 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Wat is de vorm van een normaalverdeling?

  • Rechthoekig
  • Ovale
  • Klok-vormig (correct)
  • Triangulair
  • Welke uitspraak over normaalverdelingen is correct?

  • Ze worden volledig bepaald door de mediaan.
  • Ze zijn altijd scheef.
  • Ze zijn unimodaal. (correct)
  • Ze hebben meerdere toppen.
  • Wat beschrijft de 68-95-99.7 regel in de normaalverdeling?

  • Alle observaties zijn gelijk verspreid over het bereik.
  • 99.7% van de observaties ligt binnen een bereik van 3 quartielen.
  • 68% van de observaties ligt tussen de mediaan en het quartiel.
  • 95% van de observaties ligt binnen 2 standaarddeviaties van het gemiddelde. (correct)
  • Wat bepaalt volledig de normaalverdeling?

    <p>De verwachting (gemiddelde) en standaarddeviatie</p> Signup and view all the answers

    Welke waarde van de skewness (g1) is typerend voor een normaalverdeling?

    <p>0</p> Signup and view all the answers

    Wat is het kwartiel Q1?

    <p>De waarde waarvoor de cumulatieve frequentie ¼ van het aantal waarnemingen bedraagt.</p> Signup and view all the answers

    Hoe wordt de interkwartielafstand gedefinieerd?

    <p>Het verschil tussen Q1 en Q3, wat 50% van de data beschrijft.</p> Signup and view all the answers

    Wat beschrijft de interdecielafstand?

    <p>De afstand tussen het 1e en het 9e deciel van een dataset.</p> Signup and view all the answers

    Wat is de cumulatieve frequentie van Q2?

    <p>50% van het totaal aantal waarnemingen.</p> Signup and view all the answers

    Wat is de primaire functie van spreidingsmaten?

    <p>Om de variabiliteit of spreiding van een dataset te beschrijven.</p> Signup and view all the answers

    Wat is een kenmerk van een correcte klassenindeling voor data-analyse?

    <p>Klassen zijn exhaustief en disjunct.</p> Signup and view all the answers

    Welke grafische voorstelling is geschikt voor nominale data?

    <p>Staafdiagram.</p> Signup and view all the answers

    Wat gebeurt er met de klassen tijdens het maken van een histogram voor ordinale data?

    <p>Klassen moeten in stijgende volgorde worden weergegeven.</p> Signup and view all the answers

    Wat beschrijft een asymmetrische verdeling die scheef naar rechts is?

    <p>De rechterzijde bevat de hoogste waarden met een langere staart.</p> Signup and view all the answers

    Wat is een belangrijke stap bij het analyseren van een dataset?

    <p>Het bekijken van algemene patronen en opvallende afwijkingen.</p> Signup and view all the answers

    Wat is een definitie van een uitschieter in data-analyse?

    <p>Een gegeven dat een bijzondere waarde heeft buiten het algemene patroon.</p> Signup and view all the answers

    Bij welke datatypes heeft de ruimte tussen kolommen betekenis in de grafische voorstellingen?

    <p>Interval- en ratio data.</p> Signup and view all the answers

    Wat betekent het dat een verdeling symmetrisch is?

    <p>De linker en rechter helften zijn elkaars spiegelbeeld.</p> Signup and view all the answers

    Wat geeft een z-score aan?

    <p>Hoeveel standaardafwijkingen een meetwaarde boven het gemiddelde ligt</p> Signup and view all the answers

    Wat is een kenmerk van de standaard normale verdeling?

    <p>De verwachting is gelijk aan 0 en de standaardafwijking is gelijk aan 1</p> Signup and view all the answers

    Wat gebeurt er wanneer data op een continue schaal worden gegroepeerd in klassen?

    <p>Afgeronde waarden worden aan de laagste klasse toegewezen</p> Signup and view all the answers

    Wat is de rol van de verklaarde variabele?

    <p>Deze variabele meet een uitkomst van een studie</p> Signup and view all the answers

    Hoe wordt de samenhang tussen twee variabelen doorgaans gekarakteriseerd?

    <p>Door de correlatiecoëfficiënt te meten</p> Signup and view all the answers

    Wat moet er in aanmerking worden genomen bij het afronden van continue gegevens?

    <p>Gewone afrondingsregels</p> Signup and view all the answers

    Wat is het effect van de verklaring van de verklaarde variabele op de verklaarbare variabele?

    <p>Het stelt ons in staat de waarde beter te voorspellen</p> Signup and view all the answers

    Waarom is de expectatie van een normaalverdeling belangrijk?

    <p>Omdat het de locatie van de piek in de verdeling bepaalt</p> Signup and view all the answers

    Wat is extrapolatie?

    <p>Het gebruik van een regressiemodel om voorspellingen te doen buiten het bereik van waarnemingen.</p> Signup and view all the answers

    Welke factor kan de relatie tussen X en Y beïnvloeden zonder dat deze wordt opgenomen in de analyse?

    <p>Verborgen variabelen zoals genetica of voeding.</p> Signup and view all the answers

    Waarom zijn voorspellingen buiten het bereik van waarnemingen vaak onbetrouwbaar?

    <p>De regressielijn kan afwijken van de werkelijke waarde.</p> Signup and view all the answers

    Wat moet je doen voordat je een regressiemodel toepast?

    <p>Een spreidingsdiagram gebruiken om het verband visueel te evalueren.</p> Signup and view all the answers

    Wat kan een uitschieter in de dataset beïnvloeden?

    <p>De lineaire regressielijn.</p> Signup and view all the answers

    Wat is een belangrijk aandachtspunt bij het werken met correlatie en regressie?

    <p>Blijven binnen het bereik van waarnemingen bij het doen van voorspellingen.</p> Signup and view all the answers

    Wat impliceert een lineaire correlatie tussen X en Y?

    <p>Een verhoogde correlatie kan niet betekenen dat X Y beïnvloedt.</p> Signup and view all the answers

    Wat kan een indicatie zijn dat een lineair model mogelijk niet geschikt is?

    <p>Duidelijke krommingen zichtbaar in het spreidingsdiagram.</p> Signup and view all the answers

    Wat betekent een χ²-waarde van 0?

    <p>De variabelen zijn volledig onafhankelijk.</p> Signup and view all the answers

    Wat geeft een Φ-coëfficiënt van 0 aan?

    <p>Er is geen verband tussen de variabelen.</p> Signup and view all the answers

    Hoe wordt de Φ-coëfficiënt berekend?

    <p>Met de formule Φ = √(χ²/N).</p> Signup and view all the answers

    Wat geeft een hogere absolute waarde van Φ aan?

    <p>Een sterkere relatie tussen de variabelen.</p> Signup and view all the answers

    Wat is een kenmerk van de contingentiecoëfficiënt (C)?

    <p>C meet het verband tussen twee categorische variabelen.</p> Signup and view all the answers

    Wat betekent een positieve waarde van de Φ-coëfficiënt?

    <p>Dat hogere waarden van de ene variabele samenhangen met hogere waarden van de andere.</p> Signup and view all the answers

    Wat duidt een χ²-waarde aan die groter is dan 0 aan?

    <p>De variabelen vertonen een verband.</p> Signup and view all the answers

    Waarom is de Φ-coëfficiënt bijzonder voor 2×2 kruistabellen?

    <p>Omdat het eenvoudig en intuïtief is voor deze tabellen.</p> Signup and view all the answers

    Study Notes

    Statistische Meetniveaus en Beschrijvende statistiek

    • Meetniveaus: Categorische variabelen worden weergegeven met kolommendiagrammen, staafdiagrammen, strookdiagrammen, taartdiagrammen, enz.; kwantitatieve variabelen worden weergegeven met histogrammen, staafdiagrammen, frequentieveelhoeken, cumulatieve histogrammen, stamschrijvingsdiagrammen en tijdplots.
    • Verdeling van een variabele: geeft weer welke waarden die variabele kan aannemen en hoe vaak die waarden voorkomen.
    • Frequentieverdeling: een tabel waarin de frequentie van voorkomen van elke waarde van een variabele wordt weergegeven.
    • Samenvattende tabel: Geeft het aantal, het percentage meisjes en het gemiddelde van wiskundige scores van verschillende scholen weer.
    • Frequentietafel: toont de frequentie en het cumulatieve percentage van waarden voor een variabele. Cumulatieve frequentie: frequentie tot en met die specifieke waarde. Cumulatief percentage: percentage van waarnemingen tot en met die specifieke waarde.

    Grafische voorstellingen van kwalitatieve data

    • Kolommendiagram: gebruik voor categorische variabelen met vaak voorkomende waarden.
    • Strookdiagram: goed alternatief voor kolommendiagrammen.
    • Taartdiagram: geeft verhoudingen weer als stukken van een cirkel.
    • Pictogram: vertegenwoordigt waarden door symbolen, maar kan misleidend zijn als grootte niet correct is vastgesteld.

    Grafische voorstellingen van kwantitatieve data

    • Histogram: geeft de verdeling van frequenties weer in klassen.
    • Staafdiagram: alternatief voor histogram.
    • Frequentieveelhoek: een lijnplot van de frequenties.
    • Cumulatieve histogram: cumulatieve frequenties per klasse, geschikt voor accumulatieve data.
    • Stam-en-blad diagram: beschrijft de verdeling van data in een geordende manier.
    • Tijdplot: verandert waarden van een variabele in de tijd, bijv. aandelenkoersen.

    Besluit grafische voorstellingen

    • Sommige mooie grafische voorstellingen zijn ronduit misleidend!
    • Kolommen- en strookdiagrammen zijn vaak de beste keuze.
    • 3D-voorstellingen zijn vaak lastig af te lezen, vermijd pictogrammen waar grootte onduidelijk is.
    • Zorg ervoor dat je de grafische voorstelling kiest die het beste aansluit bij de aard van de gebruikte variabele.

    Centrummaten

    • Rekenkundig gemiddelde: de som van de waarden gedeeld door het aantal observaties. Gevoelig voor uitschieters.
    • Mediaan: de middelste waarde in een geordende dataset. Minder gevoelig voor uitschieters
    • Modus: de waarde met de hoogste frequentie.

    Spreidingsmaten

    • Variatiebreedte: verschil tussen de grootste en kleinste waarde.
    • Interkwartielafstand (IKA): Verschil tussen Q1 en Q3; midden 50% van de data.
    • Standaarddeviatie: Gemiddelde afstand van de data tot het gemiddelde
    • Variantie: Gemiddelde van de gekwadrateerde afstanden van de data tot het gemiddelde

    Kwartielen

    • Q1 en Q3: Delen de dataset in kwartalen: Q1 bevat 25% van de laagste waarden, Q3 bevat 75%.

    Uitschieters

    • Uitschieters: observaties die sterk afwijken van de andere waarnemingen.
    • Regel: Uitschieters zijn waarnemingen die buiten Q1-1.5IKA en Q3+1.5IKA vallen.

    Regressie en correlatie

    • Spreidingsdiagram: Visualiseert de relatie tussen twee kwantitatieve variabelen.
    • Correlatiecoëfficiënt (r): meet de sterkte en richting van een lineaire relatie. Waarden liggen tussen -1 en +1.
    • Determinatiecoëfficiënt (r²): Fractie verklaarde variantie in variabele Y door variabele X.
    • Regressielijn: "best passende lijn" door datapoints, voorspelling van Y op basis van X
    • Residuen: De verschillen tussen de waargenomen Y-waarden en de voorspelde Y-waarden op basis van de lineaire regressie lijn.

    Normale verdelingen

    • Normaalverdeling: symmetrische klokvormige verdeling.
    • 68-95-99,7 regel: Geschat percentage observaties binnen bepaalde afstanden van het gemiddelde in een normaal verdeelde dataset (bijv. 1, 2, en 3 SD van het gemiddelde).
    • Z-score: Gestandaardiseerde waarde van een observatie, uitgedrukt in standaarddeviaties ten opzichte van het gemiddelde.
    • Proportie onder of boven een bepaalde z-score: Normale verdelingstabel gebruiken.

    Contingency Tables

    • Marginale verdelingen: Totaal aantal of percentages per categorie voor de afzonderlijke variabelen, zonder rekening te houden met de andere variabelen.
    • Voorwaardelijke verdelingen: Beschrijft hoe de verdeling van een variabele verandert afhankelijk van een waarde van een andere variabele.
    • Simpson's paradox: verband tussen twee variabelen kan veranderen of zelfs omkeren wanneer je een derde variabele in acht neemt.
    • χ²-test: Test de statistische onafhankelijkheid tussen twee categorische variabelen. Vergelijk de geobserveerde frequenties met de verwachte frequenties, gegeven onafhankelijkheid.
    • Contingentiecoëfficiënt (C): maat voor associatie die wordt gebruikt in kruistabellen met meerdere categorieën. Waarden liggen tussen 0 en 1, waarbij 0 geen verband duidt.
    • Rangcorrelatiecoëfficiënt (τ van Kendall, γ, rs (Spearman)): Maten voor associatie tussen variabelen, gebaseerd op rangordes i.p.v scores. Nuttig bij sterk niet-lineaire verbanden en nominale variabelen.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Statistiek - Hfst 1 (PDF)

    Description

    Test je kennis over normaalverdelingen en spreidingsmaten in deze quiz. Leer over belangrijke concepten zoals de 68-95-99.7 regel, skewness, en de betekenis van kwartielen. Ideaal voor studenten die de basisprincipes van statistiek willen begrijpen.

    More Like This

    Use Quizgecko on...
    Browser
    Browser