Statistiek
45 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Wat is het doel van discretisatie in een uitkomstenverzameling?

  • Om te zorgen voor nauwkeurige histogrammen
  • Om de uitkomstenverzameling te vereenvoudigen (correct)
  • Om alle unieke waarden te tellen
  • Om het aantal klassen te maximaliseren

Wat is een nadeel van het groeperen van gegevens in klassen?

  • Klassen worden altijd van gelijke breedte
  • Er gaat informatie verloren (correct)
  • De gegevens worden moeilijker te begrijpen
  • Er wordt meer informatie verkregen

Welke eigenschap heeft een klassiek histogram?

  • De hoogte komt overeen met de klassebreedte
  • Boven elk klassemidden wordt een rechthoek geplaatst (correct)
  • Het gebruik van lijnen om frequenties weer te geven
  • Het toont uitsluitend discrete gegevens

Wat gebeurt er als de klassebreedte in een histogram wordt gewijzigd?

<p>De indruk die het histogram geeft kan veranderen (C)</p> Signup and view all the answers

Wat geeft de hoogte van een rechthoek in een klassiek histogram aan?

<p>De absolute frequentie binnen de klasse (A)</p> Signup and view all the answers

Wat beschrijft een positieve lineaire associatie tussen januari- en julitemperatuur?

<p>Steden met hoge januari temperaturen hebben ook hoge julitemperaturen. (A)</p> Signup and view all the answers

Wat geeft een sterke associatie aan tussen twee variabelen?

<p>De waarde van de ene variabele hangt dicht af van de waarde van de andere. (B)</p> Signup and view all the answers

Wat betekent het als de associatie tussen variabele X en Y negatief is?

<p>Wanneer X toeneemt, neemt Y af. (A)</p> Signup and view all the answers

Wat geeft de Pearson correlatiecoëfficiënt aan?

<p>De sterkte van de lineaire associatie tussen twee variabelen. (B)</p> Signup and view all the answers

Wat duidt op een zwakke associatie in een scatterplot?

<p>Een grote spreiding van de punten rond de lijn. (D)</p> Signup and view all the answers

Wat is een indicatie dat er een logaritmische associatie is?

<p>De punten volgen een kromme boog. (D)</p> Signup and view all the answers

Hoe kan de scatterplot worden verdeeld om associaties te analyseren?

<p>In vier kwadranten rondom het gemiddelde van beide variabelen. (D)</p> Signup and view all the answers

Welke interpretatie is juist als er meer observaties in het eerste en derde kwadrant zijn?

<p>De twee variabelen hebben een positieve associatie. (B)</p> Signup and view all the answers

Welke uitspraak is waar over de covariantie tussen twee variabelen?

<p>De grootte van de covariantie hangt af van de gebruikte meeteenheid. (A)</p> Signup and view all the answers

Wat kan worden gezegd over de correlatiecoëfficiënt?

<p>De correlatiecoëfficiënt is dimensieloos. (D)</p> Signup and view all the answers

Wat gebeurt er met de correlatiecoëfficiënt als de puntenwolk 'fijner' is?

<p>De correlatiecoëfficiënt nadert de extremen -1 of 1. (C)</p> Signup and view all the answers

Wat betekent het als r dicht bij 0 ligt voor de associatie tussen twee variabelen?

<p>Er is geen associatie tussen de variabelen. (C)</p> Signup and view all the answers

Wanneer is het zinvol om de correlatiecoëfficiënt r te gebruiken?

<p>Bij lineaire associaties tussen variabelen. (C)</p> Signup and view all the answers

Wat is een belangrijke opmerking over correlatie tussen twee variabelen?

<p>Correlatie kan ook optreden zonder dat er een verband is. (A)</p> Signup and view all the answers

Wat zegt de correlatiecoëfficiënt r = -1 over de relatie tussen twee variabelen?

<p>Er is een sterke negatieve lineaire relatie. (C)</p> Signup and view all the answers

Wat gebeurt er bij een product van deviatiescores in ... ?

<p>Het product is positief als beide waarden groen zijn. (C), Het product is negatief als beide waarden rood zijn. (D)</p> Signup and view all the answers

Wat is de betekenis van de z-score in een steekproef?

<p>Het geeft de positie van een waarde aan ten opzichte van het gemiddelde in termen van standaarddeviaties. (C)</p> Signup and view all the answers

Wat gebeurt er met het steekproefgemiddelde bij een lineaire transformatie?

<p>Het verandert op dezelfde manier als de oorspronkelijke steekproefgegevens. (B)</p> Signup and view all the answers

Wat kan worden gezegd over de correlatiecoëfficiënt tussen twee onafhankelijke variabelen?

<p>Het is altijd gelijk aan 0. (C)</p> Signup and view all the answers

Waarom zijn transformaties nuttig in data-analyse?

<p>Ze helpen om data op een andere manier weer te geven, zoals van Fahrenheit naar Celsius. (B)</p> Signup and view all the answers

Wat is de betekenis van covariantie tussen twee variabelen?

<p>Het is een maat voor de samenhang tussen twee kwantitatieve toevalsvariabelen. (A)</p> Signup and view all the answers

Wat is een belangrijke eigenschap van de steekproefgemiddelde van z-scores?

<p>Het is altijd gelijk aan 0. (D)</p> Signup and view all the answers

Wat is de relatie tussen variantie en covariantie?

<p>De covariantie van een variabele met zichzelf is gelijk aan de variantie van de variabele. (D)</p> Signup and view all the answers

Wat is een kenmerk van de correlatiecoëfficiënt?

<p>Het ligt altijd tussen -1 en 1. (D)</p> Signup and view all the answers

Wat gebeurt er met de standaardfout als de steekproefgrootte toeneemt?

<p>De standaardfout neemt af. (A)</p> Signup and view all the answers

Waarom is de centrale limietstelling (CLS) belangrijk?

<p>Het verklaart waarom som van variabelen normaal verdeeld kan zijn. (A)</p> Signup and view all the answers

Wat is het gevolg van een kleinere standaardfout?

<p>Het steekproefgemiddelde ligt dichter bij het populatiegemiddelde. (B)</p> Signup and view all the answers

Wat is het gemiddelde van de detentieperiode in de gegeven oefening?

<p>7 maanden (D)</p> Signup and view all the answers

Waarom mag je niet aannemen dat de detentietijd normaal verdeeld is?

<p>Er is geen informatie gegeven over de verdeling. (C)</p> Signup and view all the answers

Wat is het percentage Vlamingen dat aangeeft zich nooit onveilig te voelen in hun buurt?

<p>30% (D)</p> Signup and view all the answers

Wat is de relatie tussen steekproefgrootte en de verwachte variatie van het steekproefgemiddelde?

<p>Een grotere steekproef betekent minder variatie. (C)</p> Signup and view all the answers

Wat geeft de standaardafwijking aan in de context van detentietijden?

<p>De spreiding van de detentietijden rond het gemiddelde. (C)</p> Signup and view all the answers

Waarom is een grotere klassebreedte gewenst bij het maken van histogrammen?

<p>Om een minder gepiekte figuur te creëren. (D)</p> Signup and view all the answers

Wat geeft de hoogte van een dichtheidshistogram aan?

<p>De relatieve frequentie gedeeld door de klassebreedte. (B)</p> Signup and view all the answers

Wat is het gevolg van het tekenen van een dichtheidshistogram?

<p>De totale oppervlakte van de ruimte tussen de horizontale as en het dichtheidshistogram is gelijk aan 1. (A)</p> Signup and view all the answers

Welke uitspraak is waar over een perfect symmetrische verdeling?

<p>Perfect symmetrische histogrammen bestaan niet in de praktijk. (D)</p> Signup and view all the answers

Welke factor is niet verantwoordelijk voor de vorm van een histogram?

<p>De totale aantal observaties. (A)</p> Signup and view all the answers

Wat geeft de som van alle frequenties in een dataset aan?

<p>De totale observaties in die dataset. (B)</p> Signup and view all the answers

Wat zijn de kenmerken van een dichtheidshistogram ten opzichte van een standaard histogram?

<p>De hoogte is gebaseerd op relatieve frequenties gedeeld door klassebreedte. (B)</p> Signup and view all the answers

Welke situatie leidt tot een schijnbare overschatting van het aantal steden met een groot bevolkingsaantal?

<p>Het toepassen van een te kleine klassebreedte. (D)</p> Signup and view all the answers

Flashcards

Continue of discrete uitkomstenverzameling met veel verschillende waarden

Een set van data met veel verschillende waarden, waar het onpraktisch is om de frequentie van elke individuele waarde te tellen.

Discretisatie of groepering van data

Het proces van het opdelen van een continue uitkomstenverzameling in kleinere intervallen of klassen.

Klassebreedte (∆)

De breedte van een klasse in een gegroepeerde dataset.

Klassiek histogram

Een grafische voorstelling van data waarbij de frequentie van elke klasse wordt weergegeven met een rechthoek. De breedte van de rechthoek is gelijk aan de klassebreedte en de hoogte is gelijk aan de frequentie.

Signup and view all the flashcards

Dichtheidshistogram

Een visuele voorstelling van data die de frequentie van elke klasse met een variabele breedte weergeeft.

Signup and view all the flashcards

Scatterplot

Een grafische voorstelling van de relatie tussen twee variabelen, waarbij elke observatie wordt voorgesteld door een punt.

Signup and view all the flashcards

Associatie tussen twee variabelen

De mate waarin de twee variabelen in een scatterplot samenhangen.

Signup and view all the flashcards

Positieve associatie

Een associatie waarbij de waarde van de ene variabele toeneemt naarmate de waarde van de andere variabele toeneemt.

Signup and view all the flashcards

Negatieve associatie

Een associatie waarbij de waarde van de ene variabele afneemt naarmate de waarde van de andere variabele toeneemt.

Signup and view all the flashcards

Lineaire associatie

Een associatie waarbij de relatie tussen twee variabelen rechtlijnig is.

Signup and view all the flashcards

Logaritmische associatie

Een associatie waarbij de relatie tussen twee variabelen niet rechtlijnig is, maar een boog vormt.

Signup and view all the flashcards

Pearson correlatiecoëfficiënt

Een maat voor de sterkte van de lineaire associatie tussen twee variabelen. De waarde ligt tussen -1 en 1.

Signup and view all the flashcards

Spreiding in puntenwolk

Een maat voor de variatie rond de rechte lijn die de associatie tussen twee variabelen beschrijft.

Signup and view all the flashcards

Klassebreedte aanpassen

Wanneer data in een histogram geclusterd zijn, kunnen individuele observaties minder duidelijk zichtbaar zijn. Om dit te verhelpen kunnen we klassen samensmelten. Dit betekent dat we meerdere klassen combineren tot één nieuwe klasse met een grotere breedte.

Signup and view all the flashcards

Oppervlakte van het dichtheidshistogram

De totale oppervlakte onder het dichtheidshistogram is gelijk aan 1. Dit betekent dat de som van de oppervlakten van alle rechthoeken in het histogram 1 is. Dit maakt het mogelijk om de relatieve frequenties van verschillende klassen te vergelijken.

Signup and view all the flashcards

Frequentiedichtheid

Een frequentiedichtheid is een maat voor de concentratie van observaties binnen een bepaalde klasse in een histogram. Het wordt berekend door de relatieve frequentie van de klasse te delen door de klassebreedte, en geeft aan hoeveel observaties gemiddeld per eenheid van de variabele in de klasse voorkomen.

Signup and view all the flashcards

Symmetrische verdeling

Een symmetrische verdeling is een verdeling waarbij de linker- en rechterhelft van het histogram spiegelsymmetrisch zijn ten opzichte van het middelpunt. Dit betekent dat er een gelijke hoeveelheid observaties aan beide zijden van het middelpunt ligt. In de praktijk zijn verdelingen vaak niet perfect symmetrisch, maar benaderen ze symmetrie.

Signup and view all the flashcards

Histogram

Een histogram is een grafiek die de frequentie van observaties in verschillende klassen toont. De X-as van het histogram geeft de klassen aan en de Y-as geeft de frequentie of relatieve frequentie van de observaties in elke klasse aan. Het histogram is een nuttig hulpmiddel om de verdeling van data te visualiseren.

Signup and view all the flashcards

Vorm van de verdeling

De vorm van de verdeling van data heeft betrekking op de manier waarop de data verdeeld is over de verschillende klassen. De vorm kan symmetrisch, scheef of bimodaal zijn, en wordt gevisualiseerd door middel van het staafdiagram of histogram.

Signup and view all the flashcards

Staafdiagram/histogram en verdeling

Het staafdiagram/histogram geeft informatie over de vorm van de verdeling van data. Een symmetrische vorm duidt op een gelijke verdeling van data aan beide zijden van het middenpunt.

Signup and view all the flashcards

Covariantie (Sxy)

De som van de producten van de deviatiescores van twee variabelen, gedeeld door (n-1), waarbij n het aantal observaties is.

Signup and view all the flashcards

Correlatiecoëfficiënt (r)

De sterkte van de lineaire samenhang tussen twee variabelen, onafhankelijk van de gebruikte meeteenheden.

Signup and view all the flashcards

Perfecte correlatie

Een waarde van 1 of -1 in de correlatiecoëfficiënt, wat aangeeft dat alle punten op een rechte lijn liggen. Een positieve waarde betekent een stijgende, een negatieve waarde betekent een dalende lijn.

Signup and view all the flashcards

Geen associatie

Een correlatiecoëfficiënt dicht bij 0, wat suggereert dat er weinig lineaire samenhang is.

Signup and view all the flashcards

Correlatie impliceert geen causaliteit

De waarde van de correlatiecoëfficiënt hangt af van de specifieke data en is geen causale relatie tussen de variabelen.

Signup and view all the flashcards

Sterkte van correlatie

De variabiliteit van de data rond de trendlijn in een scatterplot. Hoe dichter de punten bij de lijn liggen, hoe sterker de correlatie.

Signup and view all the flashcards

Richting van correlatie

De richting van de lineaire samenhang tussen twee variabelen. Positief als de variabelen in dezelfde richting veranderen, negatief als ze in tegengestelde richtingen veranderen.

Signup and view all the flashcards

Interkwartielafstand

De spreiding van data rond het centrum van de data, gemeten als de afstand tussen het eerste en derde kwartiel.

Signup and view all the flashcards

Variantie en standaarddeviatie

De variantie is een maat voor de spreiding van data rond het gemiddelde. De standaarddeviatie is de wortel uit de variantie.

Signup and view all the flashcards

Transformaties en Gemiddelde

Het gemiddelde van een lineair getransformeerde dataset zal op dezelfde manier transformeren als de oorspronkelijke dataset.

Signup and view all the flashcards

Covariantie

De samenhang tussen twee variabelen X en Y, die meet hoe sterk ze samen veranderen.

Signup and view all the flashcards

Correlatiecoëfficiënt

De gestandaardiseerde covariantie tussen twee variabelen X en Y, die altijd tussen -1 en 1 ligt.

Signup and view all the flashcards

Onafhankelijkheid van variabelen

Twee variabelen zijn onafhankelijk als hun covariantie en correlatiecoëfficiënt gelijk zijn aan 0.

Signup and view all the flashcards

Verwachte waarde

De verwachte waarde van een toevalsvariabele wordt berekend als het gemiddelde over alle mogelijke uitkomsten.

Signup and view all the flashcards

Lineaire combinaties

Een lineaire combinatie van twee variabelen wordt gecreëerd door de variabelen te vermenigvuldigen met constante factoren en op te tellen.

Signup and view all the flashcards

Centrale Limietstelling (CLS)

De centrale limietstelling (CLS) stelt dat de verdeling van het steekproefgemiddelde van een grote steekproef (n ≥ 30) benaderd kan worden door een normale verdeling, ongeacht de verdeling van de oorspronkelijke populatie.

Signup and view all the flashcards

Standaardfout van het steekproefgemiddelde

De standaardfout van het steekproefgemiddelde is een maat voor de variabiliteit van het steekproefgemiddelde rond het populatiegemiddelde. Hoe kleiner de standaardfout, hoe dichter het steekproefgemiddelde bij het populatiegemiddelde ligt.

Signup and view all the flashcards

Invloed van steekproefgrootte op standaardfout

De standaardfout van het steekproefgemiddelde daalt naarmate de steekproefgrootte toeneemt. Dit betekent dat met een grotere steekproef, het steekproefgemiddelde dichter bij het populatiegemiddelde zal liggen.

Signup and view all the flashcards

Belang van de CLS

De CLS is een belangrijk concept omdat het ons toelaat om statistieken te gebruiken om populatieparameters te schatten, zelfs zonder dat we de exacte verdeling van de populatie kennen.

Signup and view all the flashcards

Veralgemeningen van de CLS

Er zijn verschillende veralgemeningen van de CLS die toepasbaar zijn in situaties waar de oorspronkelijke variabelen niet identiek verdeeld zijn. De CLS kan ook gebruikt worden om de verdeling van de som van een groot aantal variabelen te begrijpen.

Signup and view all the flashcards

Normale verdeling en CLS

De CLS verklaart waarom de normale verdeling vaak gebruikt wordt om te modelleren hoe variabelen zoals lengte en IQ verdeeld zijn. Dit komt omdat deze variabelen kunnen worden gezien als de som van een groot aantal factoren.

Signup and view all the flashcards

Nauwkeurigheid van schattingen

Hoewel de steekproefgrootte van invloed is op de standaardfout, betekent dit niet dat kleinere steekproeven altijd minder nauwkeurige schattingen opleveren.

Signup and view all the flashcards

Schatting van populatiepercentage

Een steekproef van 250 Vlamingen, waarbij 30% aangeeft zich nooit onveilig te voelen, kan gebruikt worden om het percentage Vlamingen dat zich nooit onveilig voelt in hun buurt te schatten.

Signup and view all the flashcards

Study Notes

Basisbegrippen statistiek voor criminologen

  • Statistiek omvat het verzamelen, analyseren en interpreteren van gegevens.
  • Criminologen gebruiken statistiek om patronen en verbanden in crimineel gedrag te identificeren.
  • Een populatie is de complete groep van mensen/objecten over wie men een uitspraak wil doen.
  • Een steekproef is een deel van de populatie die representatief is voor de hele populatie.
  • Een steekproefgrootte (ook wel 'n') is het aantal mensen/objecten in de steekproef. Hoe groter n, hoe beter de steekproef representatief is voor de populatie.
  • Een variabele beschrijft een kenmerk dat gemeten wil worden binnen een steekproef.
  • Kwalitatieve variabelen beschrijven een kenmerk door labels die niet direct of makkelijk tot een getal te reduceren zijn (vb geslacht, politieke overtuigingen,...)
  • Kwantitatieve variabelen worden gemeten door variabelen met een numerieke waarde (vb leeftijd, aantal overtredingen,...)

Hoofdstuk 1: Doel van statistiek

  • Interpretatie: Persoonlijke ervaring(en) of observaties kunnen de interpretatie van gegevens beïnvloeden.
  • Verzamelen van gegevens: Een doelgerichte dataverzameling is essentieel om valide interpretaties of/en conclusies te trekken.
    • Vraagstelling: Wat wil je onderzoeken?
  • Populatie: de volledige groep (objecten/personen) waarover je een uitspraak wilt doen.
    • In het voorbeeld: Vlaamse jongeren tussen de 14 en 18 jaar.
  • Steekproef: Een subset van de populatie (objecten/personen) dat een representatief beeld vormt van de populatie.
    • In het voorbeeld: ongeveer 4.000 Vlaamse jongeren tussen de 14 en 18 jaar.
  • Kenmerken: specifieke elementen/eigenschappen die je gaat onderzoeken binnen een steekproef
    • vb. leeftijd, geslacht

Meetniveaus

  • Nominaal: Kwalitatief/categorisch, geen ordening/rangorde (vb. geslacht, nationaliteit). Je kan tellen, maar niet rekenen of ordenen op deze variabelen.
  • Ordinaal: Kwalitatief/categorisch, met ordening/rangorde (vb. behoefte aan gehoorbescherming). De afstand tussen de categorieën is niet gelijk
  • Metrisch: Kwantitatief, met een ordening en gelijke afstanden tussen de metingen (vb leeftijd). Je kan tellen, rekenen en ordenen bij deze variabelen.
    • Discreet: Metrische variabele met afzonderlijke (discontinue) waarden (vb. aantal studenten).
    • Continu: Metrische variabele met een continuo bereik zoals je gewicht.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Samenvatting Statistiek PDF

Description

Test je kennis over discretisatie, histogrammen en associaties tussen variabelen. Dit quiz behandelt belangrijke concepten zoals Pearson correlatiecoëfficiënt en covariantie. Ontdek hoe je gegevens kunt groeperen en analyseren met behulp van statistische technieken.

More Like This

Business Statistics and Data Analysis Fundamentals
12 questions
Data Visualization and Analysis using Python
40 questions
Statistics and Data Analysis Quiz
24 questions

Statistics and Data Analysis Quiz

AdjustableCarnelian6533 avatar
AdjustableCarnelian6533
Use Quizgecko on...
Browser
Browser