Bases pour l’analyse descriptive et inférentielle (BASDI) PDF

Summary

This document provides a course plan for the BASDI course, focusing on descriptive and inferential statistics. It details objectives, chapters, sample questions and data analysis methodologies. The course appears to be part of a psychology or education program.

Full Transcript

Bases pour l’analyse descriptive et inférentielle (BASDI) Prof. Marielle BRUYNINCKX 2/48 Plan du cours 3/48 Chapitre 1 : statistique descriptive Tableaux de données et représentations graphiques Indice...

Bases pour l’analyse descriptive et inférentielle (BASDI) Prof. Marielle BRUYNINCKX 2/48 Plan du cours 3/48 Chapitre 1 : statistique descriptive Tableaux de données et représentations graphiques Indices statistiques (moyenne, mode, écart type, indices quantiles, note z, note u,..) Corrélation paramétrique – aspects descriptifs 4/48 Chapitre 2: statistique inférentielle Notions de probabilités et distributions théoriques (normale et binomiale) Échantillonnage Intervalles de confiance Tests statistiques (F de Snédécor, t de Student) 5/48 1. Statistique descriptive (Descriptive statistics) 6/48 A. Objectif 1: organiser et présenter les données recueillies lors d’une expérimentation, d’une enquête ou d’une observation → tableaux, représentations graphiques B. Objectif 2: caractériser l’ensemble des données par une valeur numérique → Indices statistiques 7/48 Tableaux de données 8/48 Hommes Femmes Haïti 60 66 Rép. Dom. 69 76 Jamaïque 68 73 Belgique 80 84 Norvège 82 85 RDC 57 65 Tableau 1 : espérance de vie à la naissance (2021) hommes/femmes – en années (source: worldbank, 2023) 9/48 Questions 1. Qui a la plus grande espérance de vie? Les hommes ou les femmes? 2. Cette constatation est-elle valable pour tous les pays présentés dans le tableau? 3. Dans quel pays les femmes ont-elles l’espérance de vie la plus courte? 4. Dans quel pays les hommes ont-ils l’espérance de vie la plus longue? 5. De combien est l’espérance de vie pour les femmes en Belgique? 10/48 Questions 1. Qui a la plus grande espérance de vie? Les hommes ou les femmes? les femmes 2. Cette constatation est-elle valable pour tous les pays présentés dans le tableau? oui 3. Dans quel pays les femmes ont-elles l’espérance de vie la plus courte? en République Démocratique du Congo (RDC) 4. Dans quel pays les hommes ont-ils l’espérance de vie la plus longue? en Norvège 5. De combien est l’espérance de vie pour les femmes en Belgique? 84 11/48 Le tableau de données permet d’organiser et de présenter les données simplement. Grâce à la légende qui se trouve sous le tableau, chacun peut effectuer une lecture aisée des données. Rmq: les graphiques permettent aussi une présentation aisément lisible des données. 12/48 Femmes Hommes au au au au 01/01/2010 01/01/2020 01/01/2010 01/01/2020 Région 763 829 120 164 flamande Région de 211 225 20 36 Bxl-Capitale Région 399 468 47 72 wallonne Belgique 1.373 1.522 187 272 Tableau 1bis: centenaires par sexe pour les régions et la Belgique, 2010 et 2020 (Source: Statbel, 2020) 13/48 Questions 1. Quel est le sexe pour lequel on recense le nombre de centenaires le plus élevé? 2. Cette constatation est-elle valable pour toutes les régions? 3. Le nombre d’hommes centenaires a-t-il augmenté en 10 ans dans la région wallonne? 4. Le nombre de femmes centenaires a-t-il augmenté en 10 ans dans la région wallonne? 5. Combien y avait-il de femmes centenaires en Belgique au 01/01/2020? 14/48 Questions 1. Quel est le sexe pour lequel on recense le nombre de centenaires le plus élevé? les femmes 2. Cette constatation est-elle valable pour toutes les régions? oui 3. Le nombre d’hommes centenaires a-t-il augmenté en 10 ans dans la région wallonne? oui 4. Le nombre de femmes centenaires a-t-il augmenté en 10 ans dans la région flamande? oui 5. Combien y avait-il de femmes centenaires en Belgique au 01/01/2020? 1522 15/48 Hypothèses explicatives - Seconde guerre mondiale; - plus grande espérance de vie des femmes liée à leur mode de vie (boivent et fument moins, ont tendance à être moins en surpoids, font plus de prévention médicale, suivent mieux leurs traitements quand elles sont malades, auraient tendance à moins prendre de risques, causes génétiques et hormonales). 16/48 Ensembles et tableaux de données 17/48 Une expérience en sciences humaines conduit à recueillir des données à partir de mesures, ou d’observations, effectuées sur les éléments constituant l’ensemble considéré. Ces éléments seront ainsi appelés, selon les cas, objets de mesure ou objets d’observation. Le choix de la méthode statistique dépend d’une part, des caractéristiques de cet ensemble et d’autre part, du type de données recueillies. 18/48 L’ensemble des données peut être constitué d’un seul groupe de données Ensemble homogène (homogeneous population) Ensemble de données recueillies à l’occasion d’une seule prise de mesures et formant ainsi un ensemble homogène Ex.: résultats d’une classe à un test de calcul 19/48 Julie 8 Anna 9 Franco 3 Gaëlle 6 Jules 5 Hassan 8 Lola 9 Tom 3 Dylan 8 Nathan 10 Tableau 2 : résultats au test de calcul (/10) de la classe de 1ère A de l’Ecole Victor Hugo 20/48 de plusieurs groupes de données Ensemble hétérogène (heterogeneous population) Gr. indépendants Gr. appareillés Gr. hybrides 21/48 Groupes indépendants Des groupes sont dits indépendants si, a priori, il n'y a aucune raison d'associer les données d’un groupe à celles de l’autre → Ensemble de données recueillies à l’occasion de deux prises de mesure parallèles et formant ainsi un ensemble hétérogène (ex: résultats de deux classes à un même test de calcul) Le nombre de données du premier groupe peut être différent de celui du second groupe 22/48 Classe de 1ère A Classe de 1ère B Julie 8 Steve 5 Anna 9 Laura 7 Franco 3 Emma 4 Ensemble Gaëlle 6 Kevin 7 hétérogène de Jules 5 Thomas 3 données, constitué Hassan 8 Milo 8 de 2 groupes Lola 9 Leila 6 indépendants Tom 3 Zara 9 Dylan 8 Nathan 10 Tableau 3 : résultats au test de calcul (/10) des deux classes de première année de l’Ecole Victor Hugo 23/48 Groupes appareillés (ou appariés) Des groupes sont dits appareillés (ou appariés) si on peut associer chaque donnée d'un groupe à une seule donnée d'un autre groupe. → Ensemble de données recueillies à l’occasion de deux prises de mesure sur les mêmes sujets et formant ainsi un ensemble hétérogène (ex: les résultats d'une classe à deux examens) Le nombre de données du premier groupe doit être identique à celui du second groupe : on travaille avec des paires de données 24/48 Test de calcul Test de lecture Julie 8 7 Anna 9 8 Franco 3 4 Ensemble Gaëlle 6 7 hétérogène de Jules 5 3 données, constitué de 2 Hassan 8 10 groupes Lola 9 7 appareillés Tom 3 5 Dylan 8 7 Nathan 10 8 Tableau 4 : résultats au test de calcul (/10) et au test de lecture (/10) de la classe de 1ère A de l’Ecole Victor Hugo 25/48 Groupes hybrides Les groupes sont hybrides s'ils possèdent certains éléments communs. Ex. : dans une classe, le groupe des élèves qui pèsent plus de 60 kg et celui de ceux qui mesurent plus de 160 cm. Ce type d’ensemble ne se prête généralement pas aux traitements statistiques. 26/48 Effectif total C’est le nombre d’objets de mesure (donc de données) d’un ensemble; il est noté N Ex: combien vaut effectif du tableau 2? N = 10 Car il y a 10 données 27/48 Notations: voir recueil de formules et tables p. 1 1 groupe 2 groupes 2 groupes indépendants appareillés Nombre d’objets de mesure par groupe 28/48 Classe de 1ère A Classe de 1ère B Julie 8 Steve 5 Anna 9 Laura 7 Franco 3 Emma 4 Gaëlle 6 Kevin 7 Jules 5 Thomas 3 Hassan 8 Milo 8 Lola 9 Leila 6 Tom 3 Zara 9 Dylan 8 Nathan 10 29/48 Classe de 1ère A Classe de 1ère B Ensemble Julie 8 Steve 5 hétérogène de 18 Anna 9 Laura 7 données, constitué Franco 3 Emma 4 de 2 groupes Gaëlle 6 Kevin 7 indépendants (10 Jules 5 Thomas 3 données dans le Hassan 8 Milo 8 premier et 8 Lola 9 Leila 6 données dans le Tom 3 Zara 9 second) Dylan 8 Nathan 10 N = N1+N2 N1 = 10 N2 = 8 N = 18 30/48 Test de Test de calcul lecture Julie 8 7 Anna 9 8 Franco 3 4 Gaëlle 6 7 Jules 5 3 Hassan 8 10 Lola 9 7 Tom 3 5 Dylan 8 7 Nathan 10 8 31/48 Test de Test de calcul lecture Julie 8 7 Anna 9 8 Ensemble Franco 3 4 hétérogène de 20 Gaëlle 6 7 données, constitué Jules 5 3 de 2 groupes Hassan 8 10 appareillés de 10 Lola 9 7 données chacun Tom 3 5 Dylan 8 7 Nathan 10 8 N = Nx + Ny Nx = 10 Ny = 10 N = 20 32/48 Les données sont notées Xi : Julie 8 Anna 9 Franco 3 Gaëlle 6 X1= Jules 5 X3= Hassan 8 X7= Lola 9 X9= Tom 3 Dylan 8 Nathan 10 33/48 Les données sont notées Xi : Julie 8 Anna 9 Franco 3 Gaëlle 6 X1= 8 Jules 5 X3= 3 Hassan 8 X7= 9 Lola 9 X9= 8 Tom 3 Dylan 8 Nathan 10 34/48 Types de données et représentations graphiques 35/48 Pour réaliser des représentations graphiques, il faut pouvoir reconnaître les différents types de données Données métriques Données non métriques – Ordinales par rang (ranked ordinal data) – Ordinales par catégories (grouped ordinal data) – Nominales (nominal data) 36/48 Données métriques Proviennent de mesures (ex.: tailles, poids) ou de comptages (ex: nombre de fautes dans une dictée) Peuvent être situées sur un axe Sont théoriquement continues si elles sont issues de mesures 37/48 tailles Tous les points peuvent théoriquement représenter une donnée mais les données sont souvent rendues discontinues par la précision avec laquelle on mesure 170 cm 171 cm 172 cm tailles Précision de la mesure = 1cm 38/48 Si elles proviennent de comptages, les données métriques se répartissent sur l'axe de manière discontinue (ou discrète) 1 2 3 Nombre de fautes Rmq: les résultats aux tests de calcul et de lecture présentés avant sont des données métriques 39/48 Données non métriques Ce sont des données issues d’un classement ou d’une répartition des éléments de l’ensemble dans des catégories et dans ce cas, peuvent faire l’objet d’un dénombrement (on va compter combien il y a de données dans les différentes catégories). 40/48 Données ordinales par rang Classement individuel et ordonné Rang = 5 Rang = 4 Rang = 3 Rang = 2 Rang = 1 Chaque élément est caractérisé par un nombre correspondant à sa place dans le classement (ou rang). 41/48 Lorsque deux ou plusieurs valeurs sont identiques, leur rang est égal à la moyenne arithmétique des rangs de ces valeurs. Attribuez un rang à chacune de ces 8 tailles: 155 160 162 162 170 176 182 187 42/48 155 160 162 162 170 176 182 187 1 2 3.5 3.5 5 6 7 8 Rang moyen 3+4 = 3.5 2 43/48 Données ordinales par catégories Données réparties en classes mutuellement exclusives et ordonnées La caractérisation d'une catégorie se fait par le dénombrement de ses éléments (cet effectif est toujours un nombre entier) :10 petits, 6 moyens et 5 grands 44/48 Les données ordinales peuvent également faire l’objet de présentations sous la forme de pourcentages. Degré de satisfaction Pourcentages Je suis très satisfait et je la 74% recommande vivement Très satisfait 17% Satisfait 5% Moyennement satisfait 3% Pas du tout satisfait 1% Tableau 5 : degré de satisfaction des participants à une formation 45/48 Données nominales Données réparties en classes mutuellement exclusives mais pas ordonnées, pas hiérarchisées La caractérisation d'une catégorie se fait par le dénombrement de ses éléments (cet effectif est toujours un nombre entier) : 6 cheveux blonds; 10 cheveux bruns; 4 cheveux noirs 46/48 Les données nominales peuvent également faire l’objet de présentations sous la forme de pourcentages. Religions Pourcentages Hindouisme 49% Christianisme 32% Islam 17% Bouddhisme et religions 1% chinoises Sans religion et autres 1% Tableau 6 : Principales religions en présence à l’Ile Maurice (selon le recensement de 2011) 47/48 Données Métriques Non métriques Ordinales Nominales par rang Ordinales par catégories Ordinales par Ordinales par Nominales rang catégories Données Données réparties Données réparties réparties en classes en classes individuellement mutuellement mutuellement de manière exclusives et exclusives mais ordonnée ordonnées pas ordonnées Hiérarchie, ordre Hiérarchie, ordre Hiérarchie

Use Quizgecko on...
Browser
Browser