FC3a-Statistiques descriptives-final PDF
Document Details
Uploaded by FreedKhaki
null
Tags
Summary
This document provides an introduction to descriptive statistics, including definitions of key terms like statistics, descriptive statistics, population, individuals or units, variables, and more. It also introduces the concept of qualitative variables and their various types and uses in data analysis.
Full Transcript
Statistiques descriptives Professeur : CARCASSET FC N°3a Date : 08/09/2023 SOMMAIRE I. INTRODUCTION ....................................................................................................................................................................... 1 II. TYPOLOGIES DES VARIABLE...
Statistiques descriptives Professeur : CARCASSET FC N°3a Date : 08/09/2023 SOMMAIRE I. INTRODUCTION ....................................................................................................................................................................... 1 II. TYPOLOGIES DES VARIABLES .................................................................................................................................................. 2 III. VARIABLE QUALITATIVE ........................................................................................................................................................ 3 En cas de questions sur ce cours, vous pouvez écrire à l’adresse suivante : [email protected] Les règles de courtoisies sont à respecter lors de l’envoi d’un mail. L’équipe des tuteurs se réserve le droit de répondre ou non à un mail. En cas de questions récurrentes, les tuteurs pourront faire un point lors des colles hebdomadaires. I. Introduction DEFINITIONS Statistique • Science qui a pour objectif le recueil, l’analyse et l’interprétation des données observées. Statistique descriptive • Ensemble de méthodes dont le but est de présenter les données observées de la manière la plus pertinente possible. Population • Ensemble d’éléments homogènes auxquels on s’intéresse (ex : étudiants inscrits en PASS). • Éléments de la population (ex : un étudiant PASS = un individu). Individus ou Unités statistiques • Observations concernant un terme particulier effectuées sur ces individus (ex : la terminale faites par les étudiants). Variable statistique • Formée par une série d’observations (ex : notes des étudiants au bac, leur genre, âge, etc.). Variable aléatoire • Observations peuvent varier sans pouvoir l’anticiper (résultats de la variable non prévisibles). Expérience aléatoire Valeur • Dispositif permettant d’obtenir une valeur de la variable aléatoire. • Résultat pouvant être donné de l’observation d’une variable (ex : homme ou femme pour la variable genre). Résumé : Une population est constituée d’individus ou d’unités statistiques chez qui on mesure des variables. Il y a des variables aléatoires obtenus par expérience aléatoire. 1 II. Typologies des variables LES DIFFERENTES VARIABLES (CSP = catégorie socio-professionnelle) • Peuvent faire l’objet de mesures par un nombre (ex : Age). Variables quantitatives Quantitatives discrètes ou discontinues Quantitatives continues • Ne peuvent prendre qu’un nombre limité de valeurs. • Ex : Nombre de personnes au sein d’un foyer : nombres entiers. • Peuvent prendre un continuum de valeurs. Entre deux valeurs possibles, il en existe toujours une troisième. • Ex du poids : 55kg ; 55,1g ; 55,2g, 54,9g … • Les modalités ou valeurs de la variable sont désignées par des noms (ex : Couleur des cheveux) non quantifiables. Variables qualitatives (catégorielle s) • Les modalités ne peuvent pas être classées de façon naturelle. Nominales • Binaires : Deux choix possibles (soit oui soit non). Ordinales Richesse en informations o Ex : couleur des yeux, des cheveux. • Les modalités peuvent être classées dans un certain ordre naturel. o Ex : mention au bac : très bien, bien, etc. • Suivant la nature des variables, la richesse d’information est différente : les données quantitatives sont plus informatives que les données ordinales qui sont plus informatives que les données qualitatives (quantitatives > ordinales > qualitatives). • Transformation d’une variable quantitative en qualitative : o Catégorisation -> Simplification -> Perte d’information 2 III. Variable Qualitative DISTRIBUTIONS DE FREQUENCES • Le nombre total d’observations est l’effectif total, il est noté n • Variable qualitative : o Prend un certain nombre de modalités : p ▪ Pour chaque modalité i de la 1ère jusqu’à p, on a la valeur de la modalité : xi Généralités ▪ On a le nombre d’observation/ l’effectif de xi : ni ▪ On a la fréquence de l’observation de x i dans l’effectif : fi = ni/n -> la fréquence est généralement exprimée en pourcentage. • Décrire variable qualitative -> Décrire distribution des effectifs de modalités et des fréquences • Tableau de la répartition de la variable : o Chaque ligne correspond à une valeur observée différente. Il y a donc p valeurs différentes. o ni correspond au nombre d’observations ayant comme valeur xi -> ▪ Aussi appelé Fréquence absolue o fi correspond à la fréquence d’observations ayant comme valeur -> xi : fi = ni/n. ▪ Fréquence relative ou « fréquence » tout court Tableaux de la répartition des variables et des fréquences • Exemple : variable de notation de A à D : Effectif cumulé Ni : Nombre d’observations ayant des valeurs inférieurs ou égales à xi. Ni = ∑𝑖𝑗=1 𝑛𝑗 • Fréquence cumulée Fi : Fréquence des observations ayant des valeurs inférieures ou 𝑗=𝑖 égales à xi. Fi = ∑𝑗=1 𝑓𝑗 3 • Tableau des effectifs et fréquences cumulés : o Effectifs cumulés N2=n2+n1 Fréquences cumulées F2=f2+f1 • Exemple : Notation • Angle au centre proportionnel à ni (ou fi) Diagramme Sectoriel (Cambembert) o Note : A éviter dans une communication scientifique «sérieuse» (article scientifique...) -> Taille des parts/secteurs – peut être trompeur. Représentation graphique • On trace parallèlement à l'axe des ordonnées, en regard des xi qui sont portés en abscisse, un segment de longueur proportionnel à ni. Diagramme en bâton 4 • Ligne brisée reliant les différents effectifs ni pour chaque valeur xi = Ligne brisée joignant le sommet des bâtons Polygone de fréquence • Distribution cumulées -> Polygone des fréquences cumulées : o Sur une figure propre = escalier o Sur un diagramme en bâton existant = ligne brisée Escalier Représentation raphique de la fréquence cumulée • Exemple : échelle de douleur gradée de 0 à 10 Ligne Brisée 5