Bases pour l’analyse descriptive et inférentielle (BASDI) PDF
Document Details
Uploaded by UnmatchedSerpentine5742
UMONS - Université de Mons
Marielle BRUYNINCKX
Tags
Summary
This document provides a lecture or presentation on descriptive and inferential analysis. It covers the normal distribution, including calculations, properties, and examples.
Full Transcript
Bases pour l’analyse descriptive et inférentielle (BASDI) Prof. Marielle BRUYNINCKX 2/36 Loi normale ou Loi de Laplace-Gauss 3/36 Loi normale ou loi de Laplace-Gauss (Normal Distribution...
Bases pour l’analyse descriptive et inférentielle (BASDI) Prof. Marielle BRUYNINCKX 2/36 Loi normale ou Loi de Laplace-Gauss 3/36 Loi normale ou loi de Laplace-Gauss (Normal Distribution) Caractéristiques Y 50% 50% (.5) (.5) X Fonction de densité; sa surface totale = 1 (100% des données) 4/36 Continue et toujours symétrique Asymptotique par rapport à l’axe OX (tend vers l’axe en s'en rapprochant de plus en plus mais sans jamais l'atteindre → la courbe normale s’étend donc théoriquement de - à + ) Mode, moyenne, médiane confondus (symétrique) 3 à gauche de la moyenne et 3 à droite → la quasi-totalité des données se répartit sur 6 écart types 5/36 34% 34% 68% des données sont comprises entre m-1 et m+1 47.5% 47.5% 95% des données sont comprises entre m-2 et m+2 49.5% 49.5% 99% des données sont comprises entre m-3 et m+3 6/36 Allure de la distribution L’allure de la distribution dépend de la valeur de la moyenne et de l’écart type Situation 1 1 1 < 2 2 m1 = m 2 7/36 1 2 La courbe 1 et la courbe 2 ont des allures différentes. La courbe 1 est plus concentrée et la courbe 2 est plus dispersée mais elles sont centrées autour d’une même moyenne 8/36 Situation 2 1 = 2 1 2 m1 m2 9/36 Courbes dont l’allure est identique mais qui sont déplacées horizontalement l’une par rapport à l’autre. Elles ne sont pas centrées autour d’une même moyenne mais sont caractérisées par une même dispersion. 10/36 Ces trois distributions normales ne diffèrent que par leur moyenne Ces trois distributions normales ne diffèrent que par leur écart type 11/36 Durant l’épidémie liée au Covid-19, les autorités ont tenté d’éviter la saturation des soins de santé. Pour ce faire, ils ont mis en œuvre des mesures afin d’« aplatir la courbe » de l’évolution du nombre de cas au cours du temps. Source: https://www.brunet.ca/sante/conseils- sante/aplatir-la-courbe/ 12/36 La première courbe, peu dispersée et haute, illustre une situation sans mesures de santé publique. Plus de gens sont atteints du coronavirus et le nombre maximal de cas prévus (pic de l'éclosion) est atteint plus rapidement. 13/36 La deuxième courbe, plus plate et plus dispersée, représente la situation où des mesures de santé publique sont prises. Les cas augmentent moins rapidement et le pic de l'éclosion se produit plus tard et est surtout moins élevé. La saturation du système de santé est évitée. Lecture d’un graphique issu de la littérature 14/36 scientifique Déterminez les valeurs de la moyenne et de l’écart type de chaque distribution. 15/36 𝑚 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑡𝑖𝑜𝑛 𝑏𝑙𝑒𝑢𝑒 = 0 𝜎𝐵 =.44 𝑚𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑡𝑖𝑜𝑛 𝑟𝑜𝑢𝑔𝑒 = 0 𝜎𝑅 = 1 𝑚𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑡𝑖𝑜𝑛 𝑗𝑎𝑢𝑛𝑒 = 0 𝜎𝐽 = 2.24 𝑚𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑡𝑖𝑜𝑛 𝑣𝑒𝑟𝑡𝑒 = −2 𝜎𝑉 =.71 16/36 Note z ou variable normale centrée réduite 17/36 18/36 1. Définition La note z est un indice de relation qui permet de résoudre des problèmes où il est nécessaire de comparer des distributions qui se répartissent différemment. 19/36 Ex: un élève du secondaire obtient 24/30 en physique et 80/100 en mathématiques. Dans laquelle de ces deux matières est-il le mieux classé? m1=20 1 =5 m2=70 2 =10 20/36 Variable sans unité de mesure qui permet de mettre en relation des grandeurs mesurées dans des unités différentes 21/36 2. Propriétés de la moyenne et de l’écart type 2.1. Propriété 1 de la moyenne Lorsqu’on soustrait à chacune des données Xi d’un échantillon un nombre constant (noté b), la moyenne du nouvel ensemble ainsi créé est égale à la moyenne des Xi soustraite de la même constante. Si Ti = Xi - b alors mT = mX - b 22/36 Calculez la moyenne sur base des données suivantes (Xi): 7 4 6 2 7 3 1 7 2 6 7 7 1 6 mX = 66/14 mX = 4.71 Données du nouvel ensemble (Ti): 6 3 5 1 6 2 0 6 1 5 6 6 0 5 mT = 52/14 mT = 3.71 Si Ti = Xi - b alors mT = mx - b 23/36 Si Ti = Xi - b alors mT = mx - b 2.2. Corrollaire Si l’on soustrait la moyenne (mx) d’un échantillon à chacune des données de celui-ci, la moyenne (mT) du nouvel ensemble ainsi créé sera nulle. Ici b = mx Si Ti = Xi - mx alors mT = mx - mx =0 24/36 On dit qu’une telle transformation centre la distribution autour de l’abscisse 0; la nouvelle distribution ainsi créée est appelée distribution centrée. Cette opération ne modifie pas la forme générale. 0 25/36 2.3. Propriété de l’écart type Lorsqu’on divise chacune des données Xi d’un échantillon par un nombre constant (noté a), l’écart type du nouvel ensemble ainsi créé est égal à l’écart type des Xi divisé par la même constante. Xi X Si Ti = alors T = a a 26/36 Calculez l’écart type sur base des données suivantes (Xi): 8 4 6 2 8 4 2 8 2 6 8 8 2 6 X = 2.46 Données du nouvel ensemble (Ti): 4 2 3 1 4 2 1 4 1 3 4 4 1 3 T = 1.23 Xi X Si Ti = alors T = a a 27/36 Xi X Si Ti = alors T = a a 2.4. Corrollaire Si l’on divise chacune des données Xi par un nombre constant a = x , l’écart type du nouvel ensemble ainsi créé est égal à 1. Xi X Si Ti = alors T = donc T = 1 X X 28/36 On dit qu’une telle transformation réduit la distribution à un écart type égal à 1; la nouvelle distribution ainsi créée est appelée distribution réduite. Celle-ci est sans unité. → On limite ainsi les problèmes liés aux dispersions différentes 29/36 Reprenons notre exercice: 30/36 Si nous centrons ces distributions autour d’une moyenne égale à zéro, nous obtenons deux distributions qui ne diffèrent plus que par leur allure générale et leur dispersion 31/36 Si nous réduisons l’écart type de chacune des distributions à 1 → il ne reste que quelques différences d’allure générale 32/36 3. Formule de la note z Xi − X z= i Variable centrée par rapport à la moyenne et réduite par rapport à l’indice de dispersion (écart type). → permet de situer les données dans leurs distributions respectives en éliminant les différences d’échelle et de complexité. 33/36 Un élève obtient 24/30 en physique et 80/100 en mathématiques. Par rapport à l’ensemble de la classe, en quoi est-il mieux classé? m2=70 2=10 m1=20 1=5 34/36 Si on calcule les notes z, on trouve: En physique En mathématique m1=20 m2=70 1=5 2=10 24 − 20 80 − 70 z= =.8 z= =1 5 10 Par rapport à l’ensemble de la classe, l’élève est donc mieux classé en mathématiques qu’en physique (sa note z en mathématiques est meilleure). 35/36 4. La distribution centrée réduite Distribution centrée autour d’une moyenne égale à zéro et réduite à un écart type égal à 1. 𝜎=1 m=0 36/36 Indices statistiques de position de dispersion de relation étendue des variance moyenne données mode indices quantiles écart type Note Z médiane quartiles déciles centiles