Biostatistique 1 PDF - Première Année Médecine
Document Details
Uploaded by FamedSerpentine2401
Université Yahia Fares
Dr. Kharfouchi Soumia
Tags
Summary
This document provides a general overview of statistical series, focusing on fundamental concepts like population, samples, individuals, and types of variables (qualitative and quantitative). It also outlines how to represent statistical data.
Full Transcript
Dr. Kharfouchi Soumia Cours Première année Médecine BIOSTATISTIQUE 1 Chapitre 1 : Généralités sur les séries statistiques 1. Notions de base et terminologie...
Dr. Kharfouchi Soumia Cours Première année Médecine BIOSTATISTIQUE 1 Chapitre 1 : Généralités sur les séries statistiques 1. Notions de base et terminologie Population / Echantillon / Individu - La population correspond à l'ensemble des individus sur lequel porte l'étude ou la prévision, (il est généralement difficile de l'étudier dans sa totalité), et l'échantillon représente la fraction de cette population qui est réellement observée ou étudiée. - La notion d'individu est très large : les éléments d'un échantillon ou d'une population sont appelés généralement des individus, cependant cette notion peut être remplacé par plusieurs dénominations: unité statistique, sujet, objet, élément, observation, mesure, doses,…toutefois, dès que la dénomination est choisie aucune ambiguïté ne doit persister. Caractère / Modalité / Variable Le caractère les éléments d'un ensemble sont décrits par un caractère. Cela revient à établir une correspondance entre chaque élément i de l'ensemble E et l'ensemble X des modalités ou des valeurs du caractère : chaque élément de E a une modalité (caractère qualitatif) ou une valeur (caractère quantitatif) et une seule dans X. Ainsi le caractère peut être défini comme une des caractéristiques ou des attributs d'un individu, Modalité la modalité (respectivement la mesure) est l'une des formes particulière d'un caractère. Les différentes situations où les éléments de E peuvent se trouver à l'égard d'un caractère qualitatif considéré, sont les différentes modalités du caractère qualitatif X. Dans le cas ou le caractère X est quantitatif, les différentes situations où les éléments de E peuvent se trouver sont des mesures. Ces modalités ou ces mesures doivent être à la fois incompatibles (un élément de E ne peut prendre qu'une seule modalité) et exhaustive (à chaque élément de E doit pouvoir correspondre une modalité de X) de sorte que chaque élément de E ait une modalité et une seule dans X. Variable Dans chaque étude statistique il est très important de considérer la nature des données (observations, caractères, attributs) que l'on va tester. D'elle dépend la nature des opérations possibles et donc des statistiques utilisables dans chaque situation. Il est donc primordial de préciser la nature de chaque variable, ou caractère. Il existe deux types de variables (ou observations), celles-ci peuvent être soit quantitatives soit qualitatives. Ces variables peuvent être mesurées d'où l'importance du choix des échelles de mesures, c'est-à- dire, des règles permettant d'affecter une valeur à chaque individu de la population ou de l'échantillon. Variable quantitative 1 c'est un caractère auquel on peut associer un nombre c'est-à dire, pour simplifier, que l'on peut "mesurer" (grandeur mesurable). Les différentes situations où peuvent se trouver les éléments sont des mesures; elles sont ordonnables et la moyenne a une signification. On distingue alors deux types de caractère quantitatif : Variable discrète ou discontinue c'est un caractère quantitatif, un tel caractère ne prend qu'un nombre fini de valeurs (valeur entière dénombrable et sans aucune valeur intermédiaire). Les différentes situations où peuvent se trouver les éléments (observations, mesures, valeurs,…) sont des nombres isolés dont la liste peut être établie a priori. Exemple: (nombre d'enfants, nombre de pétales d'une fleur, nombre de dents,..) : (1 ; 2 ; 3 ; 4 ; 5 ;….10 ; 11 ;…) Variable continue c'est un caractère quantitatif, un tel caractère peut, théoriquement, prendre toutes les valeurs d'un intervalle de l'ensemble des nombres réels. Toutes les valeurs ne sont pas dénombrables et ne peuvent pas être établi a priori. Ses valeurs sont alors regroupées en classes (taille, temps, poids, vitesse, glycémie, altitude, surfaces,….) (1,60 m ; 1,61 m ; 1,62m ;…..) Caractère qualitatif Dans ce type de variable les modalités ne sont pas quantifiables (pas mesurables) (couleur des yeux, douleur, …). Ce sont des noms ou ce qui revient au même des sigles ou des codes. Les différentes modalités ne sont pas ordonnables. Attention, même si les modalités sont des codes numériques, les opérations sur les modalités n'ont aucun sens. Exemple : type de relief avec trois modalités (plaine, montagne, plateau), ou encore taille d'une niche écologique avec quatre modalités (petite, moyenne, grande, très grande). Les données qualitatives peuvent être assimilées au cas des variables discontinues, en supposant que les différentes variantes du caractère qualitatif sont rangées dans un ordre correspondant par exemple à la suite des nombres entiers positifs (différentes couleurs, différents degrés d'infection...). Fréquences absolues, relatives et cumulées Désignée par « n », « f » ou « F » la notion de fréquence peut être exprimée de plusieurs manières : * Fréquence absolue (effectif) * Fréquence relative (ou fréquence) * Fréquences cumulées Fréquences absolues = Effectifs Le terme de fréquence absolue désigne les effectifs : a chaque modalité xi du caractère X, peut correspondre un ou plusieurs individus dans l'échantillon de taille N. On appelle effectif (ou fréquence absolue) de la modalité xi, le nombre ni où ni est le nombre d'individus de chacune des modalités Fréquences relatives = Fréquences On appelle fréquence de la modalité xi, le nombre fi tel que : fi = ni /N. 2 Remarques : Rq1 : Le pourcentage est une fréquence exprimée en pour cent. Il est égal à 100fi. Rq2 : L'emploi des fréquences ou fréquences relatives s'avère utile pour comparer deux distributions de fréquences établies à partir d'échantillons de tailles différentes. Effectifs et Fréquences cumulés On appelle effectifs cumulés (resp. fréquences cumulées) en xi, le nombre Ni np (resp. Fi i i f ). p1 p1 p Remarques : k étant le nombre de modalités du caractère X. Rq3 : la taille de l’échantillon est N n i. k i1 Rq4 : k f i 1. i1 2. Représentation des données Il existe plusieurs niveaux de description statistique : la présentation brute des données, des présentations par tableaux numériques, des représentations graphiques et des résumés numériques fournis par un petit nombre de paramètres caractéristiques. Tableaux statistiques En général une série statistique à caractère discret se présente sous la forme : Valeurs X 1 X 2 X k Effectifs n 1 n 2 n k Fréquences f 1 f2 fk Plutôt que réécrire ce tableau on écrira souvent : la série (xi,ni), 1 ≤ i ≤ k. (On n'indique pas le nombre de valeurs lorsqu'il n'y a pas d'ambigüité). Souvent on notera N l'effectif total de cette série donc N=n₁+n₂+...+np. Représentations graphiques et statistiques descriptives Les représentations graphiques sont très importantes en statistique descriptive. Elles ont l'avantage de renseigner immédiatement sur l'allure générale de la distribution. Elles facilitent l'interprétation des données recueillies. La représentation graphique des données montre la forme générale de la distribution et donne une image de la grandeur des nombres qui constituent les données. D'autres statistiques simples sont utilisées pour représenter le centre de la distribution et les mesures liées à la dispersion des observations autour de cette tendance centrale. 3 Chapitre 2 : Variables statistiques quantitatives L'étude descriptive d'une variable statistique quantitative (aussi bien discrète que continue) se fait en 3 étapes : - Description préliminaire - Caractéristiques de position centrale - Caractéristiques de dispersion Une variable quantitative peut être : Discrète : si la variable ne prend qu'un nombre fini de valeurs (ces valeurs sont appelées modalités et notées xi). Continue : si la variable prend ses valeurs dans un intervalle (classe ) 1. Représentation graphique des séries statistiques Tableau statistique Quand la variable statistique X est discrète, on compte, pour chaque valeur de X, le nombre d'individus prenant cette valeur ; c'est l'effectif de la valeur. On aboutit à un tableau du type : Valeurs de la variable x i Effectifs n i Individus Variable 1 Variable 2 x1 n1 1 X1 Y1 x2 n2 2 X2 Y2 xp np N XN YN avec X₁ < X₂