Biostatistiques EP2 Mon Cours PDF
Document Details
Uploaded by Deleted User
Dr BIKA, Ph.D
Tags
Summary
These notes cover biostatistics concepts and methods, including general objectives, specific objectives (e.g. types of variables and methodologies and examples), and a course outline.
Full Transcript
BIOSTATISTIQUES Dr BIKA, Ph.D Dr BIKA, Ph.D 1 OBJECTIFS Objectifs Généraux l’étudiant devra être capable de: - Réaliser l’importance du problème de la variabilité inhérente aux données médicales, - Comprendre les principaux concepts qui permettent de la gérer les donn...
BIOSTATISTIQUES Dr BIKA, Ph.D Dr BIKA, Ph.D 1 OBJECTIFS Objectifs Généraux l’étudiant devra être capable de: - Réaliser l’importance du problème de la variabilité inhérente aux données médicales, - Comprendre les principaux concepts qui permettent de la gérer les données et ainsi de pouvoir faire les choix nécessaires à la prise en charge des malades avec le minimum d’erreur Dr BIKA, Ph.D 2 OBJECTIFS À la fin de ce cours, l’étudiant doit être capable de : ⚫ Expliquer les concepts d’échantillon, de population, de représentativité. ⚫ Reconnaître les différents types de variables et expliquer comment l’on peut éventuellement passer d’un type à l’autre. ⚫ Décrire un échantillon par quelques techniques élémentaires : histogramme, fractiles, ⚫ définir et calculer les paramètres de tendance centrale et de dispersion Dr BIKA, Ph.D 3 OBJECTIFS À la fin de ce cours, l’étudiant doit être capable de : ⚫ Comprendre et utiliser les concepts d’intervalle de confiance et de test de comparaison. ⚫ Expliquer clairement les phrases : « La différence observée est significative à x% », ou « La différence n’est pas significative», appliquées à des exemples concrets. ⚫ Réaliser quelques tests statistiques (test de Chi2, test de Student). Dr BIKA, Ph.D 4 PLAN DU COURS RESUME INTRODUCTIF CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE CHAPITRE II : STATISTIQUES DESCRIPTIVES CHAPITRE III : PROBABILITES ET INTERVALLE DE CONFIANCE D’UN ESTIMATEUR CHAP IV : INTRODUCTION AUX TESTS D’HYPOTHESES Dr BIKA, Ph.D 5 INTRODUCTION Biostatistique: ensemble des méthodes ayant pour objet : la collecte, le traitement et l’interprétation des données. ⚫ La statistique constitue, en médecine, l’outil permettant de répondre à de nombreuses questions : ⚫ Quelle est la valeur normale d’une grandeur biologique, taille, poids, glycémie ? ⚫ Quelle est la fiabilité d’un examen complémentaire ? ⚫ Quel est le risque de complication d’un état pathologique, quel est le risque d’un traitement ? ⚫ Le traitement A est-il plus efficace que le traitement B ? Dr BIKA, Ph.D 6 INTRODUCTION On peut distinguer 2 types de statistiques : Les stats descriptives : il s’agit d’organiser et résumer des observations. On ne fait pas de comparaisons et on s’intéresse en général à un seul groupe, échantillon ou population. Les stats inférentielles (ou inductives) : visent à: - Déduire les propriétés d’une population à partir de l’étude d’un échantillon (exemple : les sondages). Les résultats obtenus dépendent du type d’échantillonnage - Comparer 2 ou plusieurs populations ou échantillons ; si une différence existe, on se demandera si cette différence est due à la variabilité biologique (hasard) ou à un facteur quelconque Dr BIKA, Ph.D 7 INTRODUCTION Toute étude statistique peut être décomposée en deux : La collecte des données statistiques, et leur analyse ou leur interprétation. Phase préliminaire : avant ça, il faut déterminer et identifier le problème par un ensemble de questionnements qui permettront de délimiter les investigations et les différentes approches : ⚫ quels sont les objectifs ? ⚫ Quelle est la population ou l’échantillon à étudier ? ⚫ Quels sont les caractéristiques et les variables ? ⚫ Que pourra apporter une étude statistique ? Dr BIKA, Ph.D 8 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Objectifs du chapitre : l’étudiant doit être capable de : ⚫ acquérir et parfaire la connaissance des principales notions relatives à l’utilisation des méthodes statistiques, ⚫ expliquer les concepts d’échantillon, de population, de représentativité. ⚫ reconnaître les différents types de variables et expliquer comment l’on peut éventuellement passer d’un type à l’autre. Dr BIKA, Ph.D 9 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE La Statistique: ensemble d’instruments scientifiques par lesquels on recherche à expliquer certains phénomènes. Elle se compose de méthodes permettant de recueillir, de classer, de présenter et d’analyser des observations relatives à ces phénomènes pour en tirer ensuite des conclusions et prendre des décisions. Une statistique : un nombre calculé à partir d'observations. Les statistiques : ensemble des analyses reposant sur l'usage de la statistique. Dr BIKA, Ph.D 10 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE L’ensemble (E): collection (finie ou infinie) d'unités, ou d'éléments, sur laquelle porte l'observation. Il doit être définit précisément de façon à ce que deux personnes différentes aboutissent toujours à la même liste d'éléments. Les éléments: objets constitutifs de l'ensemble. Leur appartenance à l’ensemble E doit être faite sans ambiguïté. Les éléments peuvent être désignés par leur position dans le tableau de données : 1 pour le premier, i pour un élément quelconque, n pour le dernier élément, N pour la somme des éléments constituant l’ensemble. Exemples: Dr BIKA, Ph.D 11 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE La population : ensemble des individus sur lequel porte l’étude ou la prévision. Il est généralement difficile de l’étudier dans sa totalité. La population est caractérisée par ses paramètres : ⚫ La taille symbolisée par N (généralement inconnue) ⚫ La moyenne µ (mu) ⚫ La variance σ2 (sigma carré) ⚫ L’écart-type σ Dr BIKA, Ph.D 12 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE La pop-cible : ensemble des éléments visés, en principe, par l'échantillonnage. La pop statistique: ensemble des éléments effectivement représentés par l'échantillonnage. La pop biologique : ensemble des individus d'une même espèce habitant un lieu donné à un moment donné. Notion qui relève davantage de la biologie que de la statistique. La communauté ensemble des individus de diverses espèces retrouvés dans un espace et un temps donnés. Dr BIKA, Ph.D 13 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Individu: éléments d’un échantillon ou d’une population synonymes : unité statistique, sujet, objet, élément, observation, mesure, doses, participants… ⚫ Exemples généraux: ⚫ Pour les instituts de sondage: la population étudiée sera un ensemble d'hommes et de femmes occupant (pays, région, commune) ⚫ Toute l'eau qui s'écoule d'une rivière à un moment donné constitue la population. Les 20 prélèvements de 10 cm 3 que l'on va analyser constituent l'échantillon. ⚫ Le sang d’une personne peut être considéré comme une population, une prise de sang comme un prélèvement (individu, observation) et l’ensemble des prélèvements sera considéré comme un échantillon. Dr BIKA, Ph.D 14 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Le recensement : consiste au recueil d’informations auprès de tous les individus d’une population. L’enquête ou la prise de données ou le référencement des attributs couvre toute la population, ce qui facilite la comparaison des renseignements enregistrés. La méthode est très fastidieuse car rien n’est négligé Exemples: population d’un pays ; pollution mondiale ; animaux en voie de disparition ; génome humain ; etc Dr BIKA, Ph.D 15 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE L’échantillonnage ou sondage: consiste en un recueil d’informations auprès d’une partie d’une population appelée l’échantillon. Il convient donc de bien connaitre la population cible, les critères de sélection et la taille de l’échantillon. L’échantillon : fragment d'un ensemble prélevé pour juger de cet ensemble. C’est aussi la fraction de la population statistique sur laquelle des mesures sont faites pour connaître les propriétés de cette population. Dr BIKA, Ph.D 16 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Figure 1 : Populations et échantillons Dr BIKA, Ph.D 17 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Échantillon représentatif : représente fidèlement la composition et la complexité de la population statistique. Pour être représentatif, un échantillon doit être aléatoire c’est-à-dire prélevé de manière à ce que chacun des éléments de la population statistique ait une probabilité connue et non nulle d'appartenir à cet échantillon; Attention ! Représentatif ne veut pas dire "conforme à l'idée que le chercheur se fait de la population"! Aléatoire ne signifie pas "n'importe comment"! Dr BIKA, Ph.D 18 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE la variable est une caractéristique mesurable ou observable sur un élément (variable propre) ou dans son environnement (variable associée). Les résultats de la mesure d’une variable sont appelés des observations et l’ensemble des séries d’observations recueillies s’appelle une série statistique. Elle est généralement retranscrite dans un tableau de données Exemples : chez un patient: âge ; sexe ; maladie ; traitement ; réussite du traitement reçus à l’hôpital ; le taux de glycémie ; la vitesse de coagulation. etc Dr BIKA, Ph.D 19 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Nature des variables statistiques et échelles de mesures Il existe deux types de variables ou observations, celles-ci peuvent être soit quantitatives soit qualitatives. Ces variables peuvent être mesurées d’où l’importance du choix des échelles de mesures, c'est-à-dire, des règles permettant d’affecter une valeur à chaque individu de la population ou de l’échantillon. Dr BIKA, Ph.D 20 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Variable quantitative grandeur mesurable ; caractère auquel on peut associer un nombre Variable discrète ou discontinue: ne prend qu'un nombre fini de valeurs (valeur entière dénombrable et sans aucune valeur intermédiaire). la liste des éléments peut être établie a priori. Exemple: (nombre d'enfants, nombre de pétales d’une fleur, nombre de dents, nombre de malades,...) : ⚫ NB: les données sont obtenus ici par dénombrement Dr BIKA, Ph.D 21 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Variable quantitative grandeur mesurable ; caractère auquel on peut associer un nombre Variable continue : caractère quantitatif qui peut théoriquement prendre toutes les valeurs d'un intervalle de l'ensemble des nombres réels. Toutes les valeurs ne sont pas dénombrables et ne peuvent pas être établies a priori. Ces valeurs sont alors regroupées en classes Exemple: (taille, temps, poids, vitesse, glycémie, altitude, âge, surfaces,….) (1,60 m ; 1,61 m ; 1,62 m ;…..). ⚫ les données sont obtenus ici par mesure (mensurations) Dr BIKA, Ph.D 22 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Variable qualitative: La variable présente des caractéristiques diverses qui permettront de la décrire : ce sont des modalités qui ne sont pas quantifiables (pas mesurables) Exemple: couleur des yeux, douleur, noms, sigles, codes …). Attention! même si les modalités sont des codes numériques, les opérations sur les modalités n'ont aucun sens. Dr BIKA, Ph.D 23 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Variable qualitative: l'échelle ordinale (de rangement) ou ordonnée: chaque modalité est explicitement significative du rang pris par chaque individu pour le caractère considéré. Si E possède N éléments, les modalités seront 1 er, 2ème, 3ème, …, nème. Comme on possède juste l'ordre des individus, on ne sait rien de l'intervalle des valeurs. Il existe une certaine relation entre les objets du type plus grand que, supérieur à, plus difficile que, préférée à..... Exemple : Moment (matin - midi - soir) ; classe d’âge (NN – Nourrisson – Petit enfant – Grand enfant – adolescent – Adulte) ; Saisons (Printemps – Eté – Automne – Hiver) ; Qualifications professionnelles (AS – IB – IDE – IDEP). Dr BIKA, Ph.D 24 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Variable qualitative: ⚫ l'échelle nominale ou catégorielle: les nombres ou symboles identifient les groupes auxquels divers objets appartiennent. Les symboles désignant les différentes sous-classes dans l'échelle nominale peuvent être modifiés sans altérer l'information essentielle de l'échelle. Les seules statistiques descriptives utilisables dans ce cas sont le mode, la fréquence et les tests applicables seront centrés sur les fréquences des diverses catégories. Exemples : le sexe, couleur, Réponse Oui/Non, V/F. Dr BIKA, Ph.D 25 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Typologie des caractères pour une approche statistique Dr BIKA, Ph.D 26 CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE Variables dépendantes et indépendantes Elles sont définis dans des notions plus avancées de la statistiques dans des situation d’expérimentation et pour certains tests statistiques Les variables indépendantes: celles qui sont manipulées par l’expérimentateur, celles dont on cherche le rôle ou l’influence Exemple: le traitement administré, la quantité d’eau consommée… Les variables dépendantes : Celles qu’on veut étudier (variable d’intérêt) qui sont mesurées, référencées, et sur laquelle on cherche à voir l’effet de la variable indépendante Exemple: (survie, résistances, tolérance, performance, …). 27 Dr BIKA, Ph.D CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE INFERENCE ET RISQUE STATISTIQUE C’est la généralisation à la population statistique des résultats d'un test statistique réalisé sur un échantillon représentatif de cette population. Cette généralisation se fait au risque du statisticien. La généralisation à la population-cible se fait lorsque cette dernière est différente de la population statistique, cette généralisation se fait au risque du biologiste. 28 Dr BIKA, Ph.D CHAPITRE I : NOTIONS DE BASE ET TERMINOLOGIE INFERENCE ET RISQUE STATISTIQUE 29 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Objectif général A la fin de ce chapitre, chaque étudiant devra être capable d’organiser, décrire et de représenter des données statistiques. Objectifs spécifiques L’étudiant doit spécifiquement être capable : ⚫ d’apprendre les principales techniques de statistique descriptive univariée et bivariée. ⚫ De déterminer pour chaque type de variable les statistiques appropriées ⚫ D’extraire des informations pertinentes et de faire une synthèse numérique (moyennes, variance, écart-type, …) d’une série de données ⚫ Présenter les résultats obtenus sous forme de tableaux, d’histogrammes, de camembert, courbes etc. 30 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES INTRODUCTION Les statistiques descriptives visent à ressortir les caractéristiques des données On distingue plusieurs types de protocoles d’analyse statistique : ⚫ les protocoles univariés: une seule variable (à la fois) intéresse le chercheur ; Exemple: l’age, le sexe, le statut covid… ⚫ les protocoles bivariés lorsque le chercheurs s’intéresse à 2 variables à la fois ; Exemple: relation entre l’age et la performance, relation entre la saison et le nombre de grossesses ⚫ les protocoles multivariés lorsque le chercheur s’intéresse à plusieurs variables à la fois 31 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES ANALYSE DESCRIPTIVE D’UN PROTOCOLE UNIVARIE Trois aspects sont essentiels à l'interprétation d'une distribution : ⚫ Paramètre de position : le centre de la distribution et la répartition autour d'une valeur centrale (moyenne, mode, médiane, quantiles, …). ⚫ Paramètre de dispersion ou d’étendue : les valeurs sont-elles dispersées ou concentrées ⚫ Paramètre de forme : la forme de la distribution : la symétrie, l’aplatissement 32 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Distribution d’une fréquence et représentations graphiques ni = effectif (ou fréquence absolue) de chaque valeur ou modalité xi = modalité de i Ci = classe de i ∑ni =n Fi = fréquence de i avec 33 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES 34 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales But: résumer en une seule valeur l'ensemble des valeurs d'une distribution statistique. Il existe quatre paramètres de position : ⚫ Le mode (Mo), ⚫ La moyenne ( ou µ ou m) ⚫ La médiane ou le médian (Me ou Md) ⚫ Les fractiles ou Quantiles (Qn) 35 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales ⚫ Le mode : la valeur ou la modalité ou la classe ayant la plus grande fréquence d’observation. ⚫ Dans le cas de la classe, on parle aussi de classe modale. ⚫ On distingue: ⚫ Pour un caractère qualitatif: ou pour un caractère quantitatif discret ayant un nombre de modalités inférieur au nombre d'éléments, le mode est la modalité ou la valeur qui a l'effectif le plus élevé ⚫ Pour un caractère quantitatif continu, le mode est le centre de la classe modale, c'est à dire de la classe qui a la fréquence moyenne la plus élevée. 36 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales Cas 1 : Données rangées : le mode est la valeur de la donnée qui apparaît le plus fréquemment (celle qui a le plus d’occurrences) : 140 ; 141 ; 144 ; 144 ; 148 ; 148 ; 152 ; 152 ; 152 ; 154 ; 155 ; 158 ; 158 ; 161 ; 170 ; 172 Le mode est 152 car il possède le plus grand nombre d’occurrences (il est référencé 3 fois) Cas 2 : Données condensées : le mode est la valeur de la donnée qui possède la fréquence la plus élevée (relative ou absolue). le mode est Mo = 16 ans Cas 3 : Données groupées en classes 37 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales ⚫ La médiane et la classe médiane: valeur qui partage la série statistique en deux moitiés; il y a autant de valeurs en dessous qu'au-dessus ⚫ Elle ne peut être calculée que pour des caractères quantitatifs ⚫ Elle nécessite que la série soit rangée par ordre croissant ( deX 1 à Xn) 𝒏+𝟏 ⚫ Si n est impair (n=2p+1): médiane(Me) = valeur de rang , soit 𝟐 Me= x(p+1) 𝑛 𝑛 +( +1) ⚫ Si n est pair (n=2p): Me = 2 2. Il s’agit de la demi-somme des 2 𝑛+1 deux valeurs dont les rangs entourent le nombre 2 38 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales ⚫ Application : ⚫ Cas de données discrètes dispersées : 10, 7, 12, 18, 16, 15, 5, 11, 11, 20, 15, 11, 18, 14 ⚫ Ordonnons la série par ordre croissant : 5, 7, 10, 11, 11, 11, 12, 14, 15, 15, 16, 18, 18, 20 14+1 ⚫ Il y a 14 termes (n est pair) or la valeur de rang est 2 = 7,5 ⚫ La médiane est donc la demi somme des 7ème et 8ème termes : 12+14 médiane = =13 2 39 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales ⚫ Quantiles ou fractiles : valeurs Q1,Q2,...,Qk-1 qui divisent une série de données ordonnée en k parties d’effectifs égaux. Parmi les fractiles on trouve : ⚫ la médiane Me, valeur dépassant 50% des valeurs observées ⚫ les quartiles Q1, Q2 et Q3, valeurs dépassant respectivement 25%, 50% et 75% des valeurs observées (remarquer que Q2 =Me) ; ⚫ les déciles D1, D2,..., D9, valeurs dépassant respectivement 10%, 20%,..., 90% des valeurs observées ; ⚫ les centiles repartissent la série en 100 parties égales 40 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales ⚫ Quantiles ou fractiles : valeurs Q1,Q2,...,Qk-1 qui divisent une série de données ordonnée en k parties d’effectifs égaux. Parmi les fractiles on trouve : 41 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales ⚫ Quantiles ou fractiles : représentation graphique, la boite à moustache (box plot) 42 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales ⚫ La moyenne arithmétique (µ, m, ): somme des scores divisée par le nombre de scores. ⚫ A partir du tableau de dénombrement, on effectue une moyenne pondérée en assimilant chaque classe j à son centre Xj et en pondérant par l'effectif nj de la classe 43 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales ⚫ Soit la série statistique suivante : Valeurs x1 x2 … xp Effectifs n1 n2 … np ⚫ La moyenne est: ⚫ application: ⚫ La moyenne est: ⚫ Si les données ont été regroupées en classes, on peut déterminer une bonne approximation de la moyenne en remplaçant chaque classe par son milieu 44 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de position et tendances centrales ⚫ Exemple: Lors d’un contrôle d’une chaîne de médicaments, on s’intéresse au nombre de comprimés défectueux dans un lot. L’étude de 200 lots a donné les résultats suivants: Population? l’ensemble des lots des médicaments Individu? un lot Caractère étudié? nombre de comprimés défectueux ⚫ Nombre moyen de comprimés défectueux? 45 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de dispersion ⚫ L’étendue (range): différence entre les deux valeurs extrêmes: xn-x1 Plus l’étendue est importante et plus les données sont dispersées ⚫ L’interquartile et l’intervalle interquartile (IQR): différence : Q3-Q1 (Q1 et Q3 respectivement 1er et 3ème quartile) : [Q1, Q3] L’IQR rend compte de la dispersion autour de la médiane ⚫ La variance (v ou s2 ou δ2): la moyenne du carré des écarts à la moyenne. => 46 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de dispersion ⚫ L'écart type (s ou δ): racine carré de la moyenne du carré des écarts à la moyenne ⚫ intervalle moyen: On dit qu’en moyenne, les valeurs observées se trouvent dans l’intervalle moyen ⚫ La variance et l’écart-type servent à évaluer la dispersion d’une distribution autour d'une valeur centrale, la moyenne 47 Dr BIKA, Ph.D CHAPITRE II : STATISTIQUES DESCRIPTIVES Paramètres de dispersion Exemple: La variance et écart type des 200 lots de médicaments 48 Dr BIKA, Ph.D ANALYSE DESCRIPTIVE D’UN PROTOCOLE BIVARIE ⚫ On s’intéresse à deux variables x et y mesurées sur les n unités d’observation. ⚫ La série statistique est une suite de n couples des valeurs prises par les deux variables sur chaque individu : (x1 , y1),... , (xi, yi),... , (xn, yn). ⚫ Chacune des deux variables peut être, soit quantitative, soit qualitative. ⚫ Exemple de relations possibles entre : taille et âge ; diabète et poids ; taux de cholestérol et régime alimentaire; toxine et réaction métabolique ; survie et pollution ; effets et doses ; organe 1 et 2… 49 Dr BIKA, Ph.D ANALYSE DESCRIPTIVE D’UN PROTOCOLE BIVARIE Cas de deux variables qualitatives On s’intéresse à la relation entre le sexe de 200 personnes et la couleur des yeux. Les résultats sont présentés dans un tableau de contingence Fréquences relatives partielles Fréquences relatives marginales f i. et f.j 50 Dr BIKA, Ph.D ANALYSE DESCRIPTIVE D’UN PROTOCOLE BIVARIE Cas de deux variables qualitatives 51 Dr BIKA, Ph.D ANALYSE DESCRIPTIVE D’UN PROTOCOLE BIVARIE Cas de deux variables quantitatives Relation entre le niveau stress (X) et la durée des symptômes (Y) chez 15 individus est présentée dans le tableau ci-dessous Représentation graphique: le nuage de points (scatter plot) 52 Dr BIKA, Ph.D ANALYSE DESCRIPTIVE D’UN PROTOCOLE BIVARIE Cas de deux variables quantitatives ⚫ La Covariance de deux variables X et Y : moyenne des produits des écarts des deux variables ▼ ⚫ Rappel : 53 Dr BIKA, Ph.D ANALYSE DESCRIPTIVE D’UN PROTOCOLE BIVARIE Cas de deux variables quantitatives ⚫ La Covariance de deux variables X et Y : application numérique: 54 Dr BIKA, Ph.D ANALYSE DESCRIPTIVE D’UN PROTOCOLE BIVARIE Cas de deux variables quantitatives ⚫ coefficient de corrélation linéaire de Pearson: rapport entre la covariance et le produit des écart-types (des deux variables) ⚫ Application numérique 55 Dr BIKA, Ph.D ANALYSE DESCRIPTIVE D’UN PROTOCOLE BIVARIE Cas de deux variables quantitatives ⚫ propriétés qui s’appliquent au coefficient de corrélation (r) : ⚫ r est toujours compris entre -1 et +1. ⚫ On dira qu’on a une corrélation très forte (positive ou négative) si |r(X;Y)| ≥ 0;75 ⚫ Si r>0 on dit que les deux variables évoluent dans le même sens c'est-à- dire que lorsqu’un variable augmente, l’autre augmente aussi. ⚫ si r