FC1-Introduction à la statistique-final PDF
Document Details
Uploaded by FreedKhaki
TROMBERT
Tags
Related
- Introduction to Medical Statistics 2024-2025 PDF
- Introduction to Medical Statistics 2024-25 PDF
- Introduction to Medical Statistics 2024-25 PDF
- Introduction to Medical Statistics 2024-25 PDF
- Introduction to Medical Statistics 2024-25 PDF
- Statistiques I - Introduction aux statistiques biomédicales - 2024-2025 - PDF
Summary
This document provides an introduction to statistics, specifically focused on its application in a medical context. It covers topics like metrology, variability, and different types of statistical analysis. The document is intended for an undergraduate-level course.
Full Transcript
Introduction à la statistique Professeur : TROMBERT FC N°1 Date : 05/09/2023 SOMMAIRE I. INTRODUCTION ....................................................................................................................................................................... 1 II. LA METROLOGIE ..........
Introduction à la statistique Professeur : TROMBERT FC N°1 Date : 05/09/2023 SOMMAIRE I. INTRODUCTION ....................................................................................................................................................................... 1 II. LA METROLOGIE ..................................................................................................................................................................... 2 III. VARIABILITE DE LA MESURE OU METROLOGIE....................................................................................................................... 3 IV. PROBABILITES ....................................................................................................................................................................... 5 V. LA STATISTIQUE...................................................................................................................................................................... 6 VI. STATISTIQUE A VISEE DE DESCRIPTION : COMMENT DENOMBRER ? ..................................................................................... 7 VII. STATISTIQUE A VISEE DE RECHERCHE ................................................................................................................................... 8 1. STATISTIQUE EN RECHERCHE ....................................................................................................................................................... 9 2. LE TEST STATISTIQUE............................................................................................................................................................... 10 VIII. UTILITE EN SANTE .............................................................................................................................................................. 10 En cas de questions sur ce cours, vous pouvez écrire à l’adresse suivante : [email protected] Les règles de courtoisies sont à respecter lors de l’envoi d’un mail. L’équipe des tuteurs se réserve le droit de répondre ou non à un mail. En cas de questions récurrentes, les tuteurs pourront faire un point lors des colles hebdomadaires. I. Introduction INTRODUCTION • Important de dénombrer les choses. Permet de connaitre l’étendu d’un problème / d’une population. o Ex : Recensement de population o Ex : Nombre de victimes sur la route (en 2019, 3 199 personnes tuées) Le culte du nombre • Utilité de ces chiffres en santé pour mettre les moyens. o Ex : Registre des cancers (par estimation) • Importance de l’interprétation. o Ex : le nombre de prénom ayant une mention très bien au baccalauréat : pas pertinent de dire que certains prénoms réussissent mieux, penser à la fréquence du prénom. • La statistique = la discipline. • Les statistiques = résultats chiffrés. • StatistiqueS (latin « status » état) Les statistiques : dénombrement de données numériques relatives à une population ou une sous-population (un ensemble d’individus). Statistique ou statistiques ? • Elles s’appliquent dans de nombreux domaines notamment : o Statistiques démographiques (âges dans une population important en santé) o Statistiques du chômage (facteurs sociaux influences la santé) o Statistiques de santé (ex : Etat de santé de la population, offre de soins : Statistiques d’activité hospitalière (SAE) o Rôle de l’INSEE (Institut National de la Statistique et des Etudes Economiques) 1 II. La métrologie LA MÉTROLOGIE • Science de la mesure au sens le plus large Définition • Ensemble des technologies de mesure utilisées • Adapter les mesures au phénomène que l’on veut mesurer • Opération qui consiste à donner une valeur à une observation. • On va collecter ces mesures pour en faire des statistiques. • Il y a des mesures : La mesure o Quantitatives (ex : en cm) o Qualitatives : ▪ Ex : diagnostiques médicaux ▪ On regroupe et classe les phénomènes (les diagnostiques) Réalisation d’une mesure Précision de l’unité de mesure utile en médecine • À l’aide d’un instrument de mesure qui donne un nombre (règle graduée, rapporteur). • Unité adaptée au phénomène mesuré : o Age : en heure pendant le premier jour, en jours jusqu’à 28 jours puis en mois et années. o Poids : en grammes à la naissance puis en kilogrammes. • Permet de caractériser : o Un diagnostic o Un acte médical o Une dépendance (on utilise des scores) o Une déficience (perte d’un organe ou d’une fonction Classification en santé Au niveau international (IN) En France • La classification IN des maladies de l’OMS (ICD ou CIM). • Classification IN fonctionnelle de l’incapacité et de la santé (notion de dépendance de déficience et de handicap). • Classification commune des actes médicaux (CCAM) : permet à un médecin pour chaque acte qu’il fait de le déclarer à l’assurance maladie en fonction du code qu’il fournit. 2 III. Variabilité de la mesure ou métrologie VARIABILITÉ MÉTROLOGIQUE Variabilité de la mesure Conditions expérimentales Appareil de mesure • Ex : on mesure plusieurs fois la taille d’un individu : on n’obtiendra pas toujours exactement la même mesure. La variabilité métrologique = variabilité expérimentale + variabilité de l’appareil de mesure. • Des conditions expérimentales variables entrainent un facteur d’aléas. • Exemple : la valeur de la tension artérielle est différente selon qu’elle soit prise sur un patient assis, debout, au repos ou après un exercice. • Peut induire des erreurs. • Erreur de mesure totale : ∆ = ∆1 + ∆2 + ∆3 o Erreur aléatoire ▪ Précision de la mesure : ∆1 ▪ Dispersion statistique : ∆2 o Biais : ▪ Erreur systématique : ∆3 Erreur de mesure (Ex : un tensiomètre qui sous-estime systématiquement tous les résultats. C’est généralement une erreur de méthode.) 3 FLUCTUATION BIOLOGIQUE • Différente de l’imprécision de mesure. Variabilité biologique Variabilité biologique = variabilité intra-individuelle + variabilité interindividuelle Individualité = variabilité inter-individuelle Variabilité intraindividuelle • Une même grandeur varie d’un individu à l’autre. • La même grandeur mesurée chez un même sujet peut être soumise à des variations aléatoires (ex : la tension artérielle différente chez une personne selon le moment de la journée). • En général, la variabilité intra est moindre que la variabilité inter. EXEMPLES Variabilité interindividuelle • Si vous observez des personnes dans la rue, vous constatez qu’elles ne sont pas toutes la même couleur de cheveux. Variabilité intraindividuelle • Si vous mesurez la tension artérielle d’un individu à différents moments de la journée ou au même moment mais plusieurs jours de suite, vous obtiendrez des valeurs différentes. Résultat possible de la fluctuation biologique + variabilité métrologique Variabilité totale d’une grandeur mesurée • Du fait de la variabilité, on est dans le domaine de l’incertain. Cette science de l’incertain, c’est le défi qu’a relevé la statistique. o Ex : le tabac augmente le risque de cancer mais certains fumeurs feront un cancer, d’autres non. Mais en termes de fréquence, on sait que plus on fume plus on a un risque de cancer. Donc on est dans le domaine de l’incertaine. La statistique étudie cela pour aider le professionnel de santé à prendre des décisions. Schéma récapitulatif 4 IV. Probabilités PROBABILITÉS • Sur lequel s’appuie la statistique. Concept de probabilité • Plutôt qu’une seule valeur, la prise en compte de l’incertain permet de déterminer un intervalle à l’intérieur duquel on a une certaine probabilité de se situer et donc un risque de ne pas y être. • L’incertain devient mesurable par fixation d‘un intervalle avec risque d’erreur consenti. • Rapport entre le nombre de cas où il se produit et le nombre de cas possibles. o Probabilité = 0 si événement impossible. o Probabilité = 1 si événement certain. o Et elle peut prendre toutes les valeurs intermédiaires. Probabilité d’un évènement ▪ Ex : tirer un as dans un jeu de 52 cartes : 4/52 = 7,7% • Dans une population de 100 millions d’habitants, dont 1 million meurent chaque année, quelle est la probabilité de mourir dans l’année ? 1/100. • Et si la personne a plus de 80 ans ? Sa probabilité de mourir est différente qu’à 20 ans. o L’estimation dépend des informations disponibles. • Indiquent la probabilité pour qu’une variable prenne une valeur donnée ou soit comprise dans un intervalle donné. o Ex : il y a 95 chances / 100 que sur 100 lancers de pièce, on obtienne en 40 et 60 fois la valeur « pile ». Lois de probabilité • En condition expérimentale on parle de lois du hasard : permettent des calculs avec un risque d’erreur faible et connu. La zone de risque est visualisable par les surfaces blanches aux 2 extrémités de la courbe. • Liés à des distributions particulières (telle la distribution de Gauss : équilibrée autour d’une valeur maximale et symétrique). 5 V. La statistique LA STATISTIQUE Ensemble des méthodes qui permettent de rassembler et d’analyser les données numériques Définition • Méthodes de mesure, d’échantillonnage, de présentation des résultats, de modélisation, de théorie des probabilités… • Elle produit des paramètres / indicateurs tels que la moyenne, médiane, fréquence, etc. • But : résumé l’ensemble des valeurs que l’on observe dans la population. Biostatistique Application de la statistique à la biologie et à la médecine • Ensemble de personne/sujets ou d’objet « équivalents ». • Individu ou unité statistique : chaque sujet de la population. Population • Variable : caractéristique que l’on mesure. • Observations : les mesures. • Série statistique : ensemble des observations recueillis. • Concerne un ensemble de sujets, appelé « population ». 2 types de données Démarche statistique 2 types de problèmes étudiés 2 raisonnements • Expérimentales (les facteurs d’intérêt sont contrôlés). • D’observation (les facteurs d’intérêt sont seulement observés). • Description : étude à « un caractère ». • Recherche : étude à « deux caractères » : ex : recherche entre un facteur et une maladie. • La statistique « déductive » ou descriptive. • La statistique « inductive » ou inférentielle. RAISONNEMENTS EN STATISTIQUE Raisonnement inductif On utilise un échantillon observé pour en tirer des résultats s’appliquant à une population inconnue. L’analyse « inductive » ou inférence permet d’étendre ou de généraliser, dans certaines conditions, les conclusions obtenues. Raisonnement déductif D’une population connue, on va déduire les résultats qu’on observe pour un échantillon inconnu (théorie des probabilité). L’analyse descriptive a pour but de résumer et de présenter les données observées pour en faciliter la connaissance. 6 VI. Statistique à visée de description : comment dénombrer ? STATISTIQUE A VISÉE DE DESCRIPTION Question • Combien y a-t-il de personnes atteintes de troubles de la vue parmi les conducteurs automobiles en France ? • Réponse : 10% ? 40% ? 75% ? • Il est impossible de les compter toutes en examinant toute la population des conducteurs français. Réponse • Il va être nécessaire d’utiliser une procédure particulière (l’échantillonnage) et des méthodes statistiques pour estimer la précision du résultat (incertitude) et l’appliquer à l’ensemble de la population des conducteurs. • La taille de l’échantillon amène de la précision au résultat : plus il est grand, plus le résultat sera précis • Sélection et définition de la population/ échantillon Description • Représentativité : dépends de la méthode utilisée pour constituer l’échantillon (et non pas de l’échantillon) • Choisir le paramètre statistique : moyenne, pourcentage • Calculer la fourchette du résultat/ intervalle de confiance • On cherche à connaitre les taux de réussite chez les étudiants et les étudiantes. o 100% des filles ont réussi en sciences contre 88% des garçons. o 55,5% des filles ont réussi en lettres contre 40% des garçons. Interpréter les statistiques • On pourrait penser que les filles réussissent mieux que les garçons alors que dans l’ensemble, les garçons ont plus réussi (84%) que les filles (60%). Quand on observe dans les 2 facs, la répartition garçons/filles est très différente : les garçons étudient plus dans la fac où les taux de réussites sont élevés. Fac Sciences Fac Lettres Ensemble G F G F G F Réussite 80 10 4 50 84 60 Échec 10 0 6 40 16 40 Total 90 10 10 90 100 100 7 VII. Statistique à visée de recherche • La recherche étudie la liaison entre deux caractéristiques. • Par exemple, le décès d’un accidenté a-t-il un lien avec l’intervention du SAMU ? Accident Intervention du SAMU Pas d’intervention du SAMU Nombre de décès 0 1 Nombre de cas 1 1 Accident Intervention du SAMU Pas d’intervention du SAMU Nombre de décès 4 12 Nombre de cas 100 100 Accident Intervention du SAMU Pas d’intervention du SAMU Nombre de décès 12 4 Nombre de cas 100 100 • La réalité d’une telle étude serait plutôt dans le 3ème tableau, car on appelle généralement le SAMU lorsque la probabilité de décès est plus importante. Les chiffres ne suffisent pas, il faut toujours réfléchir. 8 1. Statistique en recherche STATISTIQUE EN RECHERCHE • Comparaison d’au moins deux groupes (avoir un groupe témoin). • Tests statistiques (donnant un seuil avec un risque d’erreur : le degré de signification). Intègre plusieurs phases • Calcul du degré de signification (ex : je prends les risques de me tromper avec un seuil de 5%). • Imputation causale ne repose pas seulement sur la significativité statistique de la relation entre facteur et maladie mais qu’il faudra tenir compte de la plausibilité de cette relation. • Étude d’observation (épidémiologique) : La répartition n’est pas le seul fait du hasard (de nombreux facteurs interviennent dans cette répartition, les sujets se sont déterminé eux même). Comparaison de 2 groupes o La corrélation n’est pas cause. • Étude expérimentale : Tirage au sort/randomisation (la répartition est maitrisée et liée uniquement au hasard) o Imputation causale avec risque d’erreur consenti. • Ex : la consommation d’alcool favorise-t-elle le cancer du poumon : Cancer + Cancer - Total Éthylisme + 73 927 1000 Éthylisme - 37 963 1000 Total 100 1890 2000 • On a compté le nombre de personnes consommant de l’alcool ayant un cancer et vice-versa. • La fréquence du cancer du poumon chez les buveurs est de 73/1000 et de 37/1000 chez les nonbuveurs. La différence entre 73% et 37% doit-elle être considérée comme significative ? Pour le savoir, on fait un test statistique. La méthode statistique apporte une réponse objective par le test statistique. 9 2. Le test statistique LE TEST STATISTIQUE Définition Tests paramétriques • Procédure qui permet, avec un risque d’erreur connu, d’effectuer un choix entre deux hypothèses complémentaires (H0 et H1) au vu des observations réalisées sur un échantillon. • Un test est dit paramétrique si les hypothèses sont relatives à un paramètre statistique associé à la loi de probabilité décrivant la variabilité étudiée (on peut appliquer la loi de probabilité). • Nécessite généralement des conditions de validité. o En particulier, une distribution gaussienne de la variable. • Le test est plus puissant donc plus apte à rejeter une hypothèse. Tests non paramétriques • Un test non paramétrique compare globalement la répartition des observations et n’exige aucune connaissance sur la loi de probabilité décrivant la variable étudiée (utilisé lorsqu’on ne peut pas appliquer une loi de probabilité). • Ne nécessite pas d’hypothèse sur la distribution. VIII. Utilité en santé Descriptif Évaluation d’un test ou d’un signe Pronostic Évaluation d’un traitement • Description des moyens et l’états de santé d’une population • Ex : cause de décès, morbidité, etc. • Examen complémentaire • Sémiologie quantitative • Étude de survie (devenir à long terme après le traitement) • Essai thérapeutique Recherche de facteurs étiologiques / Économie de la santé / Évaluation de la qualité des soins / 10