Tests Statistiques - 2 Moyennes (2024-2025) - PDF
Document Details
Uploaded by FirstRateAbstractArt
Institut Supérieur des Professions Infirmières et Techniques de Santé Tétouan
2024
Mohamed Boulfia
Tags
Related
- Introduction to Biostatistics: The Journey Continues - Week 5 - UW
- Mathematics and Biostatistics Lecture (1) 2024/2025 PDF
- BIO203 Biostatistics Lecture 2 (Descriptive Statistics) shf 2024 PDF
- Biostatistics 8th Seminar (Paired t-test, Unpaired t-test, F-test) PDF
- Repaso Bioestadística PDF
- Biostatistics 7th Seminar Past Paper PDF
Summary
This document provides notes and outlines on biostatistics, focusing on inferential statistics and hypothesis testing, particularly the comparison of two means. It covers the principles of inferential statistics, tests to compare means and probabilities/proportions, including examples and considerations for large and small sample sizes and significance levels.
Full Transcript
ROYAUME DU MAROC MINISTÈRE DE LA SANTÉ ET DE LA PROTECTION SOCIALE INSTITUT SUPÉRIEUR DES PROFESSIONS INFIRMIÈRES ET TECHNIQUES DE SANTÉ (ISPITS) DE TÉTOUAN OPTION- ISFSC MODULE : BIOSTATISTIQUE Pr. Mohamed BOULFIA DESCRIPT...
ROYAUME DU MAROC MINISTÈRE DE LA SANTÉ ET DE LA PROTECTION SOCIALE INSTITUT SUPÉRIEUR DES PROFESSIONS INFIRMIÈRES ET TECHNIQUES DE SANTÉ (ISPITS) DE TÉTOUAN OPTION- ISFSC MODULE : BIOSTATISTIQUE Pr. Mohamed BOULFIA DESCRIPTION DU CONTENU DU MODULE Partie 3 : Statistique inférentielle 1 : Les Principes de l’Inférence Statistique 2 : Les méthodes relatives aux moyennes 3 : Les méthodes relatives aux probabilités/proportions 1. LES PRINCIPES L'inférence statistique consiste à induire les caractéristiques inconnues d'une population à partir d'un échantillon issu de cette population. Ces caractéristiques, une fois connues, reflètent avec une certaine marge d'erreur celles de la population ; L'inférence statistique est donc un ensemble de méthodes permettant de tirer des conclusions fiables à partir de données d'échantillons statistiques. L'interprétation de données statistiques est, pour une large part, le point clé de l'inférence statistique. Elle est guidée par plusieurs principes et axiomes. 1. LES PRINCIPES Prenons une population infiniment grande sur laquelle on veut évaluer un indicateur quelconque : la fréquence, la probabilité, la moyenne, la variance …d’un caractère ; L'intervalle de confiance : noté IC, à 95% est un intervalle de valeurs qui a 95% de chance de contenir la vraie valeur du paramètre estimé = IC représente la fourchette de valeurs à l’intérieur de laquelle nous sommes certains à 95% de trouver la vraie valeur recherchée. a : Risque d’Erreur 1. LES PRINCIPES 1. LES PRINCIPES Les tests statistiques La question initiale : Le traitement A est-il plus efficace contre le cancer que le traitement B La formulation sous forme de probabilité La probabilité de survie des patients traités avec A est plus grande que ceux traités avec B 1. LES PRINCIPES Test statistique et prise de décision Variable quantitatives à comparer : moyenne, écart type, variance Variable qualitatives à comparer : fréquence, pourcentage, effectifs Les hypothèses : H0 : hypothèse nulle = il n’y a pas de différence de survie entre les patients traités par A et ceux traités par B. H1 : hypothèse alternative = il y a de différence de survie entre les patients traités par A et ceux traités par B. Le risque : a : risque de premier ordre = probabilité de se tromper si on rejette H0 alors qu’elle est vrai, arbitrairement a = 0,05. 2. Les méthodes relatives aux moyennes Principe des tests- Tests de Comparaison Principe des tests de comparaison Les tests de comparaison servent à comparer des séries de données entre elles. Il existe schématiquement deux situations : 1. Comparer un échantillon observé à une population de référence On se demande si la distribution de la population dont est issu l'échantillon est identique à la distribution théorique, ou bien si elle est différente. 2. Comparer deux ou plusieurs échantillons entre eux On se demande si les distributions des populations dont sont issus les échantillons sont identiques ou différentes. Principe des tests- Tests de Comparaison Principe des tests de comparaison Comparer un échantillon observé à une population de référence ou comparer deux ou plusieurs échantillons entre eux, dans les deux situations, l'objet du test est de comparer des populations. Population inconnue Population 1 Population 2 Population de Echantillon référence Echantillon 1 Echantillon 2 Principe des tests- Tests de Comparaison Etablir l’hypothèse nulle (H0) Cela consiste à poser a priori l'hypothèse que les paramètres ou les distributions des populations d'où sont issus les échantillons étudiés sont identiques. Proposer l ’ hypothèse nulle, c'est supposer que la différence observée provient seulement des fluctuations d'échantillonnage. Paramètre Population 1 = Paramètre Population 2 Hypothèse nulle H0 Principe des tests- Tests de Comparaison Proposer une hypothèse alternative (H1) On appelle hypothèse alternative H1 l'hypothèse qui sera retenue au cas où les résultats du test aboutiraient à rejeter l'hypothèse nulle H0. Rejeter H0 c'est dire que la différence observée est trop grande pour qu'on l'attribue à une simple fluctuation d'échantillonnage. On suppose donc dans ce cas que les paramètres ou les distributions des populations d'où sont issus les échantillons étudiés sont différents. Paramètre Population 1 ≠ Paramètre Population 2 Hypothèse alternative H1 Principe des tests- Tests de Comparaison Calcul d’un test de comparaison Une fois que les hypothèses sont clairement posées, le test est appliqué. Tous les tests statistiques de comparaison consistent : 1. A calculer une quantité mathématique exprimant l'écart entre les paramètres ou les distributions ; 2. A confronter cette quantité à un modèle de distribution théorique.. Comparaison de deux moyennes Comparaison de deux moyennes Position du problème Soit P une population d’effectif infini pour laquelle la moyenne d’un caractère quantitatif est µ. Cette moyenne peut être connue ou non. On dispose d’un échantillon E1 d’effectif N1, dont la moyenne du même caractère est mobs1 et d’un échantillon E2 d’effectif N2 dont la moyenne observée est mobs2 Population Echantillon Tirage aléatoire ou non E1 E2 N1 N2 µ mobs1 mobs2 Connue ou Inconnue Premier problème Population Echantillon Tirage aléatoire ou non E NE µ mobs Connue ??????? Deuxième problème Population Echantillon Tirage aléatoire ou non E1 E2 N1 N2 µ mobs1 mobs2 Connue ou Inconnue Troisième problème Population Echantillon Tirage aléatoire E NE µ mobs Estimation Inconnue Test de conformité Population Echantillon Tirage aléatoire ou non E NE µ mobs Connue ??????? Test de conformité 1. Cas de grand échantillon N ≥ 30 Choix du test m-µ N On calcule l’écart réduit e = Obs s x Définir les hypothèses H0 et H1 H0: mobs= µ H1: mobs ≠ µ Test de conformité Calcul du test de comparaison -Une fois que les hypothèses sont clairement définies, le test est appliqué. -Le résultat du test est confronté à un modèle de distribution théorique. Signification: lecture sur la table Si eobs≤eth5%= 1,96, on accepte H0, la différence n’est pas significative Si eobs>e5%th = , on rejette H0 et on accepte H1, la différence est significative à 5% Test de conformité 2. Cas de petit échantillon N < 30 Si la distribution de la variable X suit une loi normale, on utilise la loi de student t à N-1 ddl Choix du test m-µ m-µ m-µ N On calcule le test de student t= = = S m S S x x N Définir les hypothèses H0 et H1 à N-1 ddl H0: mobs= µ H1: mobs ≠ µ Test de conformité Calcul du test de comparaison -Une fois que les hypothèses sont clairement définies, le test est appliqué. -Le résultat du test est confronté à un modèle de distribution théorique. Choix du risque d'erreur- Le risque a Si tobs≤ tth5%, on accepte H0, la différence n’est pas significative Si tobs>tth5%, on rejette H0 et on accepte H1, la différence est significative à 5% Test d’homogénéité Population Echantillon Tirage aléatoire ou non E1 E2 N1 N2 µ mobs1 mobs2 Connue ou Inconnue Test d’homogénéité 1. Cas des grands échantillons N1 et N2 ≥ 30 Choix du test On calcule l’écart réduit m -m t Ԑobs = 1 2 Observé S S2 2 1 + 2 N N1 2 Test d’homogénéité Définir les hypothèses H0 et H1 H0: les moyennes observées au niveau des 2 échantillons sont identiques m1 = m2. H1: les moyennes observées au niveau des 2 échantillons sont différentes m1 ≠ m2. Au moins un des 2 échantillons est biaisé si les échantillons sont issus de la même population ou encore les échantillons sont issus de populations différentes. Test d’homogénéité Calcul du test de comparaison -Une fois que les hypothèses sont clairement définies, le test est appliqué. -Le résultat du test est confronté à un modèle de distribution théorique. Choix du risque d'erreur- Le risque a Si eobs≤eth5%= 1,96, on accepte H0, la différence n’est pas significative Si eobs>eth5%= , on rejette H0 et on accepte H1, la différence est significative à 5% Intervalle de confiance d’une moyenne Population Echantillon Tirage aléatoire E NE µ mobs Estimation Inconnue Intervalle de confiance d’une moyenne Choix du test Grand échantillon N ≥ 30 s µ = m± e x N a% s s m- e x £ µ £ m+ e x N N a% a% Intervalle de confiance d’une moyenne Choix du test Petit échantillon N < 30 sSx µ = m ± et x à N-1 ddl N aα % S S m- t X £ µ £ m+ t X N N a% a% Comparaison de deux moyennes Exercices… 1. Comparaison d’une moyenne observée à une moyenne théorique 2. Comparaison de deux moyennes observées 3. Estimation d’une moyenne théorique à partir d’une moyenne observée Exercice 1 Lors d’une enquête sur la durée de sommeil des enfants de 2 à 3 ans dans un département français, on a trouvé une moyenne du temps de sommeil par nuit de 10,2 heures dans un groupe de 40 enfants. L’écart type est 2,1 heures. La moyenne du temps de sommeil est de 11,7 heures chez les enfants de cet âge. La durée de sommeil des enfants de ce département diffère-t-elle du temps de sommeil des enfants de cet âge? Reponse..Choix du test. On compare une moyenne observée dans un échantillon à une moyenne connue dans la population de référence. Taille de l’échantillon: N ≥ 30 Grand échantillon m-µ m-µ m-µ N e = = = Obs s m s x s x N..Définir les hypothèses H0 et H1 H0: m=μ Les enfants de ce département dorment autant que ceux de la population H1: m≠μ La durée de sommeil des enfants de ce département est différente Application m -- µ m - µ m m m--µµ NN |10,2-11,7| 3,2 - 2,5 √40 18 =4,52 e t == = == = = 2,7 Obs sS m m sS xx Ss xx 12,1 ,1 N 5% α=5%; Ԑth=1,96 5% Ԑobs> Ԑth On rejette l’hypothèse nulle Conclusion Les enfants examinés présentent un temps de sommeil significativement différent de la population générale Exercice 2 Dans un échantillon de 18 sujets suspects d’être atteints de trypanosomiase, on mesure la quantité de protéines dans le liquide céphalorachidien. On trouve dans ce groupe une protéinorachie moyenne de 460 mg/l avec un écart type de 280 mg/l. Dans la population générale, la protéinorachie est en moyenne de 300 mg/l. On se demande si ce groupe de sujet présente une protéinorachie différente de normale ? 1. Formulez les hypothèses H0 et H1 2. Quel test utilisez-vous ? 3. Quelles en sont les conditions d’application ? 4. Que concluez-vous ? Reponse..Choix du test et vérification des conditions d’application. On compare une moyenne observée dans un échantillon à une moyenne connue dans la population de référence. Taille de l’échantillon: N < 30 Petit échantillon m-µ m-µ m-µ N t= = = S m S Sx x à N-1 ddl N Conditions d’application La distribution de la variable doit être supposée normale dans la population d’où est issu l’échantillon..Définir les hypothèses H0: m=μ La protéinorachie des sujets atteints de trypanosomiase ne diffère pas de celle de la population générale H1: m≠μ La protéinorachie des sujets atteints de trypanosomiase est différente de celle de la population Application m - µ m - µ m - µ N |460-300| 3,2 - 2,5 √18 18 =2,42 t= = = = = 2,7 Sm S x S x 1280 ,1 N t (5%; 17 ddl)=2,11 5% tobs> tth On rejette l’hypothèse nulle Conclusion La protéinorachie des sujets atteints de trypanosomiase est significativement différente de celle de la population Exercice 3 On compare la consommation de caféine chez 112 cancéreux : 147,2 ± 101,8 mg/jour à celle de 185 non cancéreux : 132,9 ± 115,7 mg/jour. Les deux consommations sont-elles similaires ? On prend un risque à 5% Reponse..Choix du test. On compare deux moyennes observées. Taille de l’échantillon: N1 et N2 ≥ 30 Grands échantillons m -m t Ԑobs = 1 2 Observé S S 2 2 + 1 2 N N 1 2..Définir les hypothèses H0: m1=m2 H1: m1≠ m2 Application m -m |147,2-132,9| t Ԑobs = 1 2 =1,11 Observé S 2 115,7 101,8 S2 2 2 + + 1 2 112 N 185 N1 2 5% α=5%; Ԑth=1,96 5% Ԑobs< Ԑth On retient l ’ hypothèse nulle, la différence est non significative Exercice 5 Quelle est la capacité de la mémoire à court terme ? Pour répondre à cette question, deux chercheurs ont présenté à 210 élèves de lycée une liste de 16 mots communs sur un écran de télévision à raison de 1 mot toutes les deux secondes. La moyenne du rappel est de 6,91 tandis que l'écart-type est égal à 2,08. On souhaite estimer, avec un degré de confiance de 95%, la moyenne de la population dont sont issus les sujets composant l'échantillon. Reponse..Choix du test. Estimation d’une moyenne théorique à partir d’une moyenne observée. Taille de l’échantillon: N ≥ 30 Grand échantillon s µ = m± e x N a% s s m- e x £ µ £ m+ e x N N a% a% Application 5% α=5%; Ԑth=1,96 s µ= e 2,08 m ± at% √210x 6,91±1,96 IC [6,63 ; 7,19] N Exercice 6 Pour étudier la pourriture des pommes de terre, un chercheur injecte à 13 pommes de terre des bactéries qui causent cette pourriture. Il mesure ensuite la surface pourrie (en mm2) sur ces 13 pommes de terre, il obtient une moyenne de 7,84 et une variance s2 = 14,13. Donner l’intervalle de confiance de la moyenne μ au seuil 0,05 puis 0,01. Reponse..Choix du test. On cherche à déterminer une moyenne théorique à partir d’une moyenne observée. Taille de l’échantillon: N < 30 Petit échantillon sSx µ = m ± et x à N-1 ddl N aα % S S m- t X £ µ £ m+ t X N N a% a% t5%, 12ddl=2,179 t1%, 12ddl=3,055 s √14,13 s √14,13 µ e = m ± at% √13x 7,84±2,179 µ e = m ± at% √13x 7,84±3,05 IC [4,66 ; 11,02] N 5 N IC [5,57 ; 10,11]