Summary

This document presents a lecture or presentation on inferential statistical methods, specifically focusing on T-tests and ANOVA. It details the differences between these methods and their applications, providing examples and explanations of their use in various scenarios. It also discusses the assumptions and considerations required when applying these tests.

Full Transcript

Dr. Leslie Podlog Adaptation de diaporamas du Prof. Raynald Bergeron « Est-ce que deux groupes diffèrent l’un de l’autre sur une certaine mesure d’intérêt ? (ex. : âge, confiance, PA, VO2max) « Est-ce que plusieurs groupes (c'est-à-dire, plus de 2) diffèrent les uns...

Dr. Leslie Podlog Adaptation de diaporamas du Prof. Raynald Bergeron « Est-ce que deux groupes diffèrent l’un de l’autre sur une certaine mesure d’intérêt ? (ex. : âge, confiance, PA, VO2max) « Est-ce que plusieurs groupes (c'est-à-dire, plus de 2) diffèrent les uns des autres sur une certaine mesure d'intérêt ? « Ma variable de résultat est-elle différente pour les personnes de mon groupe témoin par rapport à mon groupe de traitement ? » « Les gens sont-ils significativement différents au temps 2 par rapport à leurs scores au temps 1 ? « Y a-t-il des différences entre les hommes et les femmes par rapport à ma variable dépendante ? » « Le même groupe de personnes a-t-il obtenu des résultats différents à un test dans des conditions normales et dans des conditions artificielles ? Quelle est la différence entre les T-tests et les ANOVA (F-Tests)? Y a-t-il une différence entre Y a-t-il une différence entre la la VO2 max des joueurs de motivation des joueurs à ces moments- ces équipes ? là ? Le rapport entre (a) la variance entre les a groupes et (b) la variance au sein des groupes b est un indice de la probabilité que les différences observées existe ou pas. a) La différence entre les moyennes reflète « la variance entre les groupes (ou conditions) » b) La répartition des scores au sein des groupes (ou conditions) reflète la « variance au sein du groupe » Les différences entre les moyennes reflètent « la variance entre les groupes ou les conditions » Le rapport entre la variance entre les moyennes et la variance interne est un indice de la probabilité que les Low High Scores différences observées soient La répartition des scores au sein des groupes ou des conditions reflète la « variance au sein du groupe » « réelles » ▪ Test paramétrique servant à déterminer la différence entre 2 moyennes ▪ Il existe 2 variantes T-test T-test T-test apparié indépendant pour des échantillons pour des appariés échantillons indépendants 9 ▪ Même chose que le paired t-test ▪ On évalue si la variable dépendante est différente entre le temps t1 et le temps t0. ▪ Pour des échantillons appariés Comparaison ▪ On compare les sujets entre eux. des mêmes personnes pré Attention, on doit exclure les participants pour lesquels on a des données manquantes. post 10 Élèves Avant Après Différence Différence au carré 1 18 18 0 0 2 24 24 0 0 Ex. : On veut tester l’efficacité d’une 3 31 30 -1 1 méthode pédagogique 4 28 24 -4 16 pour l’apprentissage du lancer franc au basket 5 17 24 7 49 auprès d’une même 6 16 24 8 64 population 7 15 26 11 121 (α = 0.05) – niveau de signification 8 18 29 11 121 Postulats à respecter: 9 20 36 16 256 homogénéité des 10 9 28 19 361 variances et normalité des distributions). 11 12 20 8 64 12 14 18 4 16 H0 : moyenne avant = 13 18 21 3 9 moyenne après 14 13 19 6 36 15 17 27 10 100 H1 : moyenne avant ≠ Somme 270 368 98 1214 moyenne après Moyenne 18 24,5 6,53 80,9 11 On veut tester l’efficacité Élèves Avant Après Différence Différence au carré d’une méthode pédagogique pour Somme 270 368 98 1214 l’apprentissage du lancer franc au basket. Moyenne 18 24,5 6,53 80,9 σ𝐷 98 98 98 𝑡= t= t= t= t = 3,95 𝑛 ෌ 𝐷2 − σ 𝐷 2 15 𝑋 1214 − 98 2 15 𝑋 1214 − 98 2 615 𝑛−1 15−1 15−1 Comment interpréter la signification du score t ? 12 ▪ Valeurs connues : ▪ t obs = 3, 95 ▪ n = 15 ▪ DDL (# des valeurs dans le calcul de t-statistique qui peut varier) = n – 1 = 14 ▪ Nous choisissons au tableau le "two-tailed test", car on ne savait pas si la méthode pédagogique serait bénéfique ou néfaste ▪ t théorique avec α de 0.05 = 2,145 t obs > t théorique, donc rejet de H0 Conclusion: Les performances moyennes en LF sont significativement différentes avant et après l’utilisation de la nouvelle méthode pédagogique. Grâce à l’observation des moyennes, on peut même dire que cela a significativement amélioré les performances en LF. 13 ▪ On évalue si le fait d’appartenir au groupe expérimental vs le groupe de contrôle a une influence sur la VD. ▪ n par groupes peuvent être différents. Comparaison de deux T-test ▪ Postulats à respecter idéalement: groupes ▪ VD présente une distribution ▪ Pour échantillons normale indépendants ▪ VD est mesurée à l’aide d’une mesure continue Exp Témoin ▪ 2 groupes ont la même variance 14 Comparaison ▪ Pour échantillons de deux indépendants groupes au Exp Témoin début de l'étude pré pré (baseline) post post 15 Groupe A Groupe B 1 47,5 48,2 On cherche à déterminer si le port 2 49 48,3 d’une combinaison de natation nouvelle 3 48 47,3 génération va significativement améliorer les performances sur 100 4 46,9 49,9 mètres nage libre de 15 nageurs de haut 5 47,2 50 niveau (Groupe A) par rapport aux performances de 15 autres nageurs 6 48,6 49,1 portant une combinaison classique 7 47,6 47,5 (Groupe B). 8 49,1 47,2 La combinaison A entraîne-t-elle une 9 47 48,8 amélioration significative des performances par rapport à la 10 47,8 49,4 combinaison B ? (α = 0.05 ; homogénéité 11 49,3 50,2 des variances et normalité des distributions). 12 46,9 47,4 H0 : Moyenne Groupe A = Moyenne 13 47,4 50,1 Groupe B 14 48,3 50,2 H1 : Moyenne Groupe A < Moyenne 15 47,5 49,4 Groupe B Moyenne 47,87 48,87 Écart-type 0,81 1,14 16 On cherche à déterminer l’influence de deux types de Groupe A Groupe B combinaisons de natation sur les performances de 30 nageurs de Moyenne 47,87 48,87 haut niveau lors d'un 100 mètres Écart-type nage libre. On attribut au hasard 0,81 1,14 une combinaison à chaque nageur de manière à avoir 15 nageurs avec la combinaison A et 15 nageurs avec la combinaison B. 𝑥ҧ1 − 𝑥ҧ2 47,87 − 48,87 𝑡= 𝑡= 𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22 15 − 1 x 0,812 + 15 − 1 x 1,142 15 + 15 𝑛1 + 𝑛2 x x 15 + 15 − 2 15 x 15 𝑛1 + 𝑛2 − 2 𝑛1 x 𝑛2 −1 −1 𝑡= 𝑡= 𝑡 = −2,78 27,38 30 0,13 x 28 225 Le t-score est-il significatif ? 17 L’une des combinaisons entraîne-t-elle une amélioration significative des performances ? 𝑡 obs = −2,78 DDL = 𝑛1 + 𝑛2 - 2 = 28 Nous choisissons au tableau le "one-tailed test car on présupposait qu’une combinaison serait meilleure qu’une autre. t theorique avec α de 0.05 = 1,701 t osb > t theorique donc rejet de H0 Conclusion: La performance moyenne des nageurs portant la combinaison A nouvelle génération est significativement meilleure que la performance moyenne des nageurs portant la combinaison B. 18 One-way ANOVA (analyse de variance) Supposons une situation dans laquelle nous souhaitons comparer les effets de 3 approches pédagogiques différentes. 5 étudiants ont été affectés à chacune des 3 approches. Après la mise en œuvre de l'enseignement, les étudiants ont passé un test de mathématiques et les scores moyens de 3 approches ont été comparés. 46 52 49 47 54 50 46 55 51 50 58 51 53 61 54 moyenne 49 56 51 19 Hypothèse nulle pour One-way ANOVA Dans notre exemple … H0: m1 = m2 = m3 Ainsi, en rejetant H0 nous concluons: H1: Au moins un des mj (j = 1, 2, 3) est différent des autres. Il est faux de conclure que chaque groupe est différent : H1: m1 ≠ m2 ≠ m3 Puisqu’il s’agit d’une évaluation « globale » de la différence moyenne, tester cette H0 est appelé test « omnibus ». Pour ANOVA le test « omnibus » est appelé un F-test (i.e., F-rapport) 20 Une approche pour cet ensemble de données consiste à effectuer plusieurs T-tests sur deux échantillons. Dans ce cas, nous pouvons effectuer 3 T-tests. Méthode 1 par rapport à la méthode 2 Méthode 2 par rapport à la méthode 3 Méthode 1 par rapport à la méthode 3 Cependant, si nous effectuons plusieurs T-tests, le taux d’erreur de type I s’accumulera et ne sera pas égal à a pour chaque T-test. Par exemple, supposons que a = 0,05 pour chaque T-test t. Ensuite, la probabilité de commettre une erreur de type I dans 3 T-tests « comme un ensemble » est de 1 – (1 – 0.05)3 = 0.14. Pour cette raison, nous devons examiner l’évaluation « globale » de la différence moyenne avant d’examiner toute comparaison particulière par paire. 21 Dans notre exemple… Source de Somme des Degrés de Moyenne F p Variation carrés liberté au Carré Entre les 130.00 2 65.00 8.298 groupes Au sein des 94.00 12 7.83 groupes La statistique F est le rapport Total 224.00 14 entre la variance entre les groupes et la variance au Remarque : La valeur p n’a pas encore été calculée. Pour sein de chaque déterminer si la statistique F est significative, on peut comparer le groupe résultat obtenu avec les valeurs critiques de la distribution théorique F. 22 Dans notre exemple… Fobs = 8,298 F théorique (DDL numérateur, DDL dénominateur) = F théorique (2,12) = 3,89 Fobs > F théorique, donc on rejette H0 Dans l'exemple, nous pouvons conclure que l’ANOVA révèle un effet significatif de l ’approche pédagogique F (2, 12) = 8,298, p < 0.05. Nous savons donc qu'il existe une différence significative entre les trois moyennes. Mais cela ne nous dit pas quels groupes spécifiques sont différents Cela nous dit simplement qu'il y a une ou plusieurs différences QUELQUE PART 23 ▪ Pour trouver où se situent les différences moyennes de groupes spécifiques, on poursuit les analyses pour savoir quels groupes sont différents entre eux (comparaisons par paires). ▪ Ces tests additionnels s’appellent des tests post-hoc. On les fait seulement si l’ANOVA donne un résultat significatif 24 Pas nécessaire avec les tests t (seulement 2 groupes) Nécessaire uniquement lorsque plus de 2 groupes sont testés, par exemple avec des tests F Il existe différents types de tests post-hoc, certains étant plus conservateurs que d’autres. Le choix est basé sur la philosophie de la recherche. Nous utilisons souvent un test modérément conservateur appelé : Test HSD de Tukey ou, en anglais, Tukey HSD (honestly significant difference) Multiple Comparisons Dependent Variable: SCORE Tukey HSD Mean Difference 95% Confidence Interval (I) GROUP (J) GROUP (I-J) Std. Error Sig. Lower Bound Upper Bound 1.00 2.00 -7.0000* 1.77012.005 -11.7224 -2.2776 3.00 -2.0000 1.77012.515 -6.7224 2.7224 2.00 1.00 7.0000* 1.77012.005 2.2776 11.7224 3.00 5.0000* 1.77012.038.2776 9.7224 3.00 1.00 2.0000 1.77012.515 -2.7224 6.7224 2.00 -5.0000* 1.77012.038 -9.7224 -.2776 *. The mean difference is significant at the.05 level. Trois contrastes uniques Les résultats montrent que nous avons des preuves pour dire que : Le groupe 1 et le groupe 2 sont différents Le groupe 2 et le groupe 3 sont différents à un a = 0,05. 26 ▪ Le test t mesure les différences entre deux groupes. ▪ Les ANOVA (tests F) mesurent les différences entre plus de deux groupes. ▪ Les tests t et les tests F sont basés sur la logique que le rapport entre la variance entre les groupes et la variance interne est un indice de la probabilité que les différences observées soient « réelles ». 09-11-2017 27 ▪ Il existe deux types de tests t - échantillons appariés et échantillons indépendants. Si la valeur critique de t est inférieure à p < 0,05 (ou un autre seuil alpha plus strict, par exemple, p < 0,01), nous pouvons conclure que la différence moyenne entre les deux groupes est significative, c'est-à-dire que nous avons une certitude de 95 % qu'une différence "réelle" existe. ▪ Nous pouvons déterminer si la statistique t est significative en utilisant un logicel tel que SPSS ou des valeurs critiques de la table des t. ▪ Nous utilisons une ANOVA si nous voulons voir s'il existe des différentes moyennes entre plus de 2 groupes sur une variable d'intérêt. ▪ Une valeur F significative (c.-à-d., un F-ratio) indique que les scores moyens des différents groupes (ou conditions) diffèrent considérablement d'une manière ou d'une autre. 09-11-2017 28

Use Quizgecko on...
Browser
Browser