Cours de Statistiques Bivariées (ANOVA) PDF

Summary

Ce document présente un cours sur les statistiques bivariées, en se concentrant sur l'ANOVA (analyse de variance), une technique permettant de comparer les moyennes de plusieurs groupes. Il explique les objectifs, le principe, les hypothèses et la procédure de l'ANOVA, accompagné d'exemples pratiques et d'exercices.

Full Transcript

Analyser les relations entre variables Statistiques bivariées 1 variable qualitative 2 variables Variables 2 variables qualitatives 1 variabl...

Analyser les relations entre variables Statistiques bivariées 1 variable qualitative 2 variables Variables 2 variables qualitatives 1 variable quantitative quantitatives Outils Analyse de Comparaison de moyennes Tableau croisé statistiques corrélation Var. qualitative Var. qualitative avec plus de 2 Tests avec 2 modalités Test du Khi-deux ( ) Test modalités Test ANOVA 3.2 Comparer plus de deux moyennes (ANOVA) Objectifs Expliquer les principes de l’analyse de variance Interpréter une ANOVA Réaliser une ANOVA avec SPSS Interpréter les tableaux de résultats donnés par SPSS (test , test de Tukey) Interpréter l’êta carré 3.2 Comparer plus de deux moyennes (ANOVA) Quelle est la différence de moyenne entre les groupes? Statistiques descriptives Décrire ce qu’on observe sur échantillon Y-a-t-il des différences significatives entre les moyennes des groupes? ANOVA (test ) On peut généraliser à l’ensemble de la population ? —> p-value (test F) Pour quels groupes les différences de moyennes sont-elles significatives? Comparaison post-hoc (test de Tukey) Test après analyse de variances Quelle est la force de l’association entre les variables? Mesures d’association (êta carré) 3.2 Comparer plus de deux moyennes (ANOVA) Analyse de variance Pour comparer les moyennes de plus de deux groupes, on utilise une méthode appelée analyse de variance (ANalysis Of VAriance) et une distribution appelée On compare les moyennes des différents groupes en s’intéressant à leur variance On comparer plusieurs moyenne en s’intéressant à leur variance/dispersion. 3.2 Comparer plus de deux moyennes (ANOVA) La distribution La distribution présente une asymétrie positive La forme de la distribution va changer en fonction de la taille de l’échantillon ( ) et du nombre de groupes à comparer ( ) Valeurs toujours supérieures à 0 Plusieurs formes de distribution F : elle change selon taille de l’échantillon et nombre de groupes à comparer =2 ; =2 =6 ; =5 =21 ; =11 Plus la taille augmente, plus le nombre de groupe augmente, plus la courbe tend à devenir symétrique. 3.2 Comparer plus de deux moyennes (ANOVA) Hypothèses H0: Il n’y a pas de différences de moyennes entre les différents groupes Rien ne se passe H0: = = = : nombre de groupes H1: Au moins deux groupes ont des moyennes différentes L’ANOVA ne nous dit pas quels groupes ont des moyennes différentes (test omnibus) ANOVA : y a au moins deux groupes pour lesquelles différences de moyenne est significatives. Mais on ne sait pas lesquels des groupes. Il n’y a pas de notation mathématique pour hypothèse alternative. 3.2 Comparer plus de deux moyennes (ANOVA) Procédure dans SPSS: Analyse Comparer les moyennes ANOVA à 1 facteur 1. Var. quantitative Variable quantitative 2. Var. qualitative 3. Stat. descriptives Variable explicative 3.2 Comparer plus de deux moyennes (ANOVA) Procédure dans SPSS: Analyse Comparer les moyennes ANOVA à 1 facteur 4. Tests post-hoc 5. Mesures d’association (eta carré) 3.2 Comparer plus de deux moyennes (ANOVA) Exemple: Relation entre le statut migratoire et le score en lecture Lecture des tableaux de résultats donnés par SPSS 1. Statistiques descriptives Les élèves natifs (515,37) ont un score en moyenne plus élevé que les 2e génération (467,03) et les 1ère génération (458,51) Ces différences de moyennes sont-elles significatives? Moyenne :élèves natifs ont 515 points càd plus élevé que les élèves de 2ème génération. Les secondes génération ont meilleurs scores que ceux de 1ère génération. 3.2 Comparer plus de deux moyennes (ANOVA) Hypothèses H0: Il n’y a pas de différences de moyennes entre les différents groupes H0: = = H1: Au moins deux groupes ont des moyennes différentes 3.2 Comparer plus de deux moyennes (ANOVA) Partition de la variance L’objectif d’une ANOVA est de déterminer quelle part de la variance totale est liée à la variance entre les groupes (inter-groupes) et quelle part est liée à la variance entre les individus à l’intérieur des groupes (intra-groupes) À la fin du semestre, il y a un examen, il y aura une variabilité de scores. Cela peut être lié à plusieurs facteurs, par exemple le degré de participation au cours. Il y a aussi d’autres nombres facteurs qui vont avoir impact sur résultats, p.ex degré de familiarité avec les contenus, temps de travail en dehors des cours, degré de fatigue, préparation à l’examen. Quand on parle de partition de la variance : quelle part de la variation des résultats est lié à variable qu’on a pris en compte vs les variables pas pris en compte. 3.2 Comparer plus de deux moyennes (ANOVA) Partition de la variance Comparer variance intergroupes et intragroupes Variance inter-groupes variance du score en lecture attribuable au statut migratoire variance totale du score en lecture variance du score en lecture attribuable à d’autres variables Variance intra-groupes Peut y avoir encore sexe de l’individu, langue parlée, situation socio-économique. 3.2 Comparer plus de deux moyennes (ANOVA) Comparer la variance inter-groupe et la variance intra-groupe Score : rapport entre la variance inter-groupes et la variance intra-groupes Ratio entre les deux = 3.2 Comparer plus de deux moyennes (ANOVA) 2. Résultats du test d’hypothèses (distribution ) Variance inter-groupes: variance du score en lecture expliquée par le statut migratoire Variance intra-groupes: variance du score en lecture expliquée par d’autres variables Variance inter-groupes + Variance intra-groupes = Variance totale 3 lignes différentes Colonnes : 1. Somme des carrés = distance de chaque individu par rapport à la moyenne au carrée 2. Df = degré de freedom 3. Carré moyen = 3.2 Comparer plus de deux moyennes (ANOVA) 2. Résultats du test d’hypothèses (distribution ) La variance inter-groupes (18788124,63) est nettement plus forte que la variance intra-groupes (7201,732) = = 18788124/7201 = 2608 Score F très elevé 3.2 Comparer plus de deux moyennes (ANOVA) 2. Résultats du test d’hypothèses (distribution ) «Sig.» donne la p-value Si la p-value est plus petite que.05 Les différences de moyennes sont significatives Si la p-value est plus grande que.05 Les différences de moyennes ne sont pas significatives Interprétation de p-value est toujours la même. Le seuil de signification est toujours fixé à 0.05. 3.2 Comparer plus de deux moyennes (ANOVA) 2. Résultats du test d’hypothèses (distribution ) P-value : probabilité d’obtenir un score F donnée quand l’hypothèse nulle est vrai (càd pas de différences entre groupes) = 0,05 p-value=0,000 1 2 3 4 Si l’hypothèse nulle est vraie, on va avoir 95% de scores inférieur à 2,99 une probabilité très faible de tirer au sort =2608 =2,99 (au hasard) un échantillon avec un score F aussi élevé que 2608. —> indique qu’il y a qqch en lien avec statut migratoire 3.2 Comparer plus de deux moyennes (ANOVA) 2. Résultats du test d’hypothèses (distribution ) H0: Il n’y a pas de différence de score entre les natifs, les 2e gén. et les 1ère gén. H0: = = H1: Au moins deux groupes ont des moyennes différentes p-value=.000

Use Quizgecko on...
Browser
Browser