La Variable - Cours de Sciences de l'Activité Physique PDF
Document Details
Uploaded by Deleted User
École des sciences de l'activité physique
Philippe Rousseau, Ph.D.
Tags
Related
- Partie 2 : La méthode expérimentale en psychologie PDF
- Méthode Expérimentale en Psychologie - Notes de Cours PDF
- Cours de Python - Introduction à la Programmation Python pour la Biologie PDF
- INF0101: Introduction aux Outils Informatiques - Chapitre 3 - Initiation à l'algorithmique - PDF
- Introduction à Java - Cours 1
- Chapitre 5 : Comment un État construit sa politique (PDF)
Summary
Ce document présente différents types de variables utilisées dans le domaine de la recherche, notamment les variables catégoriques, de dénombrement et continues. Il décrit également comment définir une variable de manière opérationnelle et explique les échelles de mesure (nominale, ordinale, d'intervalle et de rapport).
Full Transcript
La variable École des sciences de l’activité physique Faculté des sciences de la santé 2 2 La variable Définition Une variable est un paramètre qui peut chan...
La variable École des sciences de l’activité physique Faculté des sciences de la santé 2 2 La variable Définition Une variable est un paramètre qui peut changer en fonction de différents facteurs. La manipulation, la mesure et le contrôle de variables sont les objectifs principaux de la recherche. Les variables concrètes peuvent être perçues à l’aide des cinq sens. ↳ age , taille , odeur , etc. Les variables abstraites représentent des concepts complexe et difficilement mesurable. satisfaction opinion intelligence , , APA 3781 Philippe Rousseau, Ph.D. 3 3 Exercices Variable et définition opérationnelle APA 3781 Philippe Rousseau, Ph.D. 4 4 La variable Exercice ‒ Identifiez la variable (le concept évalué) et sa définition opérationnelle. Le temps moyen d'utilisation des téléphones portables des participants au cours d'une semaine est utilisé pour mesurer l'utilisation des téléphones portables. Dans le cadre d'une étude, un chercheur évalue la diversité des expériences professionnelles en demandant aux participants d'indiquer le nombre d'emplois uniques qu'ils ont occupés au cours de leur vie. Un psychologue évalue le trouble du déficit de l'attention/hyperactivité (TDAH) chez les adolescents en obtenant leurs réponses à l'échelle d'évaluation de Vanderbilt. APA 3781 Philippe Rousseau, Ph.D. 5 5 La variable Exercice ‒ Décrivez brièvement quelques façons spécifiques de définir de manière opérationnelle… l’utilisation des média sociaux ~ temps d'écran ~. Fréquence des likes la satisfaction relationnelle · échelle de likert APA 3781 Philippe Rousseau, Ph.D. 6 6 La variable Attribut Les attributs d’une variable représentent l’étendue potentielle de la variation (toutes les options). > - toutes les réponses potentielles – Les variables catégoriques divisent les cas (ou les gens) en groupes ou catégories. types > etc. ex : Couleur - , , – Les variables de dénombrement comptent le nombre de fois qu’un phénomène a lieu. 1, 2. 3 , 4 , I+ c. – Les variables continues capturent une quantité qui peut prendre n'importe quelle valeur entre deux limites théoriques. 1. 2 , 6 3, 4.. 2 , etc. APA 3781 Philippe Rousseau, Ph.D. 7 7 La variable Valeur La valeur d’une variable est la désignation numérique utilisée en statistique pour identifier les attributs mesurables. ex. Sexe > - M : 1 , F : 2 , NB : 3 $$ + paume : I : 2 Riche : 3 , moyen , APA 3781 Philippe Rousseau, Ph.D. 8 8 La variable L’échelle de mesure L’échelle de mesure utilisé pour quantifier une variable est déterminée par ses attributs. Il est important de bien choisir l’échelle puisqu’elle dictera la méthode statistique utilisée pour répondre à la question de recherche. Les variables possèdent des caractéristiques qualitatives ou quantitatives. – Les variables ayant des caractéristiques qualitatives attribuent des éléments à des groupes ou des catégories pour décrire une population. – Les variables ayant des caractéristiques quantitatives représentent les différences à l’aide de quantités ou de montant. APA 3781 Philippe Rousseau, Ph.D. 9 9 La variable La variable nominale Les données d’une échelle nominale sont identifiées par leurs caractéristiques qualitatives. Elles sont divisées en catégories mutuellement exclusives, équivalentes et exhaustives. & this orthal (non négociables - toutes les options possibles APA 3781 Philippe Rousseau, Ph.D. 10 10 La variable La variable nominale Des valeurs numériques peuvent être attribuées à une catégorie. Cependant, ces nombres sont arbitraires et sans significations autre qu’à des fins d’encodage. APA 3781 Philippe Rousseau, Ph.D. 11 11 La variable La variable nominale Une sous-catégorie de l’échelle nominale est l’échelle dichotomique. Une variable dichotomique ne possède que deux attributs, donc deux valeurs. 0 (absence) et 1 (présence) ex : oui (1) I non (0) Ce genre d’échelle est distinct de l’échelle nominale car elle peut être considérée comme étant une échelle numérique (et non catégorique) pour certains tests statistiques. APA 3781 Philippe Rousseau, Ph.D. 12 12 La variable La variable ordinale Les données d’une échelle ordinale permettent aux chercheurs de classer les attributs (catégorique ou numérique) de manière ordonnée. Les données sont divisées en catégories mutuellement exclusives, exhaustives et suivant un ordre logique. I parmelmogen riche S1$ : : Secondante ; Bacc , Maîtrise ,etc School : primanta tes 3 " " donne top de... APA 3781 Philippe Rousseau, Ph.D. 13 13 La variable La variable ordinale Parfois, les attributs sont organisés en intervalles de classe. Ceci est fait en regroupant des valeurs numériques afin d’en faciliter la compréhension. ↑ peut être difficile d'avoir lamaie reponse Il existe une différence distincte entre chacune des classes, mais nous ne sommes pas en mesure de la quantifier. APA 3781 Philippe Rousseau, Ph.D. 14 14 La variable La variable d’intervalle · gar, dans Chaque pas sont Reque Les données d’une échelle d’intervalle sont quantitatives et classées dans un ordre logique représentant des espaces égales entre les niveaux. ex : estime de soi de Rosenberg , 10-40 L'échelle de mesure la plus couramment utilisée pour mesurer les variables d’intervalle est l’échelle de Likert. APA 3781 Philippe Rousseau, Ph.D. 15 15 La variable La variable d’intervalle L’échelle de Likert présente au participant une déclaration et lui demandent d’exprimer son degré d’accord (ou de désaccord). - ~ ~ ~ Score total = échelle à intervale APA 3781 question = ordinale Philippe Rousseau, Ph.D. · poser une 16 16 La variable La variable de rapport Les données d’une échelle de rapport sont classées dans un ordre logique qui représente des distances égales entre les niveaux dans chaque catégorie avec un point zéro absolu (absence de l’attribut). zero avoir doit y un ↑ Il absolu !! 2016s 401bs t ↳ ↓ 4) distances = > ex : - A e+ B > - âge B = 2A > - poids > - Score a Examen APA 3781 Philippe Rousseau, Ph.D. 17 17 l'autre · une est qualitative doit avoir une certaine ordre. intervale : le zero n'est pas tjs égal au nul rapport : le zero est nol/ vide. nominale Rapport ↑ unsereness - ordinale La variable Relation entre variables La statistique permet aux chercheurs de comparer des variables afin d’identifier les associations et les différences. L’association fait référence à la correspondance ou à la connexion entre deux variables. – Une association positive existe lorsque l’augmentation d'une variable est associée à l’augmentation d‘une autre variable (ou vice versa). – Une association négative existe lorsque l’augmentation d'une variable est associée à la diminution d‘une autre variable (ou vice versa). – Une association neutre indique un manque de relation entre deux variables. APA 3781 Philippe Rousseau, Ph.D. 21 21 La variable Relation entre variables her positif : APA 3781 Philippe Rousseau, Ph.D. 22 22 La variable Relation entre variables hen negatif APA 3781 Philippe Rousseau, Ph.D. 23 23 La variable Relation entre variables San en APA 3781 Philippe Rousseau, Ph.D. 24 24 La variable Relation entre variables La différence fait référence à la mesure dans laquelle une personne ou un groupe est différent d'une autre personne ou groupe. – Une différence de nature (anglais: in kind) se produit lorsque deux ou plusieurs groupes sont différents de façon catégorique. – Une différence de degré se produit lorsque deux groupes partagent la même caractéristique mais à des degrés différents. APA 3781 Philippe Rousseau, Ph.D. 25 25 nature : sexe La variable Relation entre variables degré : taille/Sport APA 3781 Philippe Rousseau, Ph.D. 26 26 La variable Types de variables Une variable peut être soit indépendante ou dépendante. (x) – La variable indépendante est la partie de l'environnement de la recherche qui est manipulée; Son effet sur la variable dépendante est généralement le sujet de l’étude. (y) – La variable dépendante, en revanche, n'est pas manipulée. Elle est enregistrée ou mesurée, mais n'est pas altérée. APA 3781 Philippe Rousseau, Ph.D. 27 27 La variable Types de variables La distinction entre les deux types est simple lorsqu'on utilise une étude expérimentale, mais peut être plus compliqué lors d’études non expérimentales. – Lors d’études dans lesquelles aucune variable n'est manipulée, les variables observées sont qualifiées comme étant prédictive ou résultante. APA 3781 Philippe Rousseau, Ph.D. 28 28 Exercices Variables indépendantes et dépendantes APA 3781 Philippe Rousseau, Ph.D. 29 29 La variable Exercice - Identifiez la variable indépendante ainsi que la variable dépendante. Dans le domaine des sciences du sport, l'optimisation des performances des athlètes par le biais de stratégies alimentaires suscite un intérêt constant. Une équipe de chercheurs a mené une étude expérimentale pour étudier les effets du M “carbo-loading” sur les performances d'endurance de coureurs universitaires. Les participants ont été répartis au hasard entre deux groupes : le groupe expérimental, qui a suivi un protocole haut en glucides, et le groupe témoin, qui a conservé son régime alimentaire habituel. L'étude comportait une période d'intervention d'une semaine suivie d'un test de performance. APA 3781 Philippe Rousseau, Ph.D. 30 30 La variable Exercice - Identifiez la variable indépendante ainsi que la variable dépendante. IVI Une étude fut conçue pour étudier la relation entre la durée du sommeil et la VDX performance chez les athlètes universitaires. Un échantillon d'athlètes universitaires issus de différentes équipes sportives fut recruté. On leur a demandé de maintenir leur programme d'entraînement et leurs activités habituelles pendant la durée de l'étude. Chaque participant devait porter une montre spécialisée pour surveiller la durée et la qualité du sommeil pendant un mois. De plus, leurs performances athlétiques ont été évaluées au moyen de tests standardisés tels que le temps de Y sprint, la hauteur du saut vertical et des exercices d'endurance au début et à la fin p de la période d'étude. APA 3781 Philippe Rousseau, Ph.D. 31 31 La variable Types de variables Il existe d'autres variables dont la présence peut avoir un impact sur la relation entre la variable indépendante et la variable dépendante. – La variable antécédente se produit avant les variables indépendantes dépendantes dans une relation de cause à effet et peut en être la cause. formation antérieur ↳ expérance de – La variable intermédiaire est un intermédiaire entre deux autres variables dans une relation causale ; elle est un effet de l'une et une cause de l'autre. ↑ s'insère entre les deux - encouragement estime de soi et motivation – La variable étrangère ne fait pas partie de la relation étudiée mais a le potentiel d’influencer le résultat. ↑ ex. habitudes alimentaire APA 3781 Philippe Rousseau, Ph.D. 32 32 La variable Tests statistiques Nous devons correctement identifier l’échelle d’une variable avant que nous puissions choisir le test statistique approprié. Deux groupes Test T Différence Intervalle/ Plus de deux groupes ANOVA Rapport Deux variables Corrélation de Pearson Relation Plus de deux variables Régression Deux groupes Mann–Whitney Différence Plus de deux groupes Kruskall Wallis Ordinale Relation Deux groupes Corrélation de Spearman Différence Deux groupes Khi-quarré Nominale Relation Deux groupes Khi-quarré APA 3781 Philippe Rousseau, Ph.D. 33 33 Exercices Synthèse APA 3781 Philippe Rousseau, Ph.D. 34 34 La variable Exercice ‒ identifier la variable évaluée, la définition opérationnelle, l'échelle de mesure (nominale, ordinale, intervalle, ratio) utilisée et si cette échelle de mesure correspond à une variable discrète ou continue. V L'heure à laquelle les individus préfèrent se réveiller chaque jour est mesurée en leur demandant d'indiquer une valeur comprise entre 0 et 23 dans un questionnaire, la valeur indiquée correspondant à une heure de la journée. Par 3D0 exemple, si une personne préfère se réveiller et commencer sa journée à minuit, elle inscrit un 0. Si une personne préfère se réveiller de son sommeil à & Démarrondissement 8h30 le matin, elle inscrit un 8,50. - discrète APA 3781 Philippe Rousseau, Ph.D. 35 35 La variable Exercice ‒ Créez une étude qui évalue une relation ou une différence entre l’heure à laquelle une personne préfère se réveiller et une autre variable de votre choix. N’oubliez pas d’identifier cette nouvelle variable, de la définir de manière opérationnelle, d’identifier l'échelle de mesure utilisée et si cette échelle de mesure correspond à une variable discrète ou continue. APA 3781 Philippe Rousseau, Ph.D. 36 36 Travail 1 École des sciences de l’activité physique Faculté des sciences de la santé 37 37 Travail 1 Banque de données sur Excel Télécharger les directives et le format requis pour vos réponses à partir de la section travail de la page Brightspace du cours. Télécharger le document.xlsx ‘Banque de données (GSS 27)’ à partir de la page Brightspace du cours. – Ce document sera celui où vous trouverez les réponses aux questions. Télécharger le document.pdf ‘Guides des codes (GSS 27)’ à partir de la page Brightspace du cours. – Ce document sera celui où vous trouverez une description pour chaque question. APA 3781 Philippe Rousseau, Ph.D. 38 38 Banque de données Données manquantes L’idée d’avoir une donnée manquante n’est pas nécessairement intuitif. Une grande partie de la confusion peut être attribuée au fait qu’une donnée manquante n’est pas toujours manquante. Ce terme veut plutôt dire que la réponse n’est pas utile à l’analyse statistique. – Ne sais pas : Le répondant ne connaît pas la réponse. – Non applicable ou enchaînement valide : Indique que l’on n’a pas posé la question au répondant. Bien qu’elles ne soient pas utilisées dans l’analyse statistique, les données manquantes sont incluses dans la banque de données pour permettre aux chercheurs d’identifier une sous-population. APA 3781 Philippe Rousseau, Ph.D. 39 39 Banque de données Pondération La majorité des sondages effectués par Statistique Canada utilise une pondération. Une pondération est un multiplicateur attribué à chaque répondant afin de permettre à l’échantillon de représenter plus précisément sa population. – Une pondération plus élevée est attribuée aux personnes ayant une probabilité plus faible d'être sélectionnées dans l'échantillon. – Une pondération moins élevée est attribuée aux personnes ayant une probabilité plus élevée d'être sélectionnées dans l'échantillon. Une pondération inégale, peut paraitre injuste car la réponse de certaines personnes « vaut plus » que celle de quelqu’un d’autre. Souvenez-vous qu’afin de fournir une représentation juste et équitable ne signifie pas que les réponses de chaque répondant reçoivent la même pondération; le contexte de leur sélection et leur position sociale doivent être prises en compte. APA 3781 Philippe Rousseau, Ph.D. 40 40 Philippe Rousseau, Ph.D. Courriel: [email protected] École des sciences de l’activité physique Faculté des sciences de la santé 41 41 Mesures descriptives École des sciences de l’activité physique Faculté des sciences de la santé 2 2 Le but est de partager l’information aux autres. Décrire = descriptive Mesures descriptives Généraliser = inférence Introduction Une fois les variables sélectionnées et les données compilées, nous devons décider comment partager cette information. Lorsque l’objectif est de décrire un ensemble de données, nous avons recours à la statistique descriptive. – Nous pouvons en tracer un graphique, calculer des moyennes ou autres indices, rechercher les données extrêmes ou les distributions peu courante. Lorsque l’objectif est de généraliser les résultats d’une étude sur l’ensemble d’une population, nous avons recours à l’inférence statistique. – Nous pouvons performer des estimations, tester des hypothèses, déterminer des relations entre certaines variables et faire des prédictions. APA 3781 Philippe Rousseau, Ph.D. 3 3 Exercices Variable et statistiques APA 3781 Philippe Rousseau, Ph.D. 4 4 nominale Ordinale · et Mesures descriptives Exercice ‒ Identifiez les variables, une statistique descriptive et une statistique inférentielle. O Un chercheur s'intéresse à la corrélation entre le statut professionnel et la satisfaction de la relation de couple chez les adultes canadiens mariés. Ils ont sélectionné au hasard 200 m - adultes en utilisant des registres accessibles au public. Les participants ont répondu à une question pour indiquer leur situation professionnelle (1 = chômeur, 2 = à la recherche d'un ↳ emploi, 3 = employé à temps partiel, 4 = employé à temps plein), ainsi qu'à 10 questions sur ① la satisfaction relationnelle, en utilisant une échelle de réponses de 1 (pas du tout satisfait) à 7 So (extrêmement satisfait). Les résultats révèlent un niveau d'emploi moyen de 3,14 parmi les participants de l'échantillon, ainsi qu'un niveau moyen de satisfaction relationnelle de 4,68. Les analyses statistiques révèlent une corrélation positive de r = 0,33 entre le statut professionnel et la satisfaction relationnelle, ce qui indique que les personnes ayant un statut professionnel plus élevé ont tendance à se déclarer plus satisfaites de leur relation avec leur conjoint. inferentiel veut dire qu’on sort de notre échantillon APA 3781 Philippe Rousseau, Ph.D. 5 5 Mesures descriptives Distribution de fréquence Lors d’une étude scientifique, une certaine quantité de données est récoltée à propos d’un sujet particulier. Ces données doivent ensuite être organisées afin de pouvoir décrire le phénomène observé et en tirer des conclusions. La façon la plus simple est de créer une distribution de fréquence en comptant combien de gens partage le même attribut. APA 3781 Philippe Rousseau, Ph.D. 6 6 Mesures descriptives Proportions et pourcentages La proportion indique la fraction de l’échantillon partageant le même attribut. – Le nombre 1 indique que tous les individus de l’échantillon partagent un attribut. Donc, 0,5 indique que la moitié de l’échantillon partagent un attribut. Le pourcentage est une proportion ajustée sur une échelle de 1 à 100. Avez-vous utilisé des prêts étudiants gouvernementaux pour financer vos études? Réponse Fréquence Pourcentage Oui 5 596 45,1 Non 6 809 54,9 Total 12 405 100,0 Note. Source: Statique Canada, 2015 APA 3781 Philippe Rousseau, Ph.D. 7 7 Mesures descriptives Proportions et pourcentages Le pourcentage est utilisé pour comparer des groupes de différente taille. – Test A: 31/42 (74 %) – Test B: 23/30 (77 %) % pourcentage 𝑭 𝐹 fréquence %= 𝟏𝟎𝟎 𝑵 𝑁 nombre de cas APA 3781 Philippe Rousseau, Ph.D. 8 8 Mesures descriptives Proportions et pourcentages Il est pratique de présenter les résultats d’une variable nominale en ordre croissant ou décroissant. Quelle est la principale raison pour laquelle vous n'avez pas demandé un prêt étudiant gouvernemental? Réponse Fréquence Pourcentage J’ai préféré emprunté d’une autre source 3 796 63,2 Je n’ai pas rencontré les exigences concernant la résidence 1 166 19,4 Je ne savais pas comment appliqué 371 6,2 Je n’étais pas prêt à emprunter le montant nécessaire pour 291 4,8 aller à l’école Autre raison 184 3,1 Je ne croyais pas être qualifié (salaire trop élevé) 133 2,2 Je n’en avais pas besoin 65 1,1 Total 6 006 100,0 Note. Source: Statique Canada, 2015 APA 3781 Philippe Rousseau, Ph.D. 9 9 Exercices Le tableau de fréquences APA 3781 Philippe Rousseau, Ph.D. 10 10 Mesures descriptives Exercice ‒ Créez un tableau de fréquences indiquant le genre préférée de film des étudiants de cette classe. Comédie 21 40 , 4 Action 1) 2 , 2 13 S Romance L , 9 6 Fantaisie 5 , Horreur 44 , 7 Rom Com 5. 3. 8 Historique " APA 3781 Philippe Rousseau, Ph.D. 11 11 Mesures descriptives Proportions et pourcentages Il est pratique de présenter les résultats d’une variable quantitative en utilisant un tableau de fréquences groupées. – Un tableau de fréquences groupées est une liste ordonnée de groupes de valeurs, accompagnée du nombre de fois que les valeurs de chaque intervalle sont observées. ↓ plusrapide liveporoneer Combien d’argent deviez-vous remettre au gouvernement après votre graduation? Réponse Fréquence Pourcentage Pourcentage cumulatif 0$ 1 059 20,1 20,1 1$ à 4 999$ 466 8,9 29,0 5 000$ à 9 999$ 819 15,6 44,5 10 000$ à 24 999$ 1 721 32,7 77,2 25 000$ ou plus 1 200 22,8 100,0 Total 5 265 100,0 Note. Source: Statique Canada, 2015 APA 3781 Philippe Rousseau, Ph.D. 12 12 Mesures descriptives Proportions et pourcentages Souvent, un pourcentage cumulatif, est inclus dans le tableau. – Le pourcentage cumulatif peut être calculé en additionnant la fréquence de l’intervalle désirée à celles qui la précède et en divisant la somme par le nombre total de cas. (1 + B 1 059 + 466 × 100 = 28.96% 5 265 (total) Puisque les attributs doivent être classé en ordre, ceci veut donc dire que le pourcentage cumulatif ne peut pas être calculé pour les variables nominales. APA 3781 Philippe Rousseau, Ph.D. 13 13 Exercices Le tableau de fréquences groupées APA 3781 Philippe Rousseau, Ph.D. 14 14 Mesures descriptives Exercice ‒ Créez un tableau de fréquences groupées en utilisant 50 critiques pour le film Twilight. Que pouvez-vous en interpréter ? I 2 345 L #IIIIIIII 'Ill I11 III 1 "Il # 7 g 910 Y · i 6 Ill · % 10 8 4 7 10 8 2 2 3 1 9 6 10 10 8 1 9 9 10 1 1 2 1 8 6 7 5 3 10 9 9 905 i 9 1 6 5 9 2 7 5 4 8 + 100 7 3 4 1 3 1 10 6 5 1 APA 3781 Philippe Rousseau, Ph.D. 15 15 Mesures descriptives Rapport et taux Un rapport est communément utilisé pour comparer les fréquences de deux attributs d’une même variable. 𝐹 𝑅𝑎𝑝𝑝𝑜𝑟𝑡 = 𝐹 Rapport entre le nombre d’étudiant ayant emprunté de l’argent et les étudiants ne l’ayant pas fait: 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡 𝑎𝑦𝑎𝑛𝑡 𝑒𝑚𝑝𝑟𝑢𝑛𝑡é 5 596 = = 0.82 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡 𝑛 𝑎𝑦𝑎𝑛𝑡 𝑝𝑎𝑠 𝑒𝑚𝑝𝑟𝑢𝑛𝑡é 6 809 – Ceci veut donc dire que pour chaque 100 étudiants n’ayant pas emprunté d’argent, 82 se seront endettés. APA 3781 Philippe Rousseau, Ph.D. 16 16 Mesures descriptives Rapport et taux Un taux compare deux types de quantités différentes et comporte une mesure de changement en fonction du temps, de la distance ou d'une autre unité. → Les taux de mortalité sont généralement exprimés en nombre de décès pour une certaine unité de taille de population (par exemple, pour 1 000 individus) dans un laps de temps donné (par exemple, par an). L'utilisation de taux plutôt que de chiffres bruts ou de rapports tient compte des différences de taille de la population et permet des comparaisons pertinentes. APA 3781 Philippe Rousseau, Ph.D. 17 17 Mesures descriptives Rapport et taux Le taux peut être calculé comme un pourcentage, la différence étant que le dénominateur n’est pas toujours 100. 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡 𝑎𝑦𝑎𝑛𝑡 𝑒𝑚𝑝𝑟𝑢𝑛𝑡é 5 596 = × 1000 = 451,1 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡 𝑝𝑜𝑢𝑣𝑎𝑛𝑡 𝑎𝑣𝑜𝑖𝑟 𝑒𝑚𝑝𝑟𝑢𝑛𝑡é 12 405 – Ceci montre que 451 étudiants sur 1 000 qui ont obtenu leur diplôme en 2009-10 ont eu recours à des prêts étudiants. Nous pouvons aussi inversé les valeurs afin de présenter les résultats différemment. é é – = = 2.22 é é – Nous pouvons donc dire que 1 étudiant sur 2.2 ont emprunté de l’argent. APA 3781 Philippe Rousseau, Ph.D. 18 18 Mesures descriptives Rapport et taux X Les médias utilisent beaucoup les taux car la plupart des gens ont une plus grande facilité à comprendre les résultats de cette façon. – 9 étudiants sur 20 sont endettés. les. Sort très utilisé mais , langue w Courant on utilise fraction. APA 3781 Philippe Rousseau, Ph.D. 19 19 Exercices Rapport et taux APA 3781 Philippe Rousseau, Ph.D. 20 20 Mesures descriptives Exercice ‒ Quel est un exemple de rapport que vous pouvez tirer de votre vie? rapport de dans le · gare pays · apple vs android in clays ‒ Quel est un exemple de taux que vous pouvez tirer de votre vie? taux d'ach. / ans APA 3781 Philippe Rousseau, Ph.D. 21 21 Rajout d'une variable · Mesures descriptives quelconque Tableau croisé Un tableau croisé est utilisé pour présenter la relation entre deux variables catégoriques. Son utilisation permet donc de présenter la fréquence de distribution pour des sous-groupes. Lors de la création d’un tableau croisé, il est important de bien identifier la variable prédictive de la variable résultante. – Par exemple, nous voulons démontrer que l’utilisation de prêts étudiants dépend du niveau d’éducation et non l’inverse. Attention, ce tableau ne démontre pas une relation cause-effet ! APA 3781 Philippe Rousseau, Ph.D. 22 22 Mesures descriptives Tableau croisé Tableau croisé : emprunt d’un prêt gouvernemental * niveau d’éducation Niveau d’éducation Avez-vous fait l’emprunt d’un prêt Collège ou Université Total gouvernemental? CÉGEP Oui Fréquence 1 979 3 617 5 596 Pourcentage 38.8% 49.5% 45.1% Non Fréquence 3 116 3 693 6 809 Pourcentage 61.2% 50.5% 54.9% Total Fréquence 5 095 7 310 12 405 Pourcentage 100.0% 100.0% 100.0% APA 3781 Philippe Rousseau, Ph.D. 23 23 Exercices Tableau croisé APA 3781 Philippe Rousseau, Ph.D. 24 24 Mesures descriptives Exercice ‒ Interprétez ce tableau croisé. Tableau croisé : stratégie de rupture * statut de l’amitié Statut de l’amitié most success Stratégie de rupture Pas ami Ami ~ Total Confrontation - 17 27 44 ! Progressif - 11 7 ↳ 18 hit miss mu Médiateur - 31 20 51 34 Ghosting - 14 3 17 Total 73 57 130 amis ↑ successful 1. reste plus less 2 APA 3781 Philippe Rousseau, Ph.D. 25 25 Support visuel École des sciences de l’activité physique Faculté des sciences de la santé 26 26 Support visuel Introduction L’utilisation de support visuel est commune car il est parfois plus simple de transmettre de l’information à l’aide d’un graphique qu’à l’aide d’un tableau. Le choix du bon diagramme est effectué à partir de l’échelle de mesure de la variable étudiée. APA 3781 Philippe Rousseau, Ph.D. 27 27 Support visuel Diagramme circulaire Le diagramme circulaire (anglais: pie chart) représente le pourcentage de cas par attribut en tant que proportion de l’aire d’un cercle. Ce genre de diagramme est approprié pour les variables nominales ayant cinq ou moins attributs. minutit tablea APA 3781 Philippe Rousseau, Ph.D. 28 28 Support visuel Diagramme à barre Le diagramme à barre représente la distribution de données catégoriques en utilisant la longueur d’une barre pour démontrer le pourcentage de cas pour chaque attribut. Ce genre de diagramme est approprié pour les variables ordinales car l’ordre peut être préservé. atrant APA 3781 Philippe Rousseau, Ph.D. 29 29 Support visuel Diagramme à barre Il est commun que les attributs soit organisé en ordre décroissant (aussi nommé diagramme de Pareto). APA 3781 Philippe Rousseau, Ph.D. 30 30 Support visuel Histogramme L’histogramme représente la distribution de données quantitative en utilisant la longueur d’une barre pour démontrer le pourcentage de cas pour chaque valeur ou groupe de valeur. Ce genre de diagramme est approprié pour les variables d’intervalles ou de rapport car les colonnes se touchent indiquant une continuité. APA 3781 Philippe Rousseau, Ph.D. 31 31 Support visuel Histogramme gramme quant : histo barre : quelitatif APA 3781 Philippe Rousseau, Ph.D. 32 32 Support visuel Série temporelle Un diagramme linéaire (anglais: line chart) peut être utilisé pour présenter une variation des données selon le temps. APA 3781 Philippe Rousseau, Ph.D. 33 33 Support visuel Deux variables Parfois, il peut être nécessaire de présenter deux variables en même temps. – Diagrammes circulaires côtes à côtes comparaison APA 3781 Philippe Rousseau, Ph.D. 34 34 Support visuel Deux variables – un diagramme à barres groupées (anglais: clustered bar chart) APA 3781 Philippe Rousseau, Ph.D. 35 35 Support visuel Deux variables – un diagramme à barres groupées (anglais: clustered bar chart) APA 3781 Philippe Rousseau, Ph.D. 36 36 Support visuel Deux variables – Diagramme à barres empilées (anglais: stacked bar chart). APA 3781 Philippe Rousseau, Ph.D. 37 37 Support visuel Diagrammes trompeurs L’échelle de l’ordonnée peut influencer l’interprétation du lecteur. APA 3781 Philippe Rousseau, Ph.D. 38 38 Support visuel Diagrammes trompeurs Le choix du type de diagramme peut aussi influencer l’interprétation du lecteur. APA 3781 Philippe Rousseau, Ph.D. 39 39 Conseils École des sciences de l’activité physique Faculté des sciences de la santé 40 40 Conseils Sélection du support visuel Figures communément utilisées pour montrer une relation entre deux variables catégoriques Variable indépendante Variable dépendante Figures communément choisies Nominal, peu d’attributs Nominal, peu d’attributs Diagramme circulaire, côte à côte Diagramme à barres côte à côte Nominal, peu d’attributs Ordinal, peu d’attributs ou groupées Ordinal, peu d’attributs Ordinal, peu d’attributs Diagramme à barres groupées Nominal ou ordinal, plusieurs Nominal ou ordinal, peu Diagramme à barres empilées attributs d’attributs Nominal ou ordinal, plusieurs Nominal ou ordinal, plusieurs Utilisation de diagramme attributs attributs alternatifs APA 3781 Philippe Rousseau, Ph.D. 41 41 Conseils Format APA pour tableaux Tableau 1 Province de résidence Province Fréquence Pourcentage Ontario 7 187 38,8 Québec 5 301 23,2 Alberta 3 651 11,1 Colombie Britannique 3 292 13,5 Manitoba 2 035 3,5 Saskatchewan 1 673 3,0 Nouvelle-Écosse 1 638 2,7 Nouveau Brunswick 1 272 2,2 Terre-Neuve et Labrador 992 1,5 Île-du-Prince-Édouard 493 0,4 Total 27 734 100,0 Source: Statique Canada, 2015 APA 3781 Philippe Rousseau, Ph.D. 42 42 Conseils Format APA pour figures 3% 9% 24% Très fier Fier 24% Plutôt fier Pas très fier Pas du tout fier 40% Figure 1. Distribution des réponses valides (n = 25 768) à la question “Dans quelle mesure êtes-vous fier du Canada dans le domaine suivant : la manière dont la démocratie fonctionne ?” APA 3781 Philippe Rousseau, Ph.D. 43 43 Conseils Nombres écrits Typiquement, il est recommandé de ne pas débuter une phrase avec un nombre. Si c’est absolument nécessaire, vous devrez alors écrire le nombre à l’aide de mot suivi du nombre entre parenthèse. – 45% des gradués post-secondaires ont utilisé des prêts gouvernementaux afin de financer leurs études. – Quarante-cinq pour cent (45%) des gradués post-secondaires ont utilisé des prêts gouvernementaux afin de financer leurs études. – Au total, 45% des gradués post-secondaires ont utilisé des prêts gouvernementaux afin de financer leurs études. De plus, il est recommandé de ne pas exagéré la précision de vos données. – 45,111% des gradués post-secondaires ont utilisé des prêts gouvernementaux afin de financer leurs études. APA 3781 Philippe Rousseau, Ph.D. 44 44 Philippe Rousseau, Ph.D. Courriel: [email protected] École des sciences de l’activité physique Faculté des sciences de la santé 45 45 Tendance centrale d’un échantillon École des sciences de l’activité physique Faculté des sciences de la santé 2 Tendances centrales Introduction Quel genre de maison pouvez-vous acheter avec $500,000? APA 3781 Philippe Rousseau, Ph.D. 3 Tendances centrales Introduction Comment pouvons-nous mesurer l’accessibilité à la propriété? – Selon la Société canadienne d’hypothèques et de logement, une maison est classée comme étant accessible si elle coûte moins de 30% du revenu familiale avant impôts. Hypothèque, impôts fonciers, frais de condominium, électricité, chauffage, eau et services municipaux. – Très accessible : moins de 15% – Légèrement accessible: 15% à 29% – Légèrement inaccessible : 30% à 44% – Très inaccessible: 45% ou plus À travers ce cours, nous pourrons répondre aux questions suivantes: 1. Quel pourcentage des foyers ont accès à un logement abordable ? 2. Quel est le montant mensuel typique alloué au logement par un foyer? 3. Quelle est la relation entre l’accessibilité à un logement et le revenu familiale? APA 3781 Philippe Rousseau, Ph.D. 4 Tendances centrales Introduction 1. Coûts de logement mensuel Coûts de logement mensuel Catégories Fréquence Pourcentage Pourcentage cumulatif Moins de 250$ 52 3.2 3.2 250$ à 499$ 302 18.6 21.8 500$ à 749$ 342 21.1 42.9 750$ à 999$ 221 13.6 56.5 1 000$ à 1 249$ 156 9.6 66.1 1 250$ à 1 499$ 130 8.0 74.1 1 500$ à 1 999$ 210 12.9 87.0 2 000$ à 2 499$ 115 7.1 94.1 2 500$ ou plus 96 5.9 100.0 Total 1 624 100.0 Source: Statique Canada, 2015 APA 3781 Philippe Rousseau, Ph.D. 5 Tendances centrales Introduction 2. Pourcentage du revenu familiale Coûts de logement mensuel Catégories Fréquence Pourcentage Pourcentage cumulatif Très accessible 722 44.5 44.5 Légèrement accessible 546 33.6 78.1 Légèrement inaccessible 205 12.6 90.7 Très inaccessible 151 9.3 100.0 Total 1 624 100.0 Source: Statique Canada, 2015 Interprétations : APA 3781 Philippe Rousseau, Ph.D. 6 Tendances centrales Mode Le mode est l’attribut la plus fréquente dans une banque de données. – Dis autrement, c’est la réponse donnée le plus souvent. Le mode peut être utilisé pour décrire les données provenant des quatre échelles de mesure. Il arrive qu’une variable possède plus qu’un mode: – Variable bimodale : 2 modes – variable multimodale : 3 + modes APA 3781 Philippe Rousseau, Ph.D. 7 Tendances centrales Mode Coûts de logement mensuel Catégories Fréquence Pourcentage Pourcentage cumulatif Moins de 250$ 52 3.2 3.2 250$ à 499$ 302 18.6 21.8 500$ à 749$ 342 21.1 42.9 750$ à 999$ 221 13.6 56.5 1 000$ à 1 249$ 156 9.6 66.1 1 250$ à 1 499$ 130 8.0 74.1 1 500$ à 1 999$ 210 12.9 87.0 2 000$ à 2 499$ 115 7.1 94.1 2 500$ ou plus 96 5.9 100.0 Total 1 624 100.0 Source: Statique Canada, 2015 Interprétations : APA 3781 Philippe Rousseau, Ph.D. 8 Tendances centrales Médiane La médiane est l’attribut ou la valeur située au centre lorsque toutes les données sont organisées en ordre croissant. – 𝑚é𝑑𝑖𝑎𝑛𝑒 ∶ La médiane ne peut pas être calculée pour une variable nominale ! Scenario 1: nombre impair de cas Scenario 2: nombre pair de cas Scenario 3: nombre pair de cas Cas/position Attribut Cas/position Attribut Cas/position Attribut 1 Fortement en désaccord 1 Fortement en désaccord 1 Fortement en désaccord 2 Fortement en désaccord 2 En désaccord 2 Fortement en désaccord 3 En désaccord 3 En désaccord 3 En désaccord 4 En désaccord 4 En accord 4 En désaccord 5 En accord 5 En accord 5 En accord 6 En accord 6 En accord 6 En accord 7 En accord 7 Fortement en accord 7 En accord 8 Fortement en accord 8 Fortement en accord 8 Fortement en accord 9 Fortement en accord APA 3781 Philippe Rousseau, Ph.D. 9 Tendances centrales Médiane Coûts de logement mensuel Catégories Fréquence Pourcentage Pourcentage cumulatif Moins de 250$ 52 3.2 3.2 250$ à 499$ 302 18.6 21.8 500$ à 749$ 342 21.1 42.9 181215 750$ à 999$ 221 13.6 56.5 1 000$ à 1 249$ 156 9.6 66.1 1 250$ à 1 499$ 130 8.0 74.1 1 500$ à 1 999$ 210 12.9 87.0 2 000$ à 2 499$ 115 7.1 94.1 2 500$ ou plus 96 5.9 100.0 Total 1 624 100.0 Source: Statique Canada, 2015 Interprétations : 1000 ou + 7508 ou APA 3781 Philippe Rousseau, Ph.D. 10 Dispersion d’un échantillon École des sciences de l’activité physique Faculté des sciences de la santé 11 Dispersion Percentile Il est souvent intéressant d’ajouter la dispersion des données à une mesure centrale. Ceci permet de mieux décrire à quel point les cas sont semblables ou différents. Le percentile divise les cas en utilisant le pourcentage du nombre total de cas une fois les données organisées en ordre croissant. – Au Canada, le 99ème percentile a un salaire annuel de 225 409$. Donc, 99% de la population se situe sous ce salaire et 1% de la population au-dessus. 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙𝑒 ∶ 𝑁 + 1 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙𝑒 𝑒𝑛𝑡𝑟𝑒 0 𝑒𝑡 1 80è ∶ 𝑁 + 1 0.8 – La médiane est un percentile (50ème). APA 3781 Philippe Rousseau, Ph.D. 12 Dispersion Percentile Coûts de logement mensuel Catégories Fréquence Pourcentage Pourcentage cumulatif Moins de 250$ 52 3.2 3.2 250$ à 499$ 302 18.6 21.8 500$ à 749$ 342 21.1 42.9 750$ à 999$ 221 13.6 56.5 1 000$ à 1 249$ 156 9.6 66.1 1 250$ à 1 499$ 130 8.0 74.1 1 500$ à 1 999$ 210 12.9 87.0 2 000$ à 2 499$ 115 7.1 94.1 2 500$ ou plus 96 5.9 100.0 Total 1 624 100.0 Source: Statique Canada, 2015 Interprétations :