Méthodes d'analyses quantitatives CRI 1200 PDF
Document Details
Uploaded by CohesiveLapisLazuli6982
2024
Tags
Related
- Introduction aux Techniques d\'Analyse en Chimie PDF
- POL 1803 Analyse des Techniques Quantitatives PDF
- Aide-mémoire pour l'analyse de variance (session POL-1803)
- Cours 9: Les paradigmes de la recherche et la méthode d'analyse (Université de Montréal)
- Méthodologie de la recherche en sciences humaines SIWA PDF
- Méthodologie 9 PDF
Summary
Présentation des méthodes d'analyses quantitatives, 14 novembre 2024, CRI 1200. Le document traite de l'échantillonnage, des sources de données quantitatives et des analyses quantitatives (univariées, bivariées, multivariées).
Full Transcript
Les méthodes d’analyses quantitatives CRI 1200 14 novembre 2024 Petite mise au point sur le cours Plan de la séance Échantillonnage Sources de données quantitatives Analyses quantitatives Univariées Bivariées Multivariées Si on a le temps : introduction à la méthodologie...
Les méthodes d’analyses quantitatives CRI 1200 14 novembre 2024 Petite mise au point sur le cours Plan de la séance Échantillonnage Sources de données quantitatives Analyses quantitatives Univariées Bivariées Multivariées Si on a le temps : introduction à la méthodologie qualitative Période de questions et organisation pour le reste de la session 1. Échantillonnage En criminologie L’échantillonnage Que ce soit en méthode quantitative ou qualitative, il faut être capable d’identifier et de définir la population étudiée. Permet de quantifier et de qualifier l’ampleur du phénomène étudié Généralisation ? Valeur de l’échantillon ? Les définitions Population Population Population accessible Population accessible Échantillon Échantillon Unité Unité Les définitions Échantillonnage : sélection d’un sous ensemble de la population cible Définition claire Qualité de l’échantillon = qualité de la recherche Représentativité : caractéristiques qui s’apparentent à celles de la population cible Biais d’échantillonnage : échantillon non représentatif Comment éviter les biais? (Population qu’on peut accéder car la population que l’on recherche ne veut /peut pas répondre ou participer) Les méthodes d’échantillonnage Types d’échantillonnage Sorte d’échantillonnage Aléatoire simple Stratifié Proportionnel Probabiliste Non-proportionnel Par grappes Un degré Plus d’un degré Accidentel Quotas Non-probabiliste Typique Par réseaux Comment choisir une technique d’échantillonnage ? À considérer : Objectifs de la recherche Population à échantillonner Délais impartis Ressources disponibles Moyens Homogénéité de la population accessible Possibilité de jumeler plus d’une technique Taille de l’échantillon 2. Sources de données D’où viennent nos données en criminologie ? Taux de criminalité, Efficacité d’une Explication d’une victimisation intervention ou d’une caractéristique, d’un politique phénomène ou d’un comportement par une ou plusieurs variables Caractéristiques socio- démographiques d’une Sur quoi population peut porter une Influence de la santé Relation entre la recherche mentale sur la criminlaité consommation d’alcool quantitativ dans une population et le taux de criminalité e? Effet des relations Causes de la violence Éléments qui epliquent interpersonnelles sur la conjugale l’auto-efficacité des résilience des délinquants personnes Criminalité et chiffre noir 1. Univers de la déviance 2. Univers de la criminalité 3. Actes susceptibles d’être sanctionnés 4. Actes sanctionnés par la police 5. Actes sanctionnés par les tribunaux 6. Actes qui résultent en une détention Principales sources de données Les statistiques officielles Les sondages de victimisation Les sondages de délinquance auto-révélée Les questionnaires standardisés Les statistiques officielles Instances officielles Appels de service Arrestations Affaires traitées par les tribunaux Admissions en détention Types de données officielles : Unitaires (Sur un individu/ chaque individu/évènement rapporté de manière individuelle) Agrégées (Regroupe des infos sur plusieurs évènements similaires) ex. catégorie de crime le + commis dans une période de temps donnée Avantages et limites Accessibilité Chiffre noir Standardisation (à cause de leur Dépend des actions des création par les instances) instances pénales Comprendre le fonctionnement du Invisibilité des délits sans victime système de justice (Dans l’ensemble) Problème de classement (sur les intérprétations ex. des lois) Sondages de victimisation Alternatives aux statistiques policières ESG (Enquête sociale générale) faite par StatCan tous les 5 ans (environ 25 000 canadiens) Victimisation sur une période donnée Point de vue des victimes Considération des délits qui ont été rapportés (ou non) à la police Avantages et limites Indépendance du système de justice Prévalence des crimes plus Informations sur les victimes fréquents donc moins graves Chiffre (moins) noir de la criminalité Problèmes d’interprétation (définition du crime, Possibilité de comparer au plan connaissance de la loi) international Localisation des événements dans le temps Populations qu’on ne peut rejoindre Informations manquantes sur les délinquants Invisibilité des délits sans victimes Les sondages de délinquance auto-révélée Buts Bâtir des statistiques ayant une meilleure validité que les mesures officielles Étudier les facteurs associés à la criminalité et chercher les causes du crime Mesures : délinquance caractéristiques de l’individu Avantages et limites Permet de saisir l’ampleur des délits Population incarcérée non inclue sans victimes Localisation des événements Informe sur le délinquant et sur le dans le temps développement de la délinquance Interprétation Indépendance du système de justice Biais de désirabilité sociale Chiffre (de moins en moins) noir Les questionnaires standardisés Outils structurés pour obtenir des informations systématiques sur la criminalité (infraction, victimes et parfois délinquants) Questions fermées et organisées pour que chaque personne réponde de façon uniforme Conçus pour pouvoir être analysé sous la forme d’échelles Avantages et limites Comparaison des données Biais de réponse Fiabilité Limites de la portée Facilité d’analyse (généralement des crimes communs) Temps et ressources Échantillon limité Long processus pour évaluer la fidélité et la validité 3. Analyses statistiques Faire « parler » les données Variable dépendanc e dichotomiq ue Régressi on logistiqu e Différents niveaux d’analyses statistiques Statistiques univariées (descriptives) Tendance centrale Dispersion Distribution Statistiques bivariées Corrélations Tests de moyenne Tableaux de contingence Statistiques multivariées Régression linéaire multiple Régression logistique Statistiques descriptives Constituent l’étape préliminaire à toute analyse statistique, même la plus sophistiquée Aident à orienter les analyses subséquentes On s’attarde habituellement à trois aspects : les mesures de tendance centrale les mesures de dispersion la distribution des résultats 1. Mesures de tendance centrale Le mode : valeur la plus fréquente d’un ensemble de données Rarement utilisé seul pour mesurer la tendance centrale Intéressant pour les variables nominales La médiane : valeur située au milieu d’un ensemble de données 50% en dessous, 50% au dessus Utile pour les variables qui présentent des valeurs extrêmes La moyenne : addition des valeurs observées divisées par le nombre de sujets observés Mesure la plus courante Influencée par les valeurs extrêmes 2. Mesures de dispersion Les mesures de dispersion sont des indices qui caractérisent l'étalement des valeurs d'une distribution d'une variable autour d'une valeur centrale. Les mesures de tendance centrale ne peuvent pas décrire pleinement une distribution de scores. Les indices de dispersion permettent de savoir si les scores individuels se rapprochent ou s’éloignent beaucoup des mesures de tendance centrale. 2. Mesures de dispersion L’étendue : indique entre quelles valeurs les résultats varient La variance : mesure la dispersion de chaque observation autour de la moyenne Idée de la dispersion globale des données autour de la moyenne L’écart-type : racine carrée de la variance Le plus utilisé dans le cas de la description de variables continues Même unité que les données d’origine 3. Mesures de distribution Décrire la forme générale de la distribution d’une série de données Fournissent des informations sur l’asymétrie et l’applatissement (Kurtose) de la distribution des valeurs Permettent de voir si les données suivent une distribution normale Normale Normale Moyenne Médiane Moyenne et Mode Médiane et Mode Asymétrique négative Symétrie des distributions Leptokurtique Kurtose des distributions Mode Médiane Moyenne Moyenne Médiane et Mode Asymétrique positive Platikurtique Mode Moyenne Médiane Médiane et Mode Moyenne Variable dépendanc e dichotomiq ue Régressi on logistiqu e Statistiques bivariées En quantitatif, ce qu’on veut c’est déceler la présence d’une relation statistiquement significative quantifiable entre les variables de même que la force de cette relation Pour ce faire, on doit procéder par étapes pour analyser les résultats Peu importe les analyses, on veut toujours répondre aux mêmes questions : La signification La force de la relation Le sens de la corrélation La signification La signification (seuil de tolérance) est souvent représentée par la lettre « p » ou par « sig » Que veut dire « p » (p value) ? C’est le seuil minimal pour affirmer qu’il existe une relation statistiquement significative entre 2 variables C’est la probabilité de se tromper en affirmant qu’il existe un lien entre nos deux variables = marge d’erreur Lorsqu’une relation est significative, nous rejetons Ho (hypothèse nulle) et nous pouvons conclure qu’une y a bien une différence entre nos deux variables Rappel : Ho = il n’y a pas de relation entre les 2 variables Lorsqu’une relation n’est pas significative, on ne peut pas rejeter l’hypothèse nulle La signification La valeur de « p » Dépend des domaines de recherche En crimino, on cherche à avoir un p ≤ 0,05 Par convention, les niveaux de signification sont identifiés comme suit dans les tableaux : * =p ≤ 0,05 **=p ≤ 0,01 ***=p ≤ 0,001 Que signifient ces valeurs ? P ≤ 0,05 : nous avons moins de 5 chances sur 100 de nous tromper en affirmant qu’il existe une relation significative P ≤ 0,01 : nous avons moins de 1 chance sur 100 P ≤ 0,001 : nous avons moins de 1 chance sur 1000 La signification La signification (seuil de tolérance) nous indique si nos variables sont associées ou non, ça n’a pas de rapport avec la force du lien. La seule question à laquelle on répondre c’est : « est-ce que mon association est significative ou non? » On ne peut pas dire que quelque chose est très significatif, moyennement significatif, c’est juste « significatif » ou ça ne l’est pas. La signification est associée au nombre de sujets : c’est sensible à la taille de l’échantillon, plus l’échantillon est grand, plus la signification va être forte, ça n’a donc rien à voir avec la force de la relation. La notion de causalité Lorsqu’on veut parler d’une relation causale, il y a plusieurs critères à remplir : 1. Les deux phénomènes sont théoriquement distincts 2. Temporalité : X précède Y 3. La présence d’une relation mesurable et statistiquement significative entre X et Y 4. Aucune tierce variable n’est responsable de la relation 5. On peut proposer une explication à la relation (théorie) 6. La relation apparait chez plusieurs échantillons représentatifs et à l’aide de différents types d’analyses statiques La force de la relation Le coefficient de force (ou d’association) qualifie la relation et établit si la différence est attribuable à la taille de l’échantillon ou non La force de la relation nous aide à répondre à la question suivante : est-ce que l’impact de X sur Y est fort, modéré ou faible ? Situé entre 0 et 1 Un coefficient de force de plus de 0,80 indique la colinéarité : les deux variables mesurent le même phénomène et non deux phénomènes distincts. Le sens de la relation Transposer en mots concrets la relation entre deux variables Tableaux de contingence (croisés) et tests de moyennes (au moins une variable catégorielle) Quel groupe à la fréquence ou la proportion la plus élevée ? On compare les groupes sur la variable dépendante Corrélation (deux variables continues) Positive : lorsque X augmente, Y augmente Négative : lorsque X augmente, Y diminue Force et relation : visuellement Force de la relation Sens de la relation Variable dépendanc e dichotomiq ue Régressi on logistiqu e Statistiques multivariées La régression linéaire multiple Méthode qui permet d’examiner la relation entre une variable indépendante (X) et une variable dépendante continue (Y) On veut répondre à la question : comment Y change-t-il lorsque X change ? Permet de prédire la valeur de la variable dépendante en fonction de la variable indépendante et d’évaluer la force de la relation entre les deux éléments Différence entre corrélation et régression Dans le cas de la corrélation, on cherche à savoir s’il existe un lien entre deux éléments ainsi que la force de ce lien Elle nous dit si les deux variables évoluent ensemble, mais pas si l’une cause l’autre, car la corrélation ne tient pas compte de la direction ou du temps. Avec la régression, on va plus loin. On cherche à voir si une variable (X) influence ou prédit une autre variable (Y). La régression regarde aussi si X mène à Y dans une certaine direction (ex. : est-ce que la consommation d’alcool peut entraîner une augmentation du crime ?). Elle nous permet donc de comprendre non seulement la force du lien, mais aussi si un effet de corrélation est possible. Présenter les résultats quantitatifs On utilise des tableaux pour la présentation des résultats. Les graphiques sont à éviter, car ils prennent beaucoup d’espace. À moins que le type d’analyse le requière. Par exemple, analyses de réseau, analyses d’équations structurales, analyses de correspondances multiples. De plus, c’est pratique dans une présentation PowerPoint ou dans un rapport pour des non-initiés à la statistique… Le tableau vise à synthétiser un maximum d’information dans un espace restreint. Présenter les résultats quantitatifs On introduit le tableau Tableau On discute du tableau On décrit très sommairement ce qui se trouve dans la tableau, résultats à l’appui (affirmation démonstration) Titre du tableau : doit être le plus explicite possible et on doit comprendre ce qu’il contient sans avoir à lire le texte Introduction aux méthodes qualitatives On s’éloigne des statistiques… Qu’est-ce que la méthode qualitative ? Ensemble de techniques d’investigation permettant de regarder la réalité sociale Approche qui décrit et analyse un phénomène à partir du point de vue de ceux qui sont étudiés Part du principe qu’un phénomène social ne peut se comprendre qu’à partir de celui qui le vit On cherche le sens que les individus qui le vivent donnes à ce phénomène Permet de saisir de l’intérieur les problématiques et les enjeux sociaux Les objectifs du qualitatif La méthodologie qualitative permet de : Étudier un objet spécifique Donner la parole Comprendre Explorer Aller au-delà Produire un savoir Les caractéristiques Met en valeur la subjectivité Méthode qui étudie les choses dans leur contexte naturel : interprète les phénomènes sociaux selon le sens que les acteurs leurs donnent Documents émanent des acteurs du phénomène: entrevue, observation, implications de terrain La connaissance s’acquiert par la pratique Interaction directe du chercheur avec son objet d’étude Place centrale donnée aux acteurs sociaux La réalité sociale n’existe pas, il existe autant de vérités et de réalités que d’individus Démarche compréhensive Approche inductive Qualitatif vs quantitatif Qualitatif Quantitatif Comprendre Expliquer Point de vue des acteurs Cadre déterminé par le chercheur Processus inductif Processus déductif Questions ouvertes Questions fermées Question qui évolue au fil de la Question de recherche fixée au début collecte de la collecte La suite du cours 21 novembre : méthodes qualitatives Étienne Garant 28 novembre : méthodes mixtes et [email protected] éthique de la recherche Lisa Bacheré (auxiliaire) 5 décembre : questions en vue du [email protected] travail et de l’examen