PSY 3707 - Psychometrics Exam, 2025, PDF

Examen Final Examen Final Date : 22 avril 2025 à 14h00 (en personne au local MHN 033) Durée : 3 heures Résumé de l’information : ➔ L’examen est cumulatif et porte sur toute la matière couverte depuis le début de la session. ➔ L’examen comporte 75 questions à choix multiples. ➔ Une correction sur un total de 75 points (soit 1 point par question). ➔ L’examen compte pour 50% de la note finale pour le cours. ➔ Vous avez le droit d’une calculatrice simple (non programmée). ➔ Les formules ne seront pas fournies; elles se limitent à celle couverte en classe. Répartition des questions par chapitre : Chapitre 1 Chapitre 1 - Introduction à la Psychométrie : Histoire, Définitions et Éthique La psychométrie s’intéresse à l'élaboration et l’utilisation d’instruments de mesure dans divers contextes dans le but d'évaluer ou de mesurer des dispositions et des états psychologiques chez les individus. La psychométrie inclus : ➔ La conception de l’instrument ➔ La validation de l’instrument ➔ L’administration de l’instrument ➔ L’interprétation des résultats Habituellement, les traits de personnalité sont stables. Par exemple, une personne extravertie ne sera pas introvertie le lendemain. Aussi, la personnalité d’une personne (résultat) devrait nous aider à prédire la réaction de celle-ci dans une situation donnée (comportement). **La prédiction est moins importante au niveau théorique que pratique. Psychomotricien vs. Psychométriste Psychométricien : Implication dans l’étude (aspect scientifique), la conception et la validation des tests. ➔ Requiert une maîtrise ou un doctorat dans un domaine suivant : science de la mesure (éducation), psychologie quantitative ou statistique. Psychométriste : Implication dans l’administration et notation des tests psychologiques sous la supervision d’un psychologue agréé dans divers domaines (ex. scolaire, clinique, etc). ➔ Requiert un diplôme de premier cycle en psychologie. Mesurer vs. Évaluer Mesurer : Opération qui consiste à associer des nombres à des objets, événements ou personnes selon des règles bien définies. Par exemple, des mesures physiques (mesurable : poids, hauteur et âge) et des mesures psychologiques (non-mesurable : QI et personnalité). Évaluer : Processus dans lequel plusieurs informations sont prises en compte dans le but de bien comprendre le fonctionnement d’une personne par rapport à un ou plusieurs traits. Par exemple, à l’admission d’études supérieures, on regarde un profil plus global (moyenne de plusieurs notes) au lieu d'une approche spécifique (une note) pour choisir quel candidat est le meilleur. **L’évaluation à toujours une marge d’erreur. Par contre, elle offre une perspective plus générale. Test Psychologique Test psychologique : Mesure objective et standardisée d’un échantillon de comportements. Un test psychologique possède plusieurs caractéristiques. 1. Objectivité - La façon dont les scores sont obtenus et interprétés; non fondée sur le jugement de l’examinateur. On tente d’éviter les biais et la subjectivité de la mesure. 2. Standardisation - L’uniformité de la procédure (directives, instructions, temps alloué, correction, etc) de la mesure. On cherche à ce que l'examen soit la seule variable indépendante. 3. Échantillon de comportements (ou d’items) - Utiliser pour représenter des manifestations d’un trait puisque dans un test psychométrique elle est toujours indirecte (ex. intelligence, personnalité, dépression, etc). La représentativité de l’échantillon de comportements va déterminer en partie la qualité de la mesure. 4. Normes ou critères - Utiliser pour faire des comparaisons d’un résultat par rapport à un critère fixe. 5. Prédiction - L’objectif de prédire des comportements autres que ceux mesurés par le test. Catégorisation des Tests Tests de groupe : Tests de type papier-crayon ou à l’ordinateur qui peuvent être administrés à de larges groupes simultanément. Tests individuels : Tests utilisant des instruments qui doivent être administrés de façon individuelle. Un avantage important de ce type de test est la possibilité d’évaluer le niveau de motivation de l’individu et l’importance d’autres facteurs (ex. l’anxiété) sur les résultats du test. On peut sous-catégorisées les tests cette typologie : ➔ Tests d’aptitudes intellectuelles ➔ Tests de rendement ou de performance ➔ Tests de personnalité ➔ Mesures d'intérêts et des attitudes ➔ Tests neuropsychologiques Utilisation des Tests La plupart du temps, les tests psychologiques sont utilisés pour prendre des décisions relatives à une personne. Cependant, il ne s’agit pas de leur seule fonction; ils peuvent être utilisés pour…la classification, le diagnostic et la planification du traitement, l’auto-connaissance, l'évaluation de programme et la recherche. Importance de Contrôler l’Utilisation des Tests Les tests psychologiques ne sont efficaces que s’ils sont utilisés correctement. Les décisions prises suite à l’obtention des résultats peuvent avoir des conséquences importantes sur la personne. Ainsi, les procédures d’administration du test sont primordiales. Ils doivent être administrés uniquement par les examinateurs qualifiés. Des mesures doivent être prises pour assurer la sécurité du contenu des tests. Facteurs Affectant la Justesse des Test 1. L’administration standardisée du test Une préparation adéquate des examinateur Des procédures d’administration standardisées 2. Des conditions de testing optimales Contrôle de l’environnement de testing Des mesures d'accommodations adéquates ○ Prises en considération pour aider un individu avec des difficultés sans lui donner un avantage. 3. Les variables liées à l’administrateur Certaines variables incluent les attentes, le comportement non-verbal, etc. 4. Les variables liées à l’examiné La variable la plus commune est l’anxiété. Une autre variable est la désirabilité sociale (tromper le test pour être socialement accepté). Origines de l’Évaluation Certains moment historiques en psychométrie : ➔ 387 av. J.-C. Platon fonde l’Académie à Athènes avec l’utilisation des évaluations pour atteindre un « idéal ». ➔ 165 av. J.-C. La Chine utilise l’évaluation dans le secteur du service public afin de mesurer les compétences des fonctionnaires. ➔ 1636 La première évaluation psychométrique en Angleterre. ➔ 1732 Wolff propose de créer une branche mathématique à la psychologie, soit la psychométrique. ➔ 1834 Weber examine la détection de différences entre les stimuli. Évaluation à la Psychométrie Galton (1822-1911), un père de la psychométrie - Début du mouvement du testing Il défend la théorie de Darwin selon laquelle l’importance des différences individuelles est liée principalement à l’hérédité. Galton introduit la méthode expérimentale basée sur la comparaison des jumeaux. Méthodologiste : L’introduction du concept de corrélation, s’intéresse aux méthodes statistiques. Eugéniste : Bien naître de l’espèce portera fruit à une bonne hérédité. Wundt (1879) - Premier laboratoire de psychologie expérimentale Il ne s’intéresse pas vraiment aux différences individuelles. Wundt recherche de lois générales; nécessité de bien contrôler la cueillette de données (conditions expérimentales qui influencent la standardisation des tests). **Les travaux de Galton et Wundt auront une influence sur plusieurs, dont Cattel, Spearman et Pearson** Binet et Simon (1905) - Psychométrie de nos jours Ils rejettent la craniométrie (relations entre forme du crâne et rendement). C’est le début de l’étude différentielle des processus mentaux supérieurs. Binet introduit le premier test d’intelligence en collaboration avec Simon. Ils introduisent la notion de l’âge mental. Binet et Simon s’intéressent à la psychopédagogie pour aider les enfants ayant des problèmes cognitifs. Psychologie Différentielle La psychologie différentielle s’intéresse principalement aux différences entre les individus. La psychologie différentielle : ➔ Développe des outils permettant de constater, décrire et comprendre les différences psychologiques entre les individus et les groupes (ex. théories de l’intelligence, de la personnalité, etc). ➔ Étudie la validité des critères de classification psychologique. ➔ Propose de nouveaux critères (nouveaux tests) basés sur des théories psychologiques. ➔ Met en relation les systèmes de classification psychologiques et autres systèmes de classification (culturel, social, etc). Elle propose une méthodologie systématique référant à la théorie de la mesure, aux méthodes psychométriques, aux théories de l’échantillonnage, aux outils statistiques. La psychologie différentielle examine trois types de variabilité que l’on peut observer quand on mesure différents traits psychologiques : Variabilité inter-individuelle (entre les examinés pour un même test) Variabilité inter-groupes (divers groupes d’examinés à un même test) Variabilité intra-individuelle (répétition du même test à un examiné) Les origines et fondements de la psychologie différentielle : ➔ Réponse à une demande sociale (classification, sélection, détection des enfants problèmes). ➔ S’appuie sur les théories de l’évolution (Darwin) mettant en évidence les différences (hérédité). ➔ Démarche et méthode scientifique ➔ Grand intérêt pour la psychopédagogie et l’identification des enfants présentant des problèmes (Binet). ➔ Démarche appliquée à la prédiction des comportements et des résultats. La psychométrie des tests n’est pas intéressante pour le psychomotricien qui le développe, mais plutôt pour ceux qui utilisent les outils développés pour prédire des comportements. Quelques Définitions Le système d’échelle de mesure N.O.I.R Données nominales - Catégorisation Données ordinales - Rangs (plus petit ou plus grand) Données à intervalles égaux - Unité de mesure, mais 0 arbitraire (ex. température, score d’examen, etc) Données par ratio ou proportionnelles - Unité de mesure, 0 absolu (ex. hauteur, poids, etc) Fidélité : C’est la reproductibilité des résultats. Validité : C’est ce qui est mesuré. **La fidélité et la validité ne sont jamais à 100%. UN TEST FIDÈLE NE GARANTIT PAS SA VALIDITÉ, MAIS UN TEST PEUT PAS ÊTRE VALIDE SANS ÊTRE FIDÈLE. La notion de normes dicte le résultat moyen dans un groupe donné, c’est la performance typique. Autres notions statistiques incluent la corrélation, la régression, etc. Éthique Éthique : C’est les principes et les normes qui guident la conduite d’une personne. L’éthique est subjective (dictée par les différentes professions). Chacun va créer des codes d'éthique pour élaborer une norme selon laquelle les individus de cette profession devraient se comporter. Une infraction peut être liée à une suspension. Lois : C’est les principes qui dictent ce qu’une personne peut et ne peut pas faire. Une infraction peut être liée à de l’emprisonnement. Les six principes généraux du code d’éthique APA sont : Compétence : Maintient un haut niveau de compétence dans le domaine (pas utiliser un test qu’on est pas familier). Intégrité : Maintenir l'intégrité de tous les aspects reliés à son rôle professionnel. Responsabilité : Reconnaître quand utiliser ou ne pas utiliser un test Respect des droits et dignité de la personne : Diffusion des résultats L’information (résultat) obtenue lors des tests doit rester confidentiel et être partagée (au complet) de manière compréhensible pour le participant seulement. Bien-être d’autrui : Il est nécessaire d’obtenir un consentement clair et précis de la part du participant avant le début du test. Implicite : En postulant pour être policier, l’individu consent à tous les tests lors du processus. Explicite : Un participant qui participe à une recherche volontaire. Responsabilité sociale : Ne pas partager le contenu du testing (peut être tenu responsable pour du plagiat). Dix Standards Reliés à la Mesure 1. L’utilisation de tests doit se faire dans un contexte d’une relation bien définie psychologue-client 2. Les psychologues utilisent les tests de façon appropriée 3. Les tests doivent être développés en faisant appel à des procédures scientifiques reconnues 4. Quand les tests sont utilisés, les psychologues doivent en connaître les limites 5. Les résultats doivent être interprétés en considérant les limites des tests utilisés 6. Une personne non qualifiée ne peut pas utiliser de tests psychométriques 7. Les tests obsolètes ne doivent pas être utilisés 8. Le but et les qualités psychométriques d’un test doivent être décrits adéquatement 9. Les résultats à un test doivent être accompagnés d’explications appropriées 10. L’intégrité et la protection d’un test doivent être respectées Tests Psychométriques et Société Certaines préoccupations sociales concernant le testing : ➔ L’impact de l’évaluation des « capacités » sur la société ➔ Les questions reliées à la protection de la vie privée. ➔ L’utilisation équitable des tests. Les types de décisions prises à l’aide des tests : Décisions individuelles vs. institutionnelles ➔ Individuelle : Les résultats sont utilisés pour donner des conseils à l’examiné. ➔ Institutionnelle : Les résultats sont utilisés par des institutions pour diverses décisions (ex. admission à l’école). Décisions par biais de comparaison vs. décision absolues ➔ Biais de comparaison : Une décision effectuée entre 2+ personnes sur la base des résultats à un test. ➔ Absolue : Une décision prise par une seule personne en fonction des résultats à un test; repose sur l’analyse de l'information (besoins d’un critère). Chapitre 2 Chapitre 2 - Les Notions Statistiques de Base et les Normes Élaboration d’un Test Une étape importante de l’élaboration de tests psychologiques est la collecte de données (organiser pour leur donner un sens). Des concepts statistiques essentiels pour l’organisation des données inclus… a) Description de la distribution des données (distribution de fréquences) b) Mesures de tendance centrale (moyenne, médiane et mode) c) Mesures de dispersion - variabilité (étendue, écart-type, variance et intervalle interquartile) On peut aussi utiliser la courbe normale ou autres mesures de relation (corrélation, régression linéaire, etc). Une technique pour déterminer la structure sous-jacente de diverses variables est l’analyse factorielle. Elle permet le regroupement de variables les plus corrélées en dimensions/ facteurs de base. Ce regroupement permet d'accroître la prédiction qu’offre le test. Rôle des Statistiques en Psychométrie Les rôles les plus importants que jouent les statistiques en psychométrie sont liés à… La variabilité → La psychométrie repose sur l’étude des différences individuelles. La corrélation → C’est l’étude de la relation entre les variables (ex. le QI et les résultats scolaires). **La statistique est essentielle pour estimer la validité et la fidélité des tests. La prédiction → C’est l’utilisation plus pratique de la corrélation et le but ultime de tout test psychométrique. **La prédiction établit une corrélation, mais JAMAIS une cause à effet. Scores Bruts Score Brut : Les résultats plus ou moins immédiats des réponses d’une personne à un test donné. Il est difficile d'interpréter le score brut sans des renseignements supplémentaires; seul, il n’a pas vraiment de sens. Score normalisé : Score brut comparé aux scores de personnes faisant partie du groupe de référence. Il existe différents types de transformation des scores bruts : 1. Transformation des scores bruts en pourcentage ➔ Ne modifie pas le score bruts; exprimé en une unité différente (plus facilement interprétable) ➔ Tient compte d'informations non comprises dans le score brut même 2. Transformation des scores bruts en scores standardisés - linéaire ➔ Seules les unités de mesure sont différentes (pas la forme de la distribution) ➔ La transformation peut se faire pour la variabilité des scores (scores Z ou scores T) ou leur rang (rang percentile). ◆ Score Z : Z = X - M **Utilisé pour interpréter d’autres résultats standardisés. ÉT ◆ Score T : T = (Z * 10) + 50 **Score positif = par dessus la moyenne ; score négatif = en dessous de la moyenne. ➔ Range percentile (et variantes) : Proportion des membres du groupe de référence se situent sous un score donné. 3. Transformation de scores bruts en scores normalisées ➔ Transformation du score, le point de référence et la forme de la distribution ➔ Uniquement utiliser quand la distribution des scores bruts présente une asymétrie ou une déformation significative. Normes de Développement On peut créer des normes de développement lorsque le trait mesuré se développe systématiquement avec le temps. Les deux types de normes les plus fréquents sont : ➔ Les équivalents d’âge (ex. test d’intelligence — âge mental) ➔ Les équivalents de niveau scolaire On interprète le score en fonction de l’âge chronologique dans le premier cas et en fonction du niveau scolaire dans le second. Il existe aussi des tests fondés sur des théories du développement, par exemple, la théorie de Piaget (développement cognitif) et la théorie de Kohlberg (développement moral). Dans ces cas, les stades et les âges associés constituent les normes. Rapports Normatifs L’objectif principal des normes est de fournir un contexte permettant d’interpréter un score. Par exemple, si quelqu’un score 500 mots par minutes, ceci veut rien dire à moins que le résultat soit comparer à une norme. L’interprétation du score doit être faite par la personne qui administre le test (psychologue et dans le futur l’IA). Dans la majorité des cas, l’information obtenue est de nature quantitative. Il a toutefois une tendance récente à présenter les scores des tests de façon narrative/descriptive (même si parfois les scores sont aussi présentés dans le rapport). Effet Barnum C’est une tendance que les gens ont à accepter des descriptions vagues qui sont probablement vraies pour tous, mais qui ne contiennent aucun renseignement spécifique découlant du test (ambiguë). Les rapports narratifs doivent donner l’information qui caractérise seule la personne et qui découle directement des résultats du test. Interprétation des Résultats Normatifs L’information normative peut facilement être mal interprétée, donc la prudence est nécessaire pour… ➔ l’utilisation de normes sur une population différente; ➔ l'interprétation des statistiques particulières aux données normatives; ➔ ne pas généraliser à d’autres comportements; ◆ On ne peut pas dire que parce qu’une personne est bonne en lecture, elle sera bonne en mathématiques. ➔ les normes deviennent désuète (out-dated) rapidement; ➔ la taille de l’échantillon normatif importe. Ainsi, les normes ne sont pas absolues, on peut donc utiliser… ➔ la comparaisons entre test; ➔ l'échantillon normatif; ➔ les normes étalons (de comparaison - un score peut avoir différente valeur selon l’institution qui l'interprète); ➔ les groupes de référence stable Groupe de Référence L’interprétation des scores du test est grandement influencée par le groupe de référence utilisé dans l’établissement des normes. Les types de groupes de références (on peut avoir 1 ou plusieurs groupes pour un même test) : Les normes nationales → Les normes d’un organisme national qui est mise à la disposition du public (ex. admission à l’université et l’échelle de Weschler). Les normes internationales → Les normes des pays (habituellement développés) à travers le monde. Les groupes de commodité *Plus fréquente → C’est une tentative échoue d'un échantillon national; non représentatif du groupe visé puisqu’on prend ce qui est disponible même s’il exclut certaines personnes. Les normes d’utilisateurs → Les normes de l’année précédente deviennent celles pour l'année suivante (ex. les SATs). Les normes de sous-groupe → Les normes des sous-groupes démographique (ex. langue, sexe, profession, etc). ○ Un gros problème c’est qu’on obtient de trop petits échantillons que les normes n'ont pas de valeur. Les normes locales → Les normes adoptées par une compagnie afin de créer un environnement cohérent (ex. processus d'embauchement ou l’admission universitaire). Les normes institutionnelles →Les normes adoptées au milieu des institutions académiques (ex. scolaire). ○ L’utilisation de tableau de comparaison, au besoin, pour créer des normes étalons. Plan d’Étalonnage Le plan d’étalonnage assure la stabilité et la représentativité. Par exemple, une suffisance de participant et la description du test administrer assure la représentativité. **La représentativité est plus difficile à obtenir lors d’un test. Interprétation Critériée vs. Normative Dimension Tests Critériés Test Normatifs Objectif Comparer la performance des examinés à Comparer la performance des examinés un standard entre eux Contenu des items Domaine d'habiletés restreint avec un Domaine d'habiletés vaste avec accent sur sa pertinence en contexte réel pertinence indirecte Sélection des items La plupart des items ont un niveau de Les items varient beaucoup en terme de difficulté similaire difficulté (ex. QI) Interprétation des résultats Scores exprimés sous forme de Scores exprimés sous forme de scores pourcentages, avec une note de passage standardisés prédéterminée Chapitre 3 Chapitre 3 - La Fidélité des Tests Fidélité Fidélité : La précision avec laquelle un test mesure certaines caractéristiques ou l’intérêt envers la constance et la reproductibilité de la mesure, sans égard à l’objet de celle-ci. ➔ Notion de reproductibilité d’un score ➔ Dans quelle mesure les différences individuelles dans les scores à un test peuvent être attribuées à de « réelles » différences. ➔ Dans quelle mesure ces différences individuelles peuvent être attribuées à des « erreurs » (systématiques ou aléatoires). Sources d’Erreur de Mesure 1. Les erreurs de mesure liées au type de correction du test Correction objective ou basée sur le jugement de l’évaluateur. Items à choix multiples présentent moins d’erreurs de mesure que les autres formats d’items. 2. Les erreurs de mesure liées au contenu du test Variation dans l’échantillonnage des items du test. 3. Les erreurs de mesure liées aux conditions d’administration du test Standardisation de la procédure d’administration du test. Sources de distraction (environnement de testing). 4. Les sources d’erreur de mesure liées aux circonstances personnelles Condition physique ou mentale de l’examiné lors du test ○ Temporaires (ex. Fatigue, anxiété, maladie, etc); n’affectent généralement pas la fidélité du test. La chance Autres Sources de Variations Certaines sources de variation sont liées à la cohérence du test (affectent peu la fidélité). ➔ Caractéristiques générales d’une personne qui sont relativement stables ◆ Capacité à comprendre et suivre des instructions ◆ Capacité cognitive générale ◆ Capacité générale à l’égard du testing (ex. « test wise ») ➔ Caractéristiques spécifiques d’une personne qui sont relativement stables ◆ Spécifiques au contenu du test (ex. niveau de connaissance du sujet) ◆ Spécifiques au format d’items (ex. choix multiples) Certaines caractéristiques peuvent avoir un impact (varier) positif (augmenter) ou négatif (diminuer) sur la fidélité d’un test. Pour les psychomotriciens, le plus gros problème c’est de ne pas savoir quelle erreur impact la fidélité. Modèle Général de la Fidélité La théorie classique des tests est le cadre théorique le plus utilisé pour comprendre la notion de fidélité d’un test. La prémisse est que les résultats d’un test sont influencés par deux facteurs : 1. Ceux qui contribuent à la constance d’un score 2. Ceux qui contribuent à l’inconstance d’un score Cette idée se résume par l’équation suivante : Score observé = Score réel + Erreur de mesure **Dans un test idéal, on voudrait que le score observé = score réel, par contre il y a toujours de l’erreur qu’on doit calculer. Méthodes d’Estimation de la Fidélité a) Fidélité test-retest Ré-administration du même test aux mêmes participants en deux temps (stabilité) Coefficient de stabilité temporelle (CST) Un problème marquant est l’apprentissage de la bonne réponse par les individus. b) Fidélité par version parallèles ou alternatives Deux versions différentes d’un test administrées aux mêmes participants en deux temps (équivalence). c) Fidélité inter-juges Évalue les variations aléatoires attribuables aux personnes qui corrigent le test. Coefficient de corrélation intraclasse (CCI) d) Fidélité basée sur la cohérence interne (homogénéité) Méthode de la bissection (split-half) Séparer une version du test en deux parties équivalentes (pour établir la corrélation entre les deux parties) Administrer les items en une même session Approche la plus commune → fidélité pair-impair Méthode des formules de Kuder-Richardson (KR20 ou KR21) Utilisée uniquement pour les items dichotomiques Tient compte du nombre d’items contenus dans le test Tient compte du pourcentage de réponses correctes et incorrectes Tient compte de l'écart-type Méthode qui permet d’obtenir la corrélation moyenne pour toutes les bissections possibles dans un test, soit pour tous les items. Méthode de l'alpha de Cronbach Utilisée pour tous les items d’une échelle de données continues Administration en une seule session et calcul de la cohérence entre les items Tient compte du nombre d’items dans le test (k) et de l’intercorrélation moyenne entre tous les items du test (rjj) **Plus nous avons d’items, meilleure est l’intercorrélation. Très influencée par le nombre total d’items du test Indication que le test mesure le ou les mêmes construits ou traits Formule : a= k (rjj) a 1 + (k - 1) rjj L’erreur-type de Mesure (ETM) Formule : ETM = ÉT (√1-rxx) Tient compte de l’écart-type du test (ÉT) rxx est la fidélité du test L’ETM est l’écart-type d’un nombre théorique infini de scores obtenus avoisinant le score vrai d’une personne. Si la fidélité est parfait, soit égale à 1, l’ETM sera égale à 0 Si la fidélité est nulle, soit égale à 0, l’ETM sera égale à l’écart-type du test L’ETM permet d’établir un intervalle de confiance autour du score observé. Plus l'erreur-type est faible, meilleur est le test (contenait plus de scores précis). Interprétation des Coefficients de Fidélité Facteurs influant sur les coefficient de fidélité : ➔ La présomption de linéarité ➔ L’hétéroscédasticité (dispersion = autour des scores réels) ➔ L’hétérogénéité du groupe En théorie, la valeur que devrait prendre le coefficient de fidélité afin de considérer qu’un test est fidèle dépend de l’intention que l’on a pour l’utilisation du test. En pratique, le taux de fidélité ne devrait pas être inférieur à 0,90. En recherche, le taux de fidélité ne devrait pas être inférieur à 0,70. Chapitre 4 Chapitre 4 - La Validité des Tests La considération de la validité d’un test psychologique se base sur deux questions (+ deux grandes catégories de validité) : 1. Est-ce que le test mesure ce qu’il prétend mesurer ? Validité de la mesure ○ Validité de contenu ○ Validité de construit 2. Est-ce que le test peut être utilisé pour prendre de bonnes décisions (prédiction) ? Validité décisionnelle (ou critériée) ○ Validité prédictive ○ Validité concurrente (ou concomitante) Définition générale : La validité d’un test est la capacité d’un instrument à mesurer réellement ce qu’il doit mesurer, selon l’utilisation que l’on veut en faire. La validité apparente (une parenthèse) Habituellement, la validité est généralement de démonstration empirique, par contre, la validité apparente est non empirique; elle fait référence au fait qu’un test semble mesurer le construit souhaité. La validité apparente ne doit jamais se substituer à une validité empirique, mais elle peut parfois être importante de recherche celle-ci. Par exemple, la perception des examinés. Même si on croit important de regarder la validité apparente, on ne peut pas uniquement regarder celle-ci. La validité de la mesure La principale difficulté dans la détermination de la validité de la mesure : ➔ Pour la majorité des caractéristiques dont les psychologues souhaitent mesurer (ex. intelligence, introversion, habiletés verbales, etc.), il n’existe pas de standards universels pour fins de comparaison. Étant donné qu’il n’existe pas de standard pour valider les résultats d’un test, les concepteurs de tests doivent avoir recours à des méthodes indirectes pour déterminer la validité des tests. Il est impossible de prouver (sans doute) qu’un test mesure bien ce qu’il prétend mesurer - toujours partiellement subjectif. On ne peut que accumuler des preuves suggérant qu’un test mesure réellement ce qu’il prétend mesurer : La validité de contenu est déterminée en examinant le test même. La validité de construit est déterminée en examinant les relations entre les résultats du test et d’autres mesures. Stratégies de validation orientées sur le contenu (validité de contenu) a) L’examination du contenu du test Si on peut démontrer que les échantillons de comportement (items) composant le test est représentatif de l’attribut mesuré - On peut établir la validité. On doit tenir compte autant du test en soi, que du processus requis pour répondre au test (comment le test est-il administré ?). Bref, si le test semble mesurer ce qu’il prétend mesurer, après avoir examiné les items qui le composent, nous avons une première preuve (faible) de la validité de contenu. b) L’examination du « domaine de contenu » Il représente l’ensemble de tous les comportements que l’on peut utiliser pour mesurer un attribut spécifique ou une caractéristique des examinés. Ses deux propriétés principales : ➔ Le contenu du test doit respecter ces limites. ➔ Le contenu du test doit être structuré - classification des items en catégories. Il n’est pas toujours possible de décrire le domaine du contenu de façon détaillé, donc plus il est difficile, plus il est difficile d’obtenir des preuves de validité de contenu de cette façon. Si on peut bien définir un domaine de contenu, nous n’avons qu’à comparer la structure du test à celui-ci (approche systématique). Voici un exemple concret du domaine de contenu : 1. Domaine à mesurer : La connaissance sur l’histoire mondiale pour des étudiants d’une classe de 7e années. 2. Catégorie de connaissances couvertes en classe (questions, régions et périodes). 3. Importance relative de chacune des catégories couvertes en classe. Sociales Politiques Culturelles Europe 18e siècle 5% 10% 3% 19e siècle 5% 8% 2% Amérique 18e siècle 6% 17% 2% 19e siècle 9% 13% 5% Afrique/Asie 18e siècle 2% 0% 0% 19e siècle 6% 5% 2% Total : 100% c) La validité apparente Stratégies de validation orientées sur le construit (validité de construit) Un construit est une idée (non directement observable) construite par des chercheurs dans le but de synthétiser ou résumer un groupe de phénomènes ou d'objets associés. Il est utile pour comprendre, décrire et prédire le comportement. Les deux propriétés essentielles d’un construit : ➔ Résumé abstrait d’une certaine régularité ➔ Reliés à des entités ou évènement concrets et observables Afin de déterminer si un test est une bonne mesure d’un construit donné, on doit traduire le construit abstrait en comportements concrets. Bref, un test psychologique n’est qu’un échantillon de comportements. La notion d’explication du construit est centrale pour déterminer la validité de construction d’un test. C’est le processus visant à fournir une description détaillée de la relation entre des comportements spécifiques et des construits abstraits. Les trois étapes du processus : 1. Identifier les comportements (items) liés au construit à mesurer. 2. Identifier d’autres construits et décider… s’ils sont liés (validité convergente) au construit à mesurer. s’ils ne sont pas liés (validité divergente) au construit à mesurer. 3. Identifier des comportements qui sont associés à chacun de ces construits additionnels et sur le base des relations entre les construits, déterminer si chaque comportement est associé au construit à mesurer (approche corrélationnelle). La validité de construit englobe plusieurs méthodes pour établir la validité d’un test et certaines peuvent être aussi pertinentes pour établir la validité décisionnelle (ex. validité convergente). Autres méthodes pour évaluer la validité de construit inclus : ➔ Cohérence interne (preuve faible, mais un préalable). ➔ Analyse factorielle (établit les dimensions communes sous-jacentes aux résultats de plusieurs mesures différentes). ➔ Étude des processus de réponse (façon dont les participants répondent à un test). La validité décisionnelle La validité des tests dans le but d’aider la prise de décision est un sujet d’importance pratique, car la justesse des décisions prises est directement liée à la validité des résultats du test. La façon la plus simple de déterminer si un test peut être utilisé de façon valide pour prendre des décisions consiste à corréler les résultats obtenus au test avec des mesures du succès ou des conséquences des décisions prises. Ces mesures sont des « critères », d’où le terme courant de validité associée à un critère (critère) pour parler de la validité décisionnelle. Les stratégies de détermination de validité décisionnelle ont comme objectif d’établir la corrélation entre les résultats du test et les résultats (scores) du critère retenu. Stratégies de validation orientées sur la prédiction (validité prédictive) Son but est de déterminer la corrélation entre les résultats du test, qui sont obtenus AVANT la prise de décision et les résultats sur le critère, qui sont obtenus APRÈS la prise de décision. Elle est considérée la meilleure stratégie d’un point de vue empirique (mesure directe de la relation), mais le problème c’est qu’elle n’est pas très réaliste. ➔ Critère externe réaliste, celui sur lequel on cherche à obtenir de l’information. **On peut pas seulement obtenir l’information directement sur la critère externe au lieu d’utiliser un test : temps et la difficulté à obtenir de l’info sur le critère. ➔ Considérations pratiques et éthiques Stratégies de validation orientées sur les résultats (validité concurrente) Elle est considérée comme l’alternative pratique à la validité prédictive. Elle consiste à obtenir les résultats de test et les résultats sur le critère en même temps (ou à peu près) à partir d’une population présélectionnée, puis établit la corrélation entre les deux. Les avantages de la validité concurrente vs. la validité prédictive : ➔ Plus pratique; ➔ Plus facile à effectuer; ➔ Coefficients de validité assez similaires à ceux obtenus par la validité prédictive. Interprétation des coefficients de validité décisionnelle Comme il s’agit d’une corrélation entre les résultats du test et du critère, on peut prendre les valeurs de -1 à 1. En pratique, la plupart des coefficients de corrélations obtenus sont relativement petits (rarement plus grands que 0.50 en valeur absolue), et près de cette valeur seulement quand le critère est très bien défini. **On veut des valeurs positives** En général, une corrélation de 0.30 est le maximum que l’on obtient. On présente presque toujours le coefficient en variance expliquée, soit r2. Par exemple, une corrélation de 0.30 permettrait d’expliquer 0.09 ou 9% de la variance du critère. Bref, 9% de la variance d’un critère est prédit par le test et 91% est expliqué par d’autres facteurs. Chapitre 5 Chapitre 5 - Le Processus de Développement de Tests Les grand étapes d’élaboration d’un test 1. Définition de l’objectif du test 2. Questions de conception préliminaires Par exemple : Quel sera le mode d’administration du test ? Quelle sera la longueur du test ? Quel sera le format des items ? Quel sera le nombre de résultats (scores) produits par le test ? 3. Préparation/élaboration des items Les 4 composantes d’un item : Le stimulus ou la prémisse de l’item (la question posée) Le format de réponse Les conditions qui gouvernent la réponse La procédure de cotation/notation 4. Analyse d’items 5. Étalonnage, calibrage ou établissement d’un critère (selon le test) 6. Publication (manuel/rapport technique) Les types d’items Les items sont généralement classés selon le format de la réponse. La majorité des items peuvent être classés comme étant des items à choix de réponses ou des items à développement. Le choix du type d’items à élaborer dépend… ➔ de la préférence du concepteur ➔ des objectifs du test ➔ des contraintes associés à la correction ➔ de considérations pratiques (ex. durée de l’administration) Les items à choix de réponses Ce type d’items donnent, au participant, le choix de 2 réponses ou plus (ex. choix multiple et vrai/faux). C’est le format le plus populaire pour les tests d’aptitudes intellectuelles et de rendement administrés à des groupes, mais d’autres types l’utilisent aussi, comme les inventaires de personnalité ou d'intérêt. L’échelle de type Likert ou autre façon similaire appartiennent aussi à cette catégorie. Les items à développement Ce type d’items permet au participant de formuler sa propre réponse (soit fournie à l’oral ou l’écrit). C’est le format le plus populaire pour les tests d’aptitudes intellectuelles individuelles et de rendement en milieu scolaire. Il est parfois utilisé par les inventaires de personnalité (ex. association de mots). La cotation des items à développement : Cotation globale Cotation analytique Méthode de qualification par points Les avantages associés au format d’items Les items à choix de réponses Les items à développement ➔ Ils possèdent une meilleure précision pour la cotation, ➔ Ils permettent d’observer le comportement et les donc moins d’erreurs se produisent. processus associés au test plus facilement. ➔ Ils ont une meilleure optimisation temporelle lors de ➔ Ils permettent d’explorer certaines réponses l’administration du test. inhabituelles qui ne peuvent pas être approfondies avec les items à choix de réponses. Les lignes directrices pour la rédaction d’items à choix de réponse Les lignes directrices pour la rédaction d’items à development Chapitre 6 Chapitre 6 - L’analyse d’Items Il est important d’administrer une première version du test à un échantillon afin de recueillir de l’information sur les propriétés psychométriques du test, mais surtout pour procéder à l’analyse des items. Cette étape peut être répétée à plusieurs reprises afin d’obtenir des bonnes propriétés psychométriques dans le but éventuel de le publier. Il est recommandé d’avoir au départ au moins deux fois plus d’items que le nombre final souhaité pour un test. But ultime : Identifier les meilleurs items et déterminer le sort de ceux qui obtiennent des résultats plus mitigés (conserver, modifier ou éliminer les items). Méthodologie Il existe trois pratiques courantes pour mettre à l’essai les items d’un test : 1. Méthode de l’étude indépendante (la plus courante) Étude avec le but d’analyser des items 2. Méthode des ajouts Intégrer les items à ceux d’un test existant 3. Méthode de l’analyse continue Utiliser à plusieurs reprises un test ou groupe d’items en y ajoutant chaque fois de nouveaux items Surtout en milieu scolaire L’analyse d’items D’autres objectifs de l’analyse d’items inclus : ➔ Fournir des indices sur les raisons pour lesquelles un test présente certaines caractéristiques psychométriques : ◆ une faible fidélité ◆ une faible validité ➔ Obtenir un diagnostic général de la performance d’un groupe donnée ◆ comparaison avec résultats de l’échantillon de normalisation final Les principales procédures statistiques utilisées pour l’analyse d’items : ➔ Calcul de l'indice de discrimination (D) ◆ D = S - I ou D = S - I n ns ni ➔ Calcul de l’indice de difficulté (p) ◆ Un simple pourcentage de réussite de l’item (idéal entre 0.25 et 0.75) ◆ p = # de bonnes réponses à l’item # de répondants ➔ Calcul de l’indice de fidélité de l’item (siriT) ◆ Corrélation entre le résultat bon/mauvais pour chaque item et le résultat pour le test de chaque répondant. ◆ Statistique : coefficient de corrélation bisériale (variable dichotomique et variable continue) Valeur entre -1 (mauvaise réponse) et +1 (bonne réponse) ➔ Calcul de l’indice de validité de l’item (siriC) ◆ Corrélation de l’item avec le résultat sur une autre mesure (validité décisionnelle) Les indices de discrimination et de difficulté ne sont qu’une source d’information parmi plusieurs concernant un item donné. Il y a plusieurs facteurs à considérer lors de la prise de décision de conserver, de modifier ou d’éliminer un item, dont l’objectif du test. Il est important de toujours faire une analyse qualitative en parallèle et de ne pas prendre une décision hâtive en se basant uniquement sur ces deux indices. La révision du test L’analyse d’item fournit l’information sur les propriétés psychométriques de chaque item. Sur la base de celle-ci, le concepteur doit déterminer ce qu’il fait avec chaque item et si des items supplémentaires doivent être rédigés. À l’étape de décision de ne pas modifier le test, le concepteur doit être en mesure d’établir les propriétés psychométriques du test (sa fidélité, validité, normes, etc.). Il est aussi recommandé, dans certains contextes, d’obtenir de la rétroaction sur le test auprès des examinés (validité apparente). La publication du test Pourquoi doit-on rédiger un rapport/manuel technique ? ➔ Pour permettre l’évaluation du processus de développement du test ➔ Outil de consultation des propriétés psychométriques du test ➔ Permettre la comparaison des données obtenues lors de l’administration ultérieure du test avec celles obtenues lors de sa conception ◆ Importance de la mise à jour du manuel technique ◆ Nécessité de réviser le test Chapitre 7 Chapitre 7 - Le Rapport Technique et l’Analyse de Données Légales Que doit-on inclure dans un manuel technique ? ➔ Le but (utilité) du test ➔ Les directives détaillées pour l’administration du test ➔ Les directives détaillées pour la correction du test et l’interprétation des résultats ➔ La description détaillée des étapes de développement du test (étude pilote, modification d’items, etc.) ➔ Toutes les informations psychométriques du test (fidélité, validité, normes, etc.) L’analyse de données légales Elle est effectuée après l’administration d’un test lorsque la tricherie risque de compromettre la validité des résultats. Des indices de collusion entre participants incluent : L’indice B ➔ Considère toutes les paires d’examinés possibles ➔ Établit la probabilité que les items avec réponses erronées se situent au-delà d’un seuil prédéterminé (habituellement, un écart-type supérieur à 6) L’indice g2 ➔ Considère toutes les paires d’examinés possibles ➔ Établit la probabilité que les réponses aux items (bonnes ou erronées) se situent au-delà d’un seuil prédéterminé (habituellement, un écart-type supérieur à 6) ➔ Considère le patron de réponse aux items dont les réponses sont erronées Autres analyse fréquentes ➔ Temps pour compléter le test (+/- 3 écarts-types de la moyenne) ➔ Score total au test (+/- 3 écarts-types de la moyenne) Chapitre 8 Chapitre 8 - Les Tests d’Aptitudes Intellectuelles L’intelligence et ses multiples définitions Il existe une multitude de définitions de l’intelligence, mais difficile d’avoir une définition opérationnelle universelle. Un problème circulaire - on tente de définir l’intelligence à partir des tests qui la mesure. L’intelligence implique… ➔ la capacité de comprendre des idées complexes; ➔ la capacité d’apprendre de ses expériences; ➔ la capacité de s’adapter efficacement à son environnement; ➔ la capacité de s’engager dans diverses formes de raisonnement; ➔ la capacité de surmonter des obstacles grâce à la réflexion. Définition officielle approuvée par les spécialistes : L’intelligence est une aptitude mentale très générale, qui implique notamment l’habileté à raisonner, à planifier, à résoudre des problèmes, à penser abstraitement, à bien comprendre des idées complexes, à apprendre rapidement et à tirer profit de ses expériences. Les théories de l’intelligence Le concept de Binet : QI = (âge mental / âge réel) x 100 #1 - Le facteur g de Spearman (théorie unifactorielle) Facteur g : l’intelligence générale Facteur s : l’intelligence spécifique Autres facteurs : facteur w (volonté) et facteur c (caractère) #2 - Les aptitudes mentales primaires de Thurstone (théorie multifactorielle) Les modèles hiérarchiques de l’intelligence Ces modèles représentent un compromis entre les théories unifactorielles et multifactorielles. #1 - Le modèle de Cattell-Horn Le modèle fait une distinction entre les influences environnementales et héréditaires sur l’intelligence. Intelligence fluide (gf) : puissance mental brute Intelligence cristallisée (gc) : somme de toutes les connaissances apprises #2 - Le modèle de Vernon Le modèle résume toutes les théories existantes jusqu’au milieu du 20e siècle. Il y a 4 niveaux d’intelligence : ➔ Facteur g ➔ Facteur de groupe majeur ◆ Facteur verbal : éducation ◆ Facteur spatial : mécanique/pratique ➔ Facteur de groupe mineur (aptitudes spécifiques) ➔ Facteur spécifique (aptitudes diverses) Autres théories de l’intelligence #1 - La théorie triarchique de Sternberg La théorie dicte que l’intelligence à trois facettes : ➔ Componentielle : processus mentaux ➔ Expérientielle : connaissance des tâches ➔ Contextuelle : interaction avec l’environnement L’évolution de l’intelligence dans le temps L’effet de Flynn : L’augmentation constante des niveaux de QI. Pourquoi les résultats aux tests s'améliorent sans changement réel à l’intelligence ? ➔ Meilleure scolarisation ➔ Meilleure alimentation ➔ Familiarité avec les tests Les tests d’intelligence Les tests d’intelligence sont principalement utilisés… Dans le milieu scolaire En situation clinique Dans le milieu du travail Pour ajuster les méthodes Pour confirmer un diagnostic Pour la sélection ou le placement d’enseignement psychiatrique Pour identifier les étudiants avec Pour la planification d’un des troubles d’apprentissages intervention Pour la planification de choix de carrière Les tests d’intelligence ont les caractéristiques principales suivantes : ➔ Bon prédicteur de plusieurs facteurs (ex. rendement scolaire, rendement de travail, statut socioéconomique, qualité de vie) ➔ QI est une mesure stable à travers le temps ➔ Parmis les outils d’évaluation psychologique les plus précis Les tests d’intelligence individuels Les caractéristiques principales de ce type de test : ➔ Administration individuelle ➔ Nécessité d’une formation approfondie ➔ Couverture d’une gamme d’âges et d’aptitudes ➔ Nécessite l’établissement d’une relation avec l’examiné ➔ Format de réponse libre en majorité ➔ Correction immédiate des items ➔ Durée d’administration longue (environ 1 heure) ➔ Possibilité d’observation La nature des items pour ces tests incluent : vocabulaire, relations verbales, connaissances, compréhension, arithmétique, mémoire de travail, motifs géométriques, psychomoteurs, matrices. Échelle d’intelligence Stanford-Binet Les aspects cognitifs mesurés dans la 5e édition (actuel) : ➔ 2 scores composites - QI verbal et QI non-verbal ➔ 5 scores indiciels - raisonnement fluide, connaissance, raisonnement quantitatif, traitement visuospatial, mémoire de travail Échelle de Wechsler L’échelle la plus utilisée en psychologie appliquée et en recherche. Elle présente un score QI global et 4 scores indiciels : ➔ Index de compréhension verbale ➔ Index de mémoire de travail ➔ Index de raisonnement perceptif ➔ Index de la vitesse du traitement Propriété psychométrique : bonne fidélité et validité Les test d’intelligence collectifs Les caractéristiques principales de ce type de test : ➔ Administration à des grands groupes ➔ Format à choix multiples ➔ Durée d’administration fixe (environ 1 à 3 heures) ➔ Score total + sous scores ➔ Base de recherche très vastes ➔ Objectif principal : faire de la prédiction Test d’habileté scolaire d’Otis-Lennon Il s’agit d’un test à plusieurs niveaux qui mesure les compétences en matière de raisonnement verbal, quantitatif et figural qui sont le plus étroitement liées au rendement scolaire. Propriété psychométrique : bonne fidélité et moin bonne validité Tests d'intelligences culturels équitables C’est une tentative de mesure l’intelligence indépendamment d’une culture et d’une langue particulière ➔ Les matrices progressives de Raven ◆ Trois séries de tests distinctes Matrices progressives colorées Matrices progressives standard Matrices progressives avancées ◆ Elles sont entièrement non verbale ◆ Format à choix multiples ◆ Durée d’administration brève ◆ Propriété psychométrique Chapitre 9 Chapitre 9 - Les Inventaires de Personnalités Il s'agit du deuxième groupe d'instruments le plus utilisé en psychologie. Les inventaires de personnalités objectifs Le contexte d’utilisation peut être en clinique, en counselling, en sélection de personnel et en recherche. Les caractéristiques vastes des tests : ➔ Nombreux items ➔ Aucune limite de temps ➔ Obtention de plusieurs scores (sous-échelles) ➔ Présence de rapport narratifs Les caractéristiques spécifiques à ce type : ➔ Nombre réduit d’item ➔ Obtention d’un seul score ➔ Rare d’avoir des normes Il y a des problèmes de biais dans les réponses des individus, soit leur réponse ne correspondent pas à ce qu'ils ressentent vraiment. Tendance à l'acquiescement Tendance à la désapprobation Tendance à la réponse aléatoire Tendance de la désirabilité sociale Des stratégies qui peuvent éliminer ou identifier des biais dans les réponses incluent : ➔ Approche des fréquences empiriques extrêmes ➔ Cohérences des réponses ➔ Équilibre de l’orientation des items ➔ Méthode des choix forcés Les différentes stratégies de développement des inventaires de la personnalité : ➔ La stratégie rationnelle (axé sur la logique) ➔ La stratégie empirique (axé sur le pouvoir discriminant des items) ➔ La stratégie conceptuelle (axé sur les théories) ➔ La stratégies factorielle (axé sur l’analyse factorielle) L’inventaire psychologique de Californie révisé (CPI-R) Les aspects de la personnalité mesurés : dominance, sociabilité, empathie et etc. L’interprétation se fait en trois catégories : V1 - intériorité V2 - acceptation des normes V3 - sens de réalisation de soi Les 4 styles de vie : alpha, bêta, gamma et delta L’inventaire de personnalité de Jackson révisé (JPI-R) Les aspects de la personnalité mesurés sont les 15 traits de personnalité. Les big 5 : extraversion, amabilité, conscience, stabilité émotionnelle, ouverture de l’expérience L’interprétation est axée sur la préférence. L'indicateur des types psychologiques de Myers-Briggs Les aspects de la personnalité mesurés : ➔ Axe introversion - extraversion ➔ Axe sensation - intuition ➔ Axe pensée - sentiment ➔ Axe jugement - perception L’interprétation est alternative : Les 2 fonctions les plus stables : sensation-intuition (SN) et pensée-sentiment (TF) NF: Axé sur les valeurs, tendance à valoriser beaucoup les gens et à manifester des valeurs universelles SF: Axé sur les relations, tendance à la coopération et à faire confiance à autrui NT: Axé sur la vision, tendance à être optimiste et à inspirer les gens ST: Axé sur la gestion et l’action, tendance à être stratégique et à agir en conséquence Le questionnaire de personnalité en 15 facteurs de Cattell Les aspects de la personnalité mesurés sont 16 échelles primaires et 5 facteurs globaux : ➔ Extraversion, anxiété, intransigeance, indépendance, maîtrise de soi L’inventaire de personnalité multiphasique du Minnesota (MMPI-3) Inventaires de personnalité spécifiques pour application clinique Inventaire de dépression de Beck (BDI) Inventaire des troubles alimentaires (EDI) Inventaire d’anxiété situationnelle et de trait d’anxiété (STAI) Les tests projectifs Les Principes des tests projectifs : ➔ L’individu n’a pas accès directement aux éléments les plus déterminants de son comportement ➔ Laisser la personne libre de développer ou non ses réponses ➔ Nécessite du matériel ambiguë pour obtenir des réponses non stéréotypées ➔ Centré sur la projection ➔ Interprétation par un spécialiste adéquatement formé Les deux tests les plus connus et utilisé : test de Rorschach et le test d’appréciation thématique (TAT)**Meilleur Chapitre 10 Chapitre 10 - Les Inventaires d'Intérêts Introduction L’étude des intérêts provient de la psychologie appliquée. Les inventaires d’intérêts apportent une information additionnelle et différente lors des décisions liées à la carrière. La première méthode utilisée était l’estimation. Utilisation Les inventaires d’intérêts sont utilisés pour… ➔ l’exploration de choix de carrière; ➔ l’évaluation (pour les fins de sélections et placement); ➔ la recherche. Stabilité des intérêts Certaines recherches démontrent que les intérêts sont assez stables entre l’âge de 15-16 ans et qu’à 25 ans. Strong conclut que… ➔ les intérêts d’une occupation demeure la même sur de longues périodes de temps; ➔ même lorsque les intérêts changent légèrement, l’importance relative des différents intérêts composant le profil pour une occupation de change pas. Caractéristiques d’un bon item Un bon item doit… ➔ permettre de faire la distinction entre les groupes (approche différentielle); ➔ être neutre relativement au genre; ➔ être neutre culturellement et utiliser un langage simple; ➔ être révisé périodiquement afin de s’assurer qu’il n’est pas obsolète; ➔ être facile à lire. Théories des intérêts vocationnels Les premiers inventaires d’intérêts étaient athéoriques; ils étaient développés à l’aide de la méthode empirique des groupes contrastes. CISS (Campbell Interest and Skill Survey) Le profil comprend 98 échelles, chacune présentant un résultat d’intérêt et d’estimation de compétence. Les items mesurant les intérêts et les compétences utilisent une échelle Likert en 6 points. Il comporte trois catégories d’échelles : 1. Échelle d’orientation (7 échelles) 2. Échelle de base (29 échelles) 3. Échelle occupationnelle (60 échelles) Le profil et les normes L’échantillon normatif était composé de 1790 femmes et 3435 hommes, représentant 65 occupations différentes. Le profil indique également des recommandations pour chaque échelle: À poursuivre (si intérêt et compétence sont élevés); À développer (si intérêt élevé, mais compétence faible); À explorer (si intérêt est faible, mais compétence élevée); et À éviter (si intérêt et compétence sont faibles) La validité et la fidélité Se base sur la validité du construit (convergente et divergente). En termes de fidélité test-retest, les coefficients obtenus varient entre 0.79 et 0.87 selon les différentes échelles. Les inventaires d’intérêts de Holland Selon lui, les intérêts professionnels constituent un prolongement de la personnalité et reflètent les motivations des individus. Typologie RIASEC : six sortes d’environnements professionnels auxquels correspondent six types de personnalité La typologie RIASEC (R) Réaliste : au sens d’esprit concret, intérêt pour les professions qui supposent l’usage d’outils et de machines (I) Investigateur : caractérisé par un esprit scientifique et une curiosité intellectuelle (A) Artiste : intérêt pour les professions impliquant la manipulation très libre de matériaux afin de créer des oeuvres artistiques (S) Social : préfère les tâches qui ont une intention morale ou sociale de service et qui impliquent des relations interpersonnelles soutenues (E) Entreprenant : animé par un esprit d'entreprise (C) Conventionnel : préfère les tâches souvent associées au fonctionnement des machines de bureau et des ordinateurs Les types adjacents sont plus en commun que les types diamétralement opposés. L’inventaire de préférences vocationnelles (VPI) Selon 7 échelles homogènes qui mesure le contrôle de soi et les six types de personnalités professionnelles (RIASEC). La recherche auto-dirigée (SDS) Selon 228 items divisés en 4 sections : activité, compétences, occupations et auto-évaluation, basé sur six types de personnalités professionnelles. **Il s'adresse spécifiquement aux élèves de 7e et 8e années. Les deux inventaires ont une justesse de prédiction (validité) entre 35% et 66%. L’inventaire d’intérêts Strong La première version de cet inventaire était destinée uniquement aux hommes. Les 4 groupes d’échelles : ➔ Les thèmes généraux d’occupation (6) ◆ Les 6 types de personnalité professionnelle de Holland ➔ Les échelles occupationnelles (109) ◆ Représente les échelles pour les 109 occupations professionnelles, non professionnelles et techniques de l’inventaire ➔ Les échelles des intérêts de base (25) ➔ Les échelles de style personnel (4) ◆ Échelle du type de travail ◆ Échelle de l’environnement d’apprentissage ◆ Échelle de leadership ◆ Échelle de prise de risques/aventure La fidélité test-retest de l’inventaire Strong reste presque la même après 1 et 3 mois Thèmes généraux d’occupation (0,86 et 0.81) Échelles d’intérêts de base (0.85 et 0.80) Échelles occupationnelles (0,87 et 0,85)

PSY 3707 - Psychometrics Exam, 2025, PDF

Document Details

Tags

Related

Summary

Full Transcript