Révision de l'Apprentissage - PDF
Document Details
Uploaded by Deleted User
Tags
Related
Summary
Ce document présente une révision de concepts clés liés à l'apprentissage, en particulier les concepts de renforcement continu, de renforcement partiel et les différentes stratégies de renforcement. La loi de l'effet de Thorndike et la théorie de Skinner sur la contingence sont aussi mentionnées.
Full Transcript
L’apprentissage revision pour examen final Cours 7 Renforcement continu vs renforcement partiel : Renforcement continu : Chaque fois qu'une personne ou un animal fait ce qu'on attend (le comportement cible), il/elle reçoit une récompense. Chaque réponse appropriée est suivi d’...
L’apprentissage revision pour examen final Cours 7 Renforcement continu vs renforcement partiel : Renforcement continu : Chaque fois qu'une personne ou un animal fait ce qu'on attend (le comportement cible), il/elle reçoit une récompense. Chaque réponse appropriée est suivi d’un renforcement o Exemple : Chaque fois qu'un chien s'assoit sur commande, il reçoit une friandise. Renforcement partiel : La récompense n'est donnée qu'à certains moments, pas à chaque fois que le comportement est réalisé. Chaque réponse appropriée n’est pas nécessairement suivi d’un renforcement o Exemple : Un enfant reçoit une étoile pour son bon comportement, mais pas chaque jour. Plans de renforcement simple : Ce sont des stratégies définies pour donner des récompenses en fonction de certains critères (basés sur le temps ou le nombre d'actions). Plans de renforcement à ratio : Le renforcement dépend du nombre de réponses réalisées. o Ratio fixe (RF) : La récompense est donnée après un nombre fixe de comportements. ▪ Exemple : Un vendeur reçoit un bonus après avoir vendu 5 articles. o Ratio variable (RV) : La récompense est donnée après un nombre variable et imprévisible de comportements. ▪ Exemple : Les machines à sous qui donnent des gains de manière aléatoire. Plans de renforcement à intervalle : Le renforcement dépend du temps écoulé. o Intervalle fixe (IF) : La récompense est donnée après un temps fixe, si le comportement a été réalisé. ▪ Exemple : Une paie reçue toutes les deux semaines pour le travail effectué. o Intervalle variable (IV) : La récompense est donnée après un temps variable et imprévisible. ▪ Exemple : Un professeur qui donne des quiz surprises. L’effet du renforcement partiel comporte plusieurs aspects importants, chacun ayant des implications spécifiques. Voici une explication de ces concepts : Ralentissement de la courbe d’apprentissage o Comme la récompense n’est pas donnée à chaque occurrence du comportement cible, l’apprentissage est plus lent qu’avec un renforcement continu. Exemple : Si vous entraînez un chien avec un renforcement partiel, il mettra plus de temps à comprendre ce que vous attendez de lui. Résistance à l’extinction o Le comportement appris avec un renforcement partiel persiste plus longtemps, même si les récompenses s'arrêtent. Exemple : Les joueurs de machines à sous continuent à jouer même après plusieurs pertes, car ils espèrent un gain futur. Discrimination difficile o Dans un renforcement partiel, il peut être plus difficile pour l’individu de distinguer les moments où son comportement sera récompensé. Exemple : Un élève qui reçoit des compliments seulement de temps en temps pourrait avoir du mal à comprendre quels comportements sont valorisés. Frustration o L’absence de récompense lors de certains essais peut entraîner une frustration chez l’individu. Exemple : Une personne jouant à un jeu vidéo peut ressentir de la frustration si elle ne gagne pas immédiatement, mais cela peut aussi l’inciter à essayer encore. Loi de l'effet de Thorndike (S-R ou apprentissage par contiguïté ?) La loi de l'effet de Thorndike stipule que lorsqu'une réponse est suivie d'un état de satisfaction, cette réponse devient plus probable à l'avenir. Cela semble initialement lié à une association S-R : un stimulus spécifique (S) déclenche une réponse (R) si celle-ci a conduit à un résultat satisfaisant dans le passé. Contiguïté ? Oui, car selon Thorndike, l'effet de renforcement repose sur la proximité temporelle entre la réponse et l'état satisfaisant (suivi immédiat de la satisfaction). Skinner et la contingence (R-C comme cause du conditionnement) Skinner critique l’idée que la contiguïté seule (S-R) suffit à expliquer le conditionnement. Il introduit la notion de contingence, selon laquelle c’est la relation causale entre la réponse (R) et sa conséquence (C) qui détermine l’apprentissage. Pour Skinner, le comportement est davantage guidé par la prévisibilité qu’un comportement particulier aura une conséquence donnée. Cela met l’accent sur l’apprentissage R-C. Exemple : Un rat appuie sur un levier parce qu’il a appris que cette action produit de la nourriture, et non simplement parce que le stimulus (levier) déclenche une réponse mécanique. Tinklepaugh et l'anticipation des renforçateurs (R-C) L’expérience de Tinklepaugh (1928) montre que les animaux apprennent à anticiper des renforçateurs spécifiques : les singes s'attendent à une récompense particulière (la banane) et se montrent déçus s’ils reçoivent autre chose (la salade). Cela va à l'encontre de l'idée purement S-R, car cette anticipation implique une forme de représentation mentale ou de cognition. L'expérience de contingence d’Hammond (1980) illustre le rôle essentiel de la contingence dans l’apprentissage, c'est-à-dire la relation causale entre une action (comme appuyer sur un levier) et ses conséquences (comme obtenir une récompense). Voici une explication simple des phases et des résultats : Phase 1 : Renforcement des réponses (Go) o Ce qui se passe : Chaque fois que le rat appuie sur un levier, il a 5% de chances d’obtenir une récompense (nourriture). o Résultat : Les rats apprennent que le fait d’appuyer sur le levier est lié à la récompense. Ils pressent alors le levier environ 3000 fois par heure pour maximiser leurs chances d’obtenir la nourriture. Phase 2 : Ajout de récompenses sans action (NoGo) o Ce qui change :Les rats continuent d’avoir 5% de chances d’obtenir une récompense lorsqu’ils appuient sur le levier. MAIS des récompenses sont également distribuées aléatoirement dans 5% des cas où les rats ne font rien (aucune pression). o Résultat : Les rats arrêtent graduellement d’appuyer sur le levier, jusqu’à presque zéro. Pourquoi ? Parce que la contingence entre l’action (appuyer sur le levier) et la conséquence (récompense) est brisée. Les rats ne perçoivent plus leur comportement comme directement lié à l’obtention de nourriture, car ils peuvent aussi recevoir des récompenses sans rien faire. Phases 3 et 4 : Design ABAB o Phase 3 : Retour à la condition de la phase 1 (renforcement de 5% seulement pour les réponses). ▪ Les rats recommencent à appuyer sur le levier, réapprenant que leur action est liée à la récompense. o Phase 4 : Retour à la condition de la phase 2 (ajout de récompenses aléatoires). ▪ Les rats arrêtent à nouveau de répondre, car l’association entre leur action et la récompense est de nouveau brouillée. Qu’est ce qu’un renforçateur? Pour Pavlov, “les renforçateurs sont des SI qui sont associés avec des SC”. Selon Thorndike, “les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli”. En fin pour Skinner, “un renforçateur est tout stimulus qui augmente la réponse qui le précède”. Cours 10 Clark Leonard Hull (1884-1952) : Psychologue behavioriste américain. Il est avant tout connu pour l'introduction de la notion de pulsion dans sa théorie de l'apprentissage. L’apprentissage fut sa troisième carrière en psychologie. La traduction d’un ouvrage de Pavlov va l'initier aux concepts du conditionnement. Il propose le concept de l’homéostasie comportementale Homéostasie comportementale : repose sur l’idée que nos comportements sont motivés par le besoin de maintenir un équilibre interne (un peu comme un thermostat qui régule la température). Clark Leonard Hull a intégré dans sa théorie des variables intermédiaires pour expliquer les comportements. Ces variables permettent de relier le stimulus (S) à la réponse (R) en tenant compte de processus internes qui ne sont pas directement observables mais qui influencent le comportement. Qu'est-ce qu'une variable intermédiaire (X) ? Une variable intermédiaire est un facteur hypothétique, situé entre le stimulus (S) et la réponse (R), qui aide à expliquer pourquoi une réponse particulière se produit. Elle représente des processus internes invisibles (comme des pensées, des besoins ou des états internes) qui influencent le comportement. Exemple : Si tu as faim (S), ton besoin énergétique (X) te pousse à chercher de la nourriture (R). Hull reconnaît que certains comportements ne peuvent pas être entièrement expliqués par des relations simples entre S et R. X rend possible une analyse plus complète, car elle prend en compte des facteurs comme : La force du drive (par exemple, l'intensité de la faim). L'habitude (l'habitude de chercher de la nourriture dans un certain endroit). Les attentes ou les prédispositions (par exemple, anticiper une récompense). L’homéostasie physiologique L'homéostasie désigne l'équilibre que le corps essaie de maintenir dans ses différents systèmes biologiques (comme la température, l'hydratation, l’énergie, etc.). Cet équilibre est essentiel pour que les fonctions corporelles se déroulent normalement et que l’organisme reste en bonne santé. Exemple : Ton corps essaie toujours de maintenir une température de 37°C, peu importe qu’il fasse froid ou chaud à l'extérieur. Il régule cela en transpirant ou en frissonnant. Formule : E = (H x D x K) - (nIc +Ic) E = la force du comportement observable H = “Habit” ou apprentissage/conditionnement D = “Drive” ou tendance (motivation de besoin) nIc = “Inhibition non-conditionnée” (la fatigue) Ic = “Inhibition conditionnée” (la peur) K = “Incentive” (motivation additionnelle) Qu'est-ce que la motivation incentive ? Contrairement à la motivation basée sur le drive (Tendance), qui naît d’un besoin biologique interne (faim, soif, etc.), la motivation incentive est créée par l’attrait du renforçateur lui-même, indépendamment du besoin. Cela montre que la motivation ne vient pas toujours de l’intérieur (notre corps), mais peut aussi être déclenchée par l’extérieur (les stimuli attrayants autour de nous). David Premack (1925-2015) un des grands noms de l'apprentissage cognitif et de l'étude de l'intelligence des primates. Plus tôt dans sa carrière, il a commencé par être un béhavioriste progressiste. Il va contribuer à développer une conception différente de ce qui constitue (ou peut constituer) un renforçateur suite à une série d’observations faites chez le cochon. Le principe de Premack, proposé par le psychologue David Premack en 1965, est une règle fondamentale en psychologie comportementale. Il repose sur l'idée qu'une activité ou un comportement plus probable ou plus fréquent (c.-à-d. préféré) peut être utilisé pour renforcer un comportement moins probable ou moins fréquent. En d'autres termes, une activité agréable ou préférée peut servir de renforcement positif pour encourager une activité moins agréable ou moins préférée. Cela fonctionne parce que les gens (ou les animaux) ont tendance à vouloir accomplir les activités qu'ils trouvent intrinsèquement motivantes ou gratifiantes. la théorie de la privation de la réponse, proposée par Timberlake et Allison en 1974, élargit et nuance le principe de Premack en introduisant une nouvelle perspective sur le renforcement. Cette théorie stipule que tout comportement qui est produit à un niveau inférieur à son niveau optimal (préféré) peut servir de renforçateur. L'idée clé est que la privation d'un comportement, quelle que soit sa probabilité intrinsèque, crée une motivation pour retrouver ce comportement. Contrairement à Premack, cette théorie ne se limite pas aux préférences intrinsèques ou probables. Tout comportement, s'il est restreint en dessous de son niveau normal, peut devenir précieux. L'expérience réalisée par Crespi, liée au concept d'apprentissage latent proposé par Edward C. Tolman, illustre comment les rats peuvent apprendre sans nécessairement démontrer ce qu'ils ont appris jusqu'à ce qu'une incitation suffisante soit introduite. L'apprentissage latent selon Tolman : L'apprentissage latent est une forme d'apprentissage qui se produit sans qu'il y ait une démonstration immédiate de ce qui a été appris. Les informations sont stockées et peuvent être utilisées ultérieurement, lorsqu'une incitation ou une récompense motive l'individu à démontrer ce qu'il sait. Description de l'expérience de Crespi : Phase 1 : Entraînement avec des quantités de récompense différentes Les rats sont divisés en trois groupes, chacun entraîné à traverser un labyrinthe pour atteindre une récompense alimentaire : Groupe Vert : 1 pilule de nourriture. Groupe Jaune : 16 pilules de nourriture. Groupe Rouge : 256 pilules de nourriture. Les rats ajustent leur vitesse de parcours en fonction de la taille de la récompense. Les rats du groupe Rouge courent plus vite, ceux du groupe Jaune à une vitesse intermédiaire, et ceux du groupe Vert plus lentement. Phase 2 : Uniformisation de la récompense Tous les groupes reçoivent désormais 16 pilules de nourriture à la fin du labyrinthe. Les changements dans la taille de la récompense influencent immédiatement la vitesse de parcours : Les rats du groupe Vert (augmentation de récompense) augmentent leur vitesse. Les rats du groupe Rouge (diminution de récompense) ralentissent. Les rats du groupe Jaune (récompense inchangée) conservent leur vitesse initiale. Résultats et interprétations : Apprentissage latent confirmé : Les rats du groupe Vert savaient traverser le labyrinthe rapidement dès la Phase 1, mais leur lenteur était liée au manque d'incitation. Lorsqu'une meilleure récompense (16 pilules) est introduite en Phase 2, ils démontrent leur capacité d'apprentissage en augmentant immédiatement leur vitesse. Sensibilité à la récompense : Les rats ajustent leur comportement en fonction de la valeur perçue de la récompense, démontrant un lien entre motivation et performance. Conclusion : L'expérience illustre deux concepts importants : Apprentissage latent : Les rats acquièrent des connaissances sur le labyrinthe, mais n'en font la démonstration que lorsque la motivation (récompense) est suffisante. Effet Crespi : La taille de la récompense influence la performance de manière immédiate, montrant que les attentes liées à la récompense jouent un rôle crucial dans le comportement. On ne peut apprendre que les choses auxquelles on prête attention. L’attention filtre l’énorme quantité d’information normalement disponible dans l’environnement. Le modèle de Mackintosh (1975) est une extension du modèle de Rescorla et Wagner, qui intègre l'idée que l'attention portée au stimulus neutre ou conditionné (SN/SC) varie en fonction de sa capacité à prédire efficacement le stimulus inconditionnel (SI). Cette idée centrale permet de rendre compte de phénomènes comme l'inhibition latente. Dans le modèle de Rescorla et Wagner, la formule clé est : Δ𝑉=𝛼(𝜆−𝑉) Dans ce modèle, α est constant, ce qui signifie que tous les stimuli ont la même "valeur attentionnelle". Mackintosh modifie l'approche en faisant varier α en fonction de la pertinence du SN/SC comme prédicteur du SI. Sa proposition est que : o α augmente si le SN/SC est un bon prédicteur du SI (c'est-à-dire, si la contingence entre SN/SC et SI est forte). o α diminue si le SN/SC est un mauvais prédicteur du SI (faible contingence ou absence de prédiction). Implications et comparaison avec Rescorla-Wagner Rescorla-Wagner : Ne prend pas en compte la variabilité de l'attention (α constant), donc ne peut pas expliquer facilement des phénomènes comme l'inhibition latente. Mackintosh : En intégrant une attention variable (α dépend de la contingence), son modèle explique mieux des phénomènes liés à la pertinence perçue des stimuli. Le blocage de Kamin, découvert par Leon Kamin en 1969, est un phénomène de conditionnement classique où un stimulus conditionné (SC) déjà associé à un stimulus inconditionnel (SI) empêche ou bloque l'association d’un nouveau stimulus avec ce même SI. En termes simples, c'est comme si le cerveau ignorait les informations redondantes. Phase 1 : Apprentissage initial Un stimulus (SC1, par exemple une lumière) est associé à un stimulus inconditionnel (SI, comme de la nourriture). Résultat : SC1 devient un bon prédicteur du SI, et une réponse conditionnée (RC, comme saliver) est déclenchée par SC1. Phase 2 : Introduction d’un nouveau stimulus Un deuxième stimulus (SC2, par exemple un son) est présenté en même temps que SC1, et les deux sont suivis du SI (nourriture). Cependant, SC2 n’est pas appris comme un prédicteur du SI. Le transfert négatif décrit par Hall et Pearce en 1979 est un phénomène qui se produit lorsque l’apprentissage initial d’une association entre un stimulus conditionné (SC) et un stimulus inconditionnel (SI) entrave l’apprentissage ultérieur d’une association plus forte ou différente entre ces mêmes stimuli. En termes simples, l'apprentissage initial ralentit ou complique un nouvel apprentissage, car le sujet n'accorde plus suffisamment d'attention au SC. Alors que Mackintosh propose que l’attention est attirée par les stimuli utiles, Pearce et Hall croient qu’il est inutile pour un organisme de gaspiller des ressources sur de tels stimuli et proposent que ce sont les stimuli encore non-compris (p.e. nouveaux, surprenant, etc.) qui attirent l’attention. Pearce et Hall utilisent une formule similaire à Rescorla et à Mackintosh mais les variables sont légèrement différentes : DV = ( l - V) l - V représente la quantité de surprise représente l’attention, et dépend du degré de surprise à l’essai précédent Cours 11 Albert Bandura Né en 1925, il est un behavioriste canadienne (Alberta) qui va finalement « socialiser » le behaviorisme. Professeur à l’illustre Stanford University, il est aujourd’hui le cinquième plus cité auteur en psychologie. Théorie de l’apprentissage social : élaborée par Albert Bandura, il s’agit d’un phénomène ou les individus apprennent de nouveaux comportements ou de nouvelles connaissances en observant leurs pairs. Ce type d'apprentissage est aussi nommé « apprentissage vicariant ». Selon Bandura, l’apprentissage serait déterminé par trois facteurs, à savoir : o Un stimulus externe Un stimulus externe est un événement ou une situation qui capte l'attention et déclenche un comportement ou une réflexion chez l'individu. ▪ Exemple : Voir quelqu'un obtenir une récompense pour avoir accompli une tâche peut servir de stimulus pour observer et imiter ce comportement. o Un renforcement externe Bandura reconnaît le rôle des récompenses et des punitions dans le renforcement de certains comportements, mais il ne les considère pas comme des conditions nécessaires pour l’apprentissage. L’apprentissage peut également se produire sans renforcement direct, simplement par observation. Cependant, le renforcement externe aide à déterminer si un comportement observé sera reproduit ou non. o Une médiation cognitive La Gestalt est une théorie qui explique que notre cerveau perçoit les objets et les situations comme des ensembles organisés plutôt que comme une simple somme de leurs parties. Par exemple, quand tu vois un cercle formé de petits points, tu perçois directement un cercle complet plutôt que chaque point individuellement. Noam Chomsky critique l’idée que le langage s’apprend uniquement par conditionnement stimulus-réponse (S-R), comme le pensaient les béhavioristes. Selon lui, le langage est trop complexe pour être acquis uniquement par imitation ou renforcement. Il propose que le langage repose sur des règles et des représentations mentales innées, présentes dans tous les êtres humains. Cette capacité innée est appelée grammaire universelle, une structure commune à toutes les langues, qui permet aux enfants d’apprendre rapidement leur langue maternelle, même avec une exposition limitée. Il y a une analogie compare le fonctionnement du cerveau humain à celui d’un ordinateur. Comme un ordinateur, le système cognitif humain : Encode les informations reçues du monde extérieur (perception). Emmagasine ces informations (mémoire). Manipule ces informations pour produire des pensées ou des actions (raisonnement, résolution de problèmes). Les structures fondamentales du système cognitif incluent des mécanismes comme la mémoire sensorielle, la mémoire à court terme, et la mémoire à long terme, qui interagissent pour traiter l'information. Grâce à cette approche, les cognitivistes ont tenté de modéliser et comprendre les processus internes de la "boîte noire" (le cerveau), en étudiant comment les humains transforment et utilisent l'information pour répondre à des stimuli, même si ces processus ne sont pas directement observables. Les sciences de la communication s'intéressent à la façon dont l'information est transmise entre une source (input) et un récepteur (output), en s'appuyant sur l'analogie du canal de transmission. Dans cette perspective, la communication est vue comme un processus où un message est codé, transmis à travers un canal, puis décodé par le récepteur. Les fonctions de transmission de l'information incluent : L'encodage : transformer l'idée en un message compréhensible. La transmission : faire passer le message via un canal (parole, texte, signal). Le décodage : interpréter le message pour lui donner du sens. La notion de canaux multiples reconnaît que l'information peut être transmise par différents moyens simultanément (exemple : voix + expressions faciales + gestes) et que l’efficacité de la communication dépend de la coordination et de la clarté de ces canaux. La psychologie cognitive étudie les processus mentaux qui permettent aux individus de percevoir, mémoriser, apprendre, raisonner et agir. Elle s'intéresse aux mécanismes (comment les processus fonctionnent), aux fonctions (à quoi ils servent), et aux représentations mentales (comment l'information est stockée et utilisée). Mécanismes de base : Perception : Comment nous recevons et interprétons les informations sensorielles. Mémoire : Comment nous stockons et rappelons les informations. Attention : Comment nous concentrons nos ressources mentales sur certaines informations. Opérations complexes : Langage : Comprendre et produire des mots et phrases. Résolution de problèmes : Trouver des solutions à des défis nouveaux. Prise de décision : Choisir entre différentes options. Méthodologie : Elle repose sur l’analyse de la performance dans des tâches spécifiques (comme se souvenir d’une liste, résoudre un puzzle ou comprendre une phrase) pour comprendre les processus cognitifs sous-jacents. Définition de la cognition : Selon Neisser (1967), la cognition englobe les processus par lesquels nous acquérons, conservons, transformons et utilisons l'information pour interagir avec notre environnement. La méthode soustractive de Donders est une technique utilisée pour mesurer le temps requis par une étape mentale en comparant les temps de réaction (TR) à différentes tâches qui impliquent ou non certaines étapes cognitives. C'est une des premières approches expérimentales pour analyser les processus mentaux. Principe général : 1. On décompose une tâche en plusieurs étapes mentales. 2. En comparant les temps de réaction (TR) entre des tâches simples et complexes, on peut isoler la durée d'une étape spécifique. 3. Cela repose sur l'hypothèse que les étapes s'additionnent et fonctionnent de manière séquentielle. Donders identifie trois grandes étapes dans une tâche cognitive : A (Afférent ou Attention) : Perception et détection du stimulus. Par exemple, entendre un son ou voir une lumière. C (Catégorisation ou Choice) : Identifier et classifier le stimulus. Par exemple, décider si le son est grave ou aigu. B (Behavior ou Sélection) : Sélectionner et exécuter une réponse. Par exemple, appuyer sur un bouton spécifique. Les thèmes centraux de la psychologie cognitive concernent la manière dont nous traitons et organisons l'information dans notre cerveau. Voici les points clés : Traitement actif de l'information : Nous ne recevons pas simplement des informations passivement, mais nous les traitons activement. Cela signifie que notre cerveau sélectionne, organise et analyse ce que nous percevons. Représentation de la réalité : Ce traitement crée une représentation mentale de la réalité. Ce que nous voyons et entendons n’est pas une copie exacte du monde extérieur, mais plutôt une interprétation de celui-ci, influencée par nos perceptions. Dépendance à l'expérience antérieure : Notre mémoire joue un rôle important dans le traitement de l'information. Nos expériences passées influencent la façon dont nous percevons et réagissons aux nouvelles informations. Ressources cognitives limitées : Nos capacités mentales sont limitées, ce qui signifie que nous ne pouvons traiter qu'une quantité d'informations limitée à la fois. Cela peut être mesuré, par exemple, par l'empan numérique, qui teste combien d'éléments nous pouvons retenir en mémoire à court terme. Traitement sélectif et incomplet : Nous ne prêtons attention qu'à certains aspects de l'information et souvent, nous ne traitons pas tout de manière complète. Cela est illustré par des théories comme la sélection de l'attention et l'idée que nous ne traitons qu'un canal d'information à la fois (par exemple, écouter quelqu'un tout en étant distrait par un bruit de fond). Cours 12 Le modèle d’Atkinson et Shiffrin Imagine que ton cerveau fonctionne comme un système de rangement super organisé, où tout ce que tu vois, entends ou apprends doit passer par trois étapes avant de devenir un souvenir que tu peux garder pour longtemps. C’est ce qu’expliquent Atkinson et Shiffrin dans leur modèle, qu’on appelle parfois le modèle des trois mémoires. o La mémoire sensorielle : C’est comme un filet à papillons pour attraper toutes les informations autour de toi. Tout ce que tu vois, entends, ou sens passe par là, mais ça ne reste qu’une demi-seconde (pour la vue) ou quelques secondes (pour les sons). Mais attention, si tu ne fais pas attention à ces informations, elles disparaissent aussitôt, comme des papillons qui s’envolent. ▪ Par exemple : Si tu regardes une photo et la fermes rapidement, tu la "vois" encore dans ta tête pendant un petit instant. Ça, c’est ta mémoire sensorielle ! o La mémoire à court terme/de travail : Quand tu fais attention à quelque chose, ça passe dans ta mémoire à court terme. Ici, c’est comme une petite table de travail où tu peux poser environ 5 à 9 objets à la fois (un peu comme empiler des briques). Mais si tu laisses ces informations trop longtemps sans les utiliser, elles tombent de la table et s’effacent. ▪ Exemple : Si on te donne un numéro de téléphone, tu peux t’en souvenir pendant quelques secondes en le répétant, mais si tu te distrais, tu l’oublies vite. o La mémoire à long terme : Quand tu veux garder quelque chose pour longtemps, ton cerveau range ces informations dans un coffre-fort spécial qu’on appelle la mémoire à long terme. C’est un endroit où tu peux stocker plein de souvenirs, comme ton anniversaire ou les choses que tu apprends à l’école. Mais pour ranger des choses dans ce coffre-fort, il faut les répéter ou les comprendre bien. Sinon, elles restent dans la boîte de travail et disparaissent. Les recherches réalisées pour valider ce modèle ont démontré : o l’existence de registres sensoriels spécifiques aux modalités et ayant des propriétés spécifiques (écoute dichotiques, rappel de lignes sélectionnées post présentation, etc.) o l’existence d’une mémoire à court terme ayant des propriétés différentes de celles de la mémoire à long terme (empan, amnésie antérograde, etc.) o le rôle de l’autorépétition sur le maintien de l’information en mémoire à court terme (circuit réverbérant de Donal Hebb, effet de position sérielle) Modèle de la mémoire de travail (Baddeley & Hitch, 1974) : Vision modulaire de la mémoire à court terme Imagine que ton cerveau est un bureau super organisé où tu fais tout ton travail mental. Le modèle de la mémoire de travail de Baddeley et Hitch, c'est comme une équipe qui s'occupe de ce bureau. Cette équipe a plusieurs personnages qui travaillent ensemble pour que tu puisses te souvenir, comprendre, et résoudre des problèmes. o Le patron : l’administrateur central Le patron est comme le chef du bureau. Il décide où envoyer les informations et ce qui est important. Par exemple, si tu fais tes devoirs tout en écoutant de la musique, le patron te dit : "Concentre-toi sur tes devoirs et oublie la chanson pour l’instant !". Mais attention, le patron peut se fatiguer si tu lui demandes de faire trop de choses en même temps. o La boucle phonologique : le répétiteur C’est comme un magnétophone dans ta tête. Il garde les mots et les phrases en répétant ce que tu entends ou lis. Par exemple : Si on te donne une liste de courses, tu peux la répéter dans ta tête ("pain, lait, pommes") jusqu’à ce que tu l’écrives. Il developpe le language. o Le calepin/tablette visuo-spatial : l’artiste C’est un dessinateur qui gère tout ce que tu vois ou imagines dans ta tête. Il t’aide à retenir des images ou à trouver ton chemin dans un endroit. Par exemple : Si tu essaies de résoudre un puzzle ou de te souvenir d’un dessin, c’est lui qui travaille. Il developpe les sémantiques visuelles o L’entrepôt à long terme : le buffet épisodique Il relie ce que disent les deux assistants (les mots du répétiteur et les images de l’artiste) pour créer des souvenirs complets. Par exemple : Si tu te souviens d’un moment où tu as lu un livre (les mots) assis sur un banc au parc (l’image), c’est grâce au buffet épisodique. Il developpe la mémoire a long terme épisodique. Origine : dans l’antiquité pour se rappeler de qqch les scribes écrivaient sur des tablettes Les informations de la mémoire de travail peuvent être envoyées dans la mémoire à long terme pour être conservées plus longtemps. Deux types de mémoire long terme sont mentionnés : o Langage et mémoire épisodique (ce que tu sais et ce que tu as vécu). o Sémantique visuelle (images et significations visuelles). Le modèle de Tulving (1972) : mémoire a long terme une théorie qui explique comment la mémoire humaine est organisée en trois systèmes distincts qui fonctionnent ensemble pour gérer les souvenirs. Ces systèmes sont comme des compartiments différents dans un coffre à mémoire. o Mémoire épisodique : Les souvenirs d’expériences personnelles. C’est comme un album photo dans ton esprit où tu ranges tous les souvenirs d’événements que tu as vécus. Elle te permet de te souvenir d’événements précis, avec le "quoi", "où" et "quand". Exemple : Te rappeler de ton dernier anniversaire, du gâteau que tu as mangé, et de qui était là. Elle est basée sur des expériences personnelles, est liée au temps et au lieu. Elle est fragile : un souvenir épisodique peut s’effacer ou se déformer avec le temps. o Mémoire sémantique : Les connaissances générales C’est comme un dictionnaire ou une encyclopédie dans ta tête. Elle stocke toutes les informations générales et les faits que tu connais mais qui ne sont pas liés à un moment ou un lieu précis. Exemple : Savoir que Paris est la capitale de la France ou que 2 + 2 = 4. Elle n’est pas liée à une expérience personnelle, et c’est une mémoire plus stable que la mémoire épisodique. o Mémoire procédurale : Les automatismes C’est comme un guide pratique ou un manuel pour tout ce que tu sais faire sans réfléchir. Elle garde en mémoire les habitudes, les gestes automatiques, et les compétences physiques. Exemple : Savoir faire du vélo, attacher tes lacets ou jouer d’un instrument de musique. Elle est basée sur des actions et des routines, et fonctionne souvent de manière inconsciente. Une fois appris, tu n’as plus besoin de réfléchir pour le faire. L’approche des niveaux de traitement de Tulving met en lumière une idée importante : ce n’est pas la structure de la mémoire en elle-même qui détermine si on va bien se souvenir de quelque chose, mais la manière dont on traite et encode l’information au moment où on la reçoit. Voici les points clés de ce modèle : Amorçage : le fait de pouvoir associer des actions et pensées ensemble Ex : qqun ecrit le mot infirmiere et après ecrit d_ct___, on est plus conditionné a écrire docteur que dictée Le modele de Collins et Quillian Le modèle de Collins et Quillian (1969) est une théorie sur la manière dont la mémoire sémantique (les connaissances générales sur le monde) est organisée dans notre cerveau. Ils ont imaginé que la mémoire fonctionne comme un réseau d’idées connectées. Ce réseau est constitué de : Nœuds : Chaque nœud représente un concept ou une idée (par exemple, animal, oiseau, canari). Liaisons : Les nœuds sont reliés entre eux par des liens qui représentent des relations logiques (par exemple, "un oiseau est un animal"). Les principes du modèle Économie cognitive o Les informations générales sont stockées une seule fois au niveau le plus haut de la hiérarchie pour éviter les doublons. Cela permet de stocker les informations de manière efficace. Héritage des propriétés o Les concepts spécifiques (comme "canari") héritent des propriétés des concepts plus généraux auxquels ils sont liés (comme "oiseau" et "animal"). Propagation de l’activation o Quand tu penses à un concept (par exemple, "canari"), l’activation se propage dans le réseau pour accéder aux concepts reliés. Si tu penses "canari", tu peux facilement savoir que c’est un oiseau, qu’il a des plumes, et qu’il est un animal. Collins et Quillian ont testé leur modèle en mesurant le temps qu’il faut à une personne pour répondre à des questions. Le temps de réponse dépend de la distance entre les concepts dans le réseau. Ce phénomène s’appelle la distance sémantique. Le modele de distribution de l’activation Le modèle de distribution de l’activation (ou modèle de réseaux associatifs) est une théorie cognitive qui explique comment la mémoire et les idées sont connectées et activées dans le cerveau. Il diffère des modèles hiérarchiques comme celui de Collins et Quillian en proposant une organisation plus souple, basée sur les associations entre idées plutôt qu’une structure rigide. Dans ce modèle, la mémoire fonctionne comme un grand réseau d'idées reliées entre elles. Ces idées, ou concepts, sont représentées par des nœuds connectés par des liens. Cependant, contrairement à un réseau hiérarchique, les concepts ne sont pas organisés selon des niveaux rigides. Les liens varient en force, selon l'expérience ou la fréquence d'usage. Quand tu penses à un concept (par exemple, chien), ce nœud s'active dans le réseau, et cette activation se propage vers les concepts qui lui sont associés. Plus le lien entre deux concepts est fort, plus l’activation est rapide et intense. Les concepts éloignés ou faiblement connectés recevront une activation moindre. Ce modèle aide à comprendre plusieurs phénomènes liés à la mémoire : Récupération d’information o Une idée peut être rappelée parce qu’elle est activée directement (par exemple, tu penses à un chien en voyant un parc). D’autres idées peuvent être rappelées indirectement, grâce à la propagation de l’activation (par exemple, le parc te fait penser à jouer, ce qui te fait penser au chien). Effet d’amorçage o Si un concept est activé, il devient plus facile d’accéder à des concepts liés. Oubli o Les concepts faiblement connectés ou rarement utilisés reçoivent moins d’activation, ce qui peut expliquer pourquoi ils sont plus difficiles à rappeler. Cours 13 Le trouble obsessif-compulsif C’est un syndrome caractérisé par les éléments suivants: Anxiété avec présence d’obsessions et/ou de compulsions Le patient doit se rendre compte que les pensées et actions sont irrationnelles et/ou excessives Doit se produire plus d’une heure par jour Doit interférer avec la routine quotidienne Ne doit pas être causé par des drogues, de l’alcool ou autres médicaments L’obsession Pensées, images ou impulsions répétitives et constantes qui causent de l’anxiété ou de la détresse Ces pensées, images et impulsions ne sont pas liées à des problèmes réels de la vie Tentative par le patient d’ignorer ou de résister à ces pensées, images et impulsions Ces pensées, images et impulsions sont reconnues par le patient comme étant le fruit de son esprit et non pas d’origine extérieure La compulsion Comportements ou actes mentaux que le patient fait de façon répétitive en réaction à des obsessions Comportements ou actes mentaux faits pour éviter ou réduire l’anxiété et/ou le détresse ressentie par le patient Comportements ou actes mentaux qui sont clairement excessifs et/ou non réalistes Prévalence, apparition, formes des TOC Prévalence évaluée: 3% - Peut apparaître à plus ou moins n’importe quel âge, de l’enfance à l’adulte âgé - Plus fréquent entre 20-24 ans - Meilleur pronostique lorsque le patient est diagnostiqué jeune - Beaucoup de variations inter-individuelles quand au contenu obsessionnel et les comportements compulsifs Comorbidité des TOC TOC a un haut degré de co-morbidité avec les autres psychopathologies Les plus communes : La dépression (la plus commune), la schizophrénie, le syndrome de Tourette Plusieurs patients TOC ont d'abord souffert de dépression Deux tiers des patients TOC développent de la dépression, ce qui rend les symptômes du TOC pires et plus difficiles à traiter - Souvent les patients TOC sont diagnostiqués comme schizophrènes puisqu'il est parfois difficile de distinguer les obsessions des hallucinations Les TOC ne sont pas pathologiques, mais c’est considere comme un trouble neurologique Certains gens atteint de syndrome de tourette ont de la difficulté a admettre qu’ils ont le trouble Causes des TOC La sérotonine est un neurotransmetteur, c’est-à-dire une substance chimique qui aide à transmettre les messages dans le cerveau, et elle joue un rôle important dans la régulation de l’humeur et de l'anxiété. Une hypothèse courante est que des niveaux anormaux de sérotonine pourraient être liés à des troubles anxieux, comme le trouble obsessionnel-compulsif (TOC). Certains patients atteints de TOC présentent une mutation génétique dans le gène du transporteur de la sérotonine. Ce gène code pour une protéine qui aide à transporter la sérotonine dans les neurones. Si cette protéine ne fonctionne pas correctement en raison de la mutation, cela peut perturber l'équilibre de la sérotonine dans le cerveau, contribuant potentiellement aux symptômes de l'anxiété ou du TOC. Cependant, il est aussi possible que l'anxiété et les troubles associés puissent être causés par d'autres facteurs biologiques qui, d'une manière ou d'une autre, réduisent l'activité sérotoninergique, c’est-à-dire l’activité de la sérotonine dans le cerveau, sans impliquer directement cette mutation génétique. Cela signifie que plusieurs mécanismes biologiques peuvent influencer l’anxiété et le TOC. Les recherches sur le trouble obsessionnel-compulsif (TOC) ont montré que certains patients présentent une activité électrique corticale plus élevée que les personnes normales, ce qui pourrait expliquer l’augmentation des symptômes de ce trouble, comme les pensées obsessionnelles et les comportements compulsifs. Une théorie qui tente d'expliquer ce phénomène implique un problème de communication entre trois régions du cerveau : o Le cortex orbital frontal (COF), qui est lié à la prise de décision et au contrôle des comportements. o Le noyau caudé, qui fait partie des noyaux de la base et est impliqué dans le contrôle moteur et le filtrage des informations. o Le thalamus, qui agit comme un relais pour les signaux sensoriels et moteurs vers le cortex. Selon cette théorie, le noyau caudé ne fonctionnerait pas correctement chez les personnes atteintes de TOC, ce qui perturberait la communication entre ces régions cérébrales. Ce dysfonctionnement du noyau caudé pourrait entraîner une hyperactivité dans le thalamus, qui commencerait à envoyer en continu des signaux de stress au cortex orbital frontal. Ces signaux constants créeraient une boucle de stress et d'anxiété, amplifiant les symptômes du TOC.Ainsi, ce modèle suggère qu'une mauvaise régulation de l'information entre ces régions cérébrales pourrait être à l'origine de l’anxiété et des comportements compulsifs associés au TOC. TOC est rarement complètement guérissable. La plupart des patients vont avoir une amélioration de leurs symptômes avec un traitement approprié. Les choix de traitement dépendent de la nature exacte de l’état du patient (TOC, sévérité, co-morbidité, etc) et ses préférences. On retrouve : La pharmacologie Inhibiteurs sélectifs de la recapture de la sérotonine (ISRS) o Fluoxétine (Prozac) o Sertraline (Zoloft) o Paroxétine (Paxil) o Fluvoxamine (Luvox) o Citalopram (Celexa) o Escitalopram (Lexapro) o Effets secondaires possibles : nausées, insomnie, anxiété, diminution de la libido Antidépresseurs tricycliques (ATC) o Clomipramine (Anafranil) o Efficacité prouvée pour le TOC, mais avec un profil d'effets secondaires plus important o Effets secondaires possibles : somnolence, prise de poids, sécheresse buccale, constipation, troubles cardiaques o Inhibiteurs de la recapture de la sérotonine et de la noradrénaline (IRSNa) o Venlafaxine (Effexor) o Duloxétine (Cymbalta) o Effets secondaires possibles : nausées, somnolence, transpiration, hypertension La thérapie béhaviorale traditionnelle (surtout pour une amélioration des aspects compulsifs) La thérapie comportementale et cognitive (TCC), développée par des cliniciens comme Aaron Beck et Albert Ellis, repose sur l’idée que nos pensées et nos comportements sont appris au fil du temps, et qu'ils peuvent donc être modifiés ou "désappris". Dans cette approche, on reconnaît que les processus de pensée (comme les croyances irrationnelles) et les comportements (comme les compulsions) peuvent être modifiés par l’apprentissage et l'entraînement, et qu'ils peuvent donc être sujet à l'extinction (disparaitre). Traitement du TOC avec la TCC : Le traitement du TOC avec la TCC se divise en deux volets principaux : Volet comportemental (pour les compulsions) : o Ce volet vise à modifier les comportements compulsifs qui sont réalisés pour réduire l'anxiété causée par les obsessions. Par exemple, la technique de prévention de la réponse consiste à empêcher la personne de réaliser ses rituels compulsifs, ce qui l’aide à apprendre que l’anxiété diminue naturellement, même sans ces comportements. Volet cognitif (pour les obsessions) : o Ce volet vise à modifier les pensées obsessionnelles. Il aide le patient à identifier et à remettre en question les pensées irrationnelles ou les croyances erronées qui alimentent l'anxiété. Par exemple, il peut s'agir de travailler sur la façon dont la personne interprète certaines situations comme menaçantes, ou de l'aider à apprendre à tolérer l'incertitude, sans avoir besoin de faire des rituels pour se rassurer. Volet comportemental : o L'objectif principal est de changer la façon dont les patients réagissent aux situations qui provoquent de l'anxiété, comme les pensées obsessionnelles. Cela se fait par des techniques comportementales, notamment la prévention de la réponse. Cela consiste à empêcher les patients de réaliser leurs comportements compulsifs (rituels), ce qui leur permet de constater que l'anxiété diminue naturellement sans avoir besoin de ces rituels. Cela aide à réduire progressivement la dépendance aux comportements compulsifs pour soulager l'anxiété. Volet cognitif : o L'objectif ici est de modifier la manière dont les patients pensent, en particulier les pensées qui nourrissent leur peur et leur anxiété envahissantes. Cela inclut des stratégies comme l'identification et la restructuration des pensées irrationnelles ou des croyances erronées. En aidant le patient à remettre en question ses pensées, il apprend à gérer l'anxiété sans tomber dans des interprétations catastrophiques ou des réactions excessives. Ce travail sur les pensées obsessionnelles vise à les réduire ou les éliminer, en renforçant la capacité du patient à tolérer l'anxiété sans agir sur les compulsions. La thérapie béhaviorale-cognitive Conclusions o Le TOC est une psychopathologie très complexe o La plupart des cas sont incurables o Le meilleur traitement actuel est une combinaison de TBC accompagnée d’une pharmacologie appropriée o Nécessite plus de recherches, surtout sur le fonctionnement du cerveau des patients souffrant du TOC Qu’est ce que l’apprentissage? Selon les behaviouristes, l'apprentissage serait : o Une modification du comportement du sujet o Plus ou moins durable o Résultant de l'expérience du sujet o Impliquant une connexion entre au moins deux stimuli Selon les cognitivistes, l'apprentissage serait : o Une modification du comportement du sujet o Impliquant la mémoire long-terme et la mémoire de travail o Résultant de l'acquisition de connaissances o Impliquant la connexion d'au moins deux éléments d'information L'apprentissage cognitif est un processus par lequel une personne acquiert des connaissances en traitant, organisant et interprétant les informations. Cela implique l'utilisation de la mémoire, de l'attention et de la réflexion pour comprendre et résoudre des problèmes.