Lernen - Lektion 1 PDF
Document Details
Uploaded by Deleted User
Tags
Summary
Diese Lektion behandelt die Definition von Lernen, die grundlegenden Prinzipien klassischer Lerntheorien und Unterschiede zwischen verschiedenen Arten der Verstärkung und Bestrafung. Die Lektion erörtert auch das klassische Konditionieren und die Prozesse des Verhaltensaufbaus und -abbaus. Wichtige Begriffe wie "neutraler Reiz", "unkonditionierter Reiz" und "unkonditionierte Reaktion" werden definiert und erklärt.
Full Transcript
LEKTION 1 LERNEN LERNZIELE Nach der Bearbeitung dieser Lektion werden Sie wissen,... – wie Lernen definiert wird und worin die grundlegenden Prinzipien und Unterschiede der klassischen Lerntheorien bestehen. – was den Prozess des klassischen Konditionierens auszeichnet. – wie nach Thorndike u...
LEKTION 1 LERNEN LERNZIELE Nach der Bearbeitung dieser Lektion werden Sie wissen,... – wie Lernen definiert wird und worin die grundlegenden Prinzipien und Unterschiede der klassischen Lerntheorien bestehen. – was den Prozess des klassischen Konditionierens auszeichnet. – wie nach Thorndike und Skinner Verhalten verstärkt und geformt wird. – wie sich positive und negative Verstärkung und Bestrafung differenzieren lassen und welche Folgen Bestrafung in der Erziehung haben kann. – wie sich primäre und sekundäre Verstärker voneinander unterscheiden und welche unterschiedlichen Verstärkerpläne es gibt. – welche Auswirkungen biologische Einschränkungen auf das klassische und operante Konditionieren haben. – welche Bedeutung kognitive Lernformen haben. 1. LERNEN Einführung Kennen Sie das auch, wie schwer es oft fällt, eine alte und lästige Gewohnheit abzulegen und stattdessen eine neue und passender erscheinende in das persönliche Verhaltensre- pertoire aufzunehmen? Warum das oftmals so schwierig ist und wie Verhaltensänderun- gen theoretisch begründet werden können, steht in dieser Lektion ebenso im Fokus des Interesses wie lernpsychologische Modelle, die erklären, wie und wozu wir lernen. Zunächst sollen jedoch zentrale Begriffe des Lernens erläutert und definiert werden. 1.1 Einführung in die Lernpsychologie In der folgenden Definition nach Gerrig und Zimbardo (2008, S. 192) sind die drei wesentli- Lernen chen Merkmale des Lernens enthalten: „Lernen ist ein Prozess, der in einer relativ konsis- Der Prozess des Lernens tenten Änderung des Verhaltens oder des Verhaltenspotenzials resultiert, und basiert auf bewirkt eine relativ dau- erhafte, erfahrungsba- Erfahrung.“ sierte Verhaltensände- rung. Nachfolgend sollen die von Gerrig und Zimbardo (2008) genannten drei Kernmerkmale des Lernens näher beleuchtet werden. Definitionsgemäß erkennt man Lernen daran, dass … EXKURS 1. … es eine Änderung des Verhaltens oder des Verhaltensrepertoires bewirkt, die sich nach außen sichtbar, in Form einer erbrachten Leistung zeigen kann, jedoch nicht mit dieser identisch ist. Auch eine veränderte Haltung zu einem bestimmten Gegenstand oder dessen erweitertes Verständnis führt zu einer Änderung des Verhaltenspotenzials und kann sich dann unmittel- bar oder zu einem späteren Zeitpunkt in einem veränderten Verhalten zei- gen (vgl. Koch/Stahl 2017, S. 320f.; Gerrig/Zimbardo 2008, S. 192). 2. … die Verhaltensänderung relativ konsistent und nachhaltig sein muss, um als erlernt zu gelten (vgl. Gerrig/Zimbardo 2008, S. 192). Hat jemand bei- spielsweise Fahrrad fahren gelernt, verlernt er dies vermutlich auch nach einer längeren Pause nicht. Zumindest sollte es ihm leichtfallen, dieses spe- zifische Verhalten nach etwas Übung erneut zu zeigen. 3. … Lernen ein Prozess ist, der auf Erfahrung basiert, indem wir Informatio- nen aufnehmen, bewerten sowie transformieren und auf diese reagieren, mit dem Ziel, unsere Umwelt zu beeinflussen oder uns an diese anzupassen (vgl. ebd., S. 192ff.; Myers 2014, S. 290ff.). 12 Ergänzend und für das Verständnis bedeutsam, betonen Bodenmann/Perrez/Schär den Unterschied zwischen erworbenem Verhalten durch das Aneignen von Wissen einerseits, und dem Auf- bzw. Abbau von Verhaltensdispositionen andererseits (Bodenmann/Perrez/ Schär 2011, S. 15f.). Unter einer Verhaltensdisposition ist die Bereitschaft zu verstehen, „sich unter mehr oder weniger spezifischen […] Bedingungen in einer bestimmten Weise zu verhalten; also z. B. Gedächtnisinhalte abrufen bzw. bestimmte Probleme lösen zu können oder mit Angst zu reagieren“ (Patry/Perrez 1981, S. 231). Ferner besteht ein breiter wissenschaftlicher Konsens darüber, dass gelerntes Verhalten nicht auf natürliche Reifungs- bzw. Alterungsprozesse, Schädigungen und Erkrankungen des Gehirns, Ermüdung oder den Einfluss von psychoaktiven Substanzen zurückzufüh- Psychoaktive ren sein darf (vgl. Gerrig/Zimbardo 2008, S. 192f.; Bodenmann/Perrez/Schär 2011, S. 14; Substanzen Als Bewusstsein veränder- Sokolowski 2013, S. 124f.). So kann man bei dem Aufbau von Verhaltensdispositionen zwi- nde Mittel, z. B. Drogen schen erlernten und erfahrungsbasierten vs. genetischen und biologischen Verhaltensdis- oder Alkohol, werden sie positionen unterscheiden (s. Grundkonzepte der Psychologie: Anlage-Umwelt-Debatte), genau aufgrund dieser Wirkursache konsumiert. die allerdings oftmals eng miteinander verbunden und voneinander abhängig sind (Bodenmann/Perrez/Schär 2011, S. 16ff.). Beispielsweise können wir nicht fliegen lernen, da uns hierfür die genetischen und körperlichen Voraussetzungen fehlen. Genetische und biologische Verhaltensdispositionen wie Reflexe (z. B. Lidschlussreflex), Instinkte (z. B. Reflexe Nestbau bei Vögeln), Prägung (z. B. Bindungsverhalten bei Menschen) und Reifung (biolo- Dies sind unwillkürliche Reaktionen auf Reize, die gische Wachstumsprozesse) sind charakteristisch für bestimmte Arten und werden nicht wir mit unseren Sinnen erlernt, sondern vererbt. Darüber hinaus kann zwischen implizitem und inzidentellem Ler- wahrnehmen. nen vs. explizitem und hypothesengeleitetem Lernen unterschieden werden (Koch/Stahl Instinkte Dies sind angeborene 2017; S. 322). Implizites Lernen erfolgt eher beiläufig (inzidentell) und ohne eine beson- Muster von Verhaltens- dere geistige Anstrengung automatisch und schnell (vgl. ebd.). So erlernen Kinder zum weisen, die dazu dienen Beispiel ihre Muttersprache implizit, ohne zuvor über grammatikalische Regeln nachzu- sollen, die Überlebens- chancen von Mitgliedern denken. Kinder lernen es meist am Vorbild, durch Unterstützung der Eltern und mit einer Gattung zu erhöhen. Übung. Explizites und hypothesengeleitetes Lernen erfordert demgegenüber eine Lernbe- Sie müssen nicht gelernt reitschaft, ist geplant, vergleichsweise mühsam und mit kognitiver Anstrengung verbun- werden. den, wie z. B. schulisches Lernen (vgl. ebd., S. 322f.). Reifung Diese wird als ein von innen gesteuerter, über- Habituation wiegend genetisch bedingter Wachstumspro- zess verstanden, der über Habituation bzw. Gewöhnung ist eine basale Form des Lernens, bei der durch die wieder- die Lebensspanne hinweg holte Darbietung eines Reizes die Verhaltensreaktion nachlässt (Gerrig/Zimbardo 2008, kontinuierlich zu alters- bezogenen Veränderun- S. 193). Beispielsweise bewirkt die wiederholte Darbietung eines visuellen Reizes bei gen des Körpers und des Säuglingen eine zunehmende Vertrautheit, die mit einem wachsenden Desinteresse ein- Verhaltens führt. hergeht, sodass sie den Stimulus immer weniger ansehen und schließlich den Blick früh- zeitig abwenden (Myers 2014, S. 182). Somit führt Habituation zu einer Verhaltensände- rung, wobei diese allerdings entgegen der obigen Definition nicht dauerhaft ist, da das Verhalten durch andere Umgebungsreize erneut verändert wird (Gerrig/Zimbardo 2008, S. 193). Alltagsbeispiele hierfür sind das Laufgeräusch unseres Computers oder der Geruch unseres gewohnten Parfums, den wir nicht mehr bewusst wahrnehmen. 13 1.2 Klassisches Konditionieren Im Folgenden stehen in Abgrenzung zu schulischem Lernen sowie zu den genetischen und biologischen Verhaltensdispositionen die grundlegenden Formen der erfahrungsbasierten Verhaltensänderung im Mittelpunkt des Interesses. Grundlegende Begriffe Paradigma Bevor im nächsten Abschnitt das Paradigma des klassischen Konditionierens vorgestellt Ein wissenschaftliches wird, erfolgt zunächst eine Klärung bedeutsamer Begriffe. Denkmuster bzw. eine Lehrmeinung, die breite Anerkennung in einer For- Als neutraler Stimulus (NS) wird ein Reiz bezeichnet, der unerwartet ist, jedoch keine schergemeinschaft findet. starke Abneigung hervorruft (Bodenmann/Perrez/Schär 2011, S. 47). Da der Reiz keine Reiz Jedes Ereignis und jede besondere Bedeutung hat, ist die durch den Reiz hervorgerufene Orientierungsreaktion Situation, die eine Reak- (OR) individuell sehr unterschiedlich. Allgemein reagiert der Organismus mit einer erhöh- tion auslöst, wird als Reiz ten Aufmerksamkeit und Aktivierung, um im Falle einer Bedrohung Kampf oder Flucht zu oder Stimulus bezeichnet. ermöglichen (ebd., S. 49f.). Unkonditionierte Stimuli (UCS) sindReize, bei deren Wahrnehmung unmittelbar eine spe- zifische, angeborene unkonditionierte Reaktion (UCR) erfolgt, z. B. das Zurückziehen der Hand nach dem Berühren einer heißen Herdplatte (ebd., S. 46ff.). Die folgende Tabelle, angelehnt an Bodenmann/Perrez/Schär (2011, S. 48), zeigt, welche Arten von unkondition- ierten Stimuli unterschieden werden können. Tabelle 1: Arten von unkonditionierten Stimuli Schmerzreize Physiologische Reize olfaktorische, z. B. Salmiak starkes Herzrazen taktile, z. B. Hitze Ohnmachtsgefühl visuelle, z. B. grelles Licht Erstickungsgefühl auditive, z. B. Knall Schwindel Schreckreize Positive Reize lautes Geräusch, unerwarteter Knall Süßigkeiten Dunkelheit (plötzlich eintretende) oder als Verstärker auf ansprechendes Lächeln sonst nicht erschreckende Reize (Ast-Knacken bei Tages- sexuelle Attraktivität licht vs. Ast-Knacken bei Dunkelheit) Quelle: Erstellt im Auftrag der IU 2020 in Anlehnung an Bodenmann/Perrez/Schär 2011, S. 48. Wie aus einem zunächst neutralen Stimulus ein konditionierter Stimulus wird und eine konditionierte Reaktion auslöst, soll im nachfolgenden Abschnitt erörtert werden. Das Paradigma des klassischen Konditionierens Das klassische Konditionieren geht auf den russischen Forscher Iwan P. Pawlow (russisch Pavlov) zurück und gilt als bewährte Methode zur Erforschung grundlegender assoziati- ver Lernprozesse (vgl. Bodenmann/Perrez/Schär 2011, S. 42ff.). Pawlow war als Reflexo- 14 loge der damals zeitgemäßen Auffassung, dass das gesamte Verhaltensspektrum von Klassisches Konditio- Organismen auf Reflexen basiert (Sokolowski 2013, S. 126f.). Ursprünglich wollte er die nieren Das ist eine Lernform, bei Verdauungstätigkeit von Hunden erforschen und bemerkte hierbei, dass die Hunde nach der zwei Reize miteinan- einigen Versuchen nicht nur auf die Fütterung von Fleischpulver mit Speichelfluss reagier- der verbunden (assozi- ten, sondern bereits im Vorfeld, wenn der Versuchsleiter lediglich das Labor betreten hatte iert) werden, um ein Ereignis vorwegzuneh- (Koch/Stahl 2017, S. 323). Diese vorwegnehmende (antizipatorische) Reaktion der Hunde men. Reize können Ereig- bezeichnete Pawlow als konditionierten Reflex. Pawlows Forschung war von grundlegen- nisse oder Situationen sein, die in der Lage sind, der Bedeutung für den damals in Amerika erstarkenden Behaviorismus, der die psycholo- eine Reaktion hervorzuru- gische Forschung ausschließlich auf objektive Reize, Reaktionen sowie deren Verbindun- fen. gen reduzierte (Sokolowski 2013, S. 126). Die nachfolgende Abbildung zeigt Pawlows Assoziative Lernpro- grundlegende Versuchsanordnung, die im Anschluss ausführlich erläutert wird. zesse Dieser Begriff meint das Lernen von Menschen und Tierendadurch, dass bestimmte Ereignisse gemeinsam auftreten. 15 Abbildung 1: Klassische Konditionierung Quelle: Erstellt im Auftrag der IU 2024 in Anlehnung an Pavlov 1927. 16 Wie auf der Abbildung zu sehen ist, (1) löst das Futter als unkonditionierter Reiz bzw. Sti- mulus (US) beim Hund automatisch Speichelfluss als eine natürliche und unkonditionierte Reaktion (Response, UR) aus. (2) Eine Glocke dient als neutraler Stimulus (NS), welcher vor der Konditionierung keine besondere Reaktion, sondern nur eine Orientierungsreaktion- verursacht. (3) Während der Konditionierung wird der neutrale Stimulus wiederholt mit dem Futter dargeboten. (4) Auf diese Weise wird infolge dieses Lernprozesses aus der Glo- cke als ursprünglich neutralem Stimulus ein konditionierter Stimulus (CS). Dieser führt als Ergebnis des Lernprozesses zu einer konditionierten Reaktion (CR), indem der Ton der Glo- cke (CS) ebenfalls in der Lage ist, beim Hund Speichelfluss zu erzeugen, auch wenn dieser ohne Futter dargeboten wird (vgl. Gerrig/Zimbardo 2008, S. 195ff.; Myers 2014, S. 292ff.; Koch/Stahl 2017, S. 323f.). Bei einer Konditionierung höherer Ordnung wird ein weiterer Konditionierung neutraler Stimulus, z. B. ein Lichtsignal, mit einem zuvor konditionierten Reiz (z. B. einem höherer Ordnung Hierbei wird der zuerst Glockenton) verbunden, der zumeist etwas schwächer ausfällt als die Konditionierung ers- konditionierte Reiz, z. B. ter Ordnung, aber durchaus in der Lage ist, den Speichelfluss des Hundes auszulösen. eine Glocke, was einer Konditionierung erster Ordnung entspricht, durch einen weiteren Reiz vorhergesagt, z. B. durch Licht, sodass dieser in der Lage ist, die konditio- nierte Reaktion ebenfalls auszulösen. 17 Abbildung 2: Reflexkette des klassischen Pawlowschen Hundeexperiments Quelle: Erstellt im Auftrag der IU 2024 in Anlehnung an Pavlov 1927. Die Abbildung veranschaulicht nochmals den Ablauf des Erwerbs der konditionierten Reaktion in dem zuvor beschriebenen Pawlowschen Experiment. 18 Prinzipien der klassischen Konditionierung Nach Myers ermittelten Pawlow und seine Kollegen in ihrer weiteren Forschung insgesamt fünf wesentliche Konditionierungsprozesse: Erwerb, Löschung, Spontanerholung, Reizdis- krimination und Reizgeneralisierung.Diese werden im Folgenden im Mittelpunkt des Inter- esses stehen (Myers 2014, S. 294ff.). Erwerb, Löschung und Spontanerholung Im Konditionierungsprozess spielt nach Koch und Stahl (2017) beim Erwerb der kondition- ierten Reaktion die Kontiguität eine entscheidende Rolle. Hiermit ist die räumlich-zeitli- Kontiguität che Nähe zwischen der Präsentation eines konditionierten Reizes und des unkonditionier- Dies ist die räumlich, zeit- liche Nachbarschaft von ten Reizes gemeint. Am effektivsten ist es, wenn der konditionierte Stimulus in einem Reizen und Reaktionen. zeitlichen Intervall von 250 bis 2.500 ms vor dem US dargeboten wird, während die simul- tane Darbietung nicht so effektiv ist. Die Wahrscheinlichkeit für eine konditionierte Reak- tion steigt zudem mit der Anzahl der CS-US-Paarungen sowie der Intensität des unkonditi- onierten Stimulus. Hierbei gilt der Grundsatz, je stärker der Stimulus (US), desto schneller erfolgt die konditionierte Reaktion (Koch/Stahl 2017, S. 320ff.). Die Wahrscheinlichkeit der konditionierten Reaktion nimmt ab, wenn der unkonditionierte Stimulus über einen längeren Zeitraum nicht mehr dem konditionierten Stimulus folgt, was als Löschung oder Extinktion bezeichnet wird (ebd., S. 328f.). Allerdings gibt es auch Hinweise dafür, dass die konditionierte Reaktion nicht wirklich verlernt wurde, sondern eine Spontanerholung der gelöschten Reaktion dazu führt, dass diese nach einem gewis- sen Zeitraum wieder auftritt (vgl. Pavlov 1927, S. 48ff. [pdf-Version]). Dies kann als Hinweis darauf gedeutet werden, dass sie möglicherweise nicht wirklich verlernt, sondern nur abgeschwächt wurde oder im Zeitraum der Löschung eine andere Reaktion erlernt wurde, die sie überlagerte und ihren Abruf verhinderte. Wird Letztere nach einer längeren Zeit ver- gessen, kann es geschehen, dass die ursprüngliche CR wieder auftritt (Koch/Stahl 2017, S. 329). Ein Umgebungswechsel kann ebenfalls dazu führen, dass sie wiederhergestellt wird (vgl. Bouton 1993, S. 88f.). Laut Koch und Stahl werden bei der konditionierten Inhibition (Hemmung) zwei konditio- nierte Stimuli dargeboten, bei welchen der erste positiv und der zweite negativ mit dem unkonditionierten Stimulus assoziiert ist. Versuchsdurchgänge, bei denen der CS1 (z. B. Ton) den US (z. B. Stromschlag) ankündigt, wechseln sich hierbei mit solchen ab, in denen der Ton (CS1) mit Licht (CS2) gemeinsam dargeboten wird, ohne von dem Stromschlag (US) gefolgt zu werden (Koch/Stahl 2017, S. 335f.). Die Durchgänge mit den zu befürchten- den aversiven Konsequenzen führten in einem Experiment von Zimmer-Hart und Rescorla anfangs zwar zu einer konditionierten Reaktion, allerdings lernten die Tiere sehr schnell, dass die Kombination der beiden Reize zu einem Ausbleiben des Stromschlags führte, sodass die Reaktion auf die gekoppelte Darbietung im Laufe der Zeit völlig verschwand (Zimmer-Hart/Rescorla 1974, zit. n. Koch/Stahl 2017, S. 335). Eine Spontanremission unterscheidet sich laut Bodenmann/Perrez/Schär von der sponta- nen Erholung darin, dass es bei vielen psychischen Erkrankungen zu einer Besserung kommt, ohne dass eine therapeutische Intervention erfolgt wäre. Die Autoren nennen bei- spielhaft die Erfahrung einer Person, die von einem Hund gebissen wurde, aber durch 19 ihren weiteren Kontakt zu Hunden die Erfahrung macht, dass diese sie nicht beißen. Hier- durch wird die ursprüngliche Lernerfahrung der Person gelöscht und sie kann wieder angstfrei mit Hunden umgehen (Bodenmann/Perrez/Schär 2011, S. 68f.). Die nachfolgende Abbildung dient zur Veranschaulichung des Gesagten. Abbildung 3: Erwerb, Löschung und Spontanerholung beim klassischen Konditionieren Quelle: Erstellt im Auftrag der IU 2024. Die Abbildung zeigt die Prozesse des Erwerbs, der Löschung und der Spontanerholung beim klassischen Konditionieren. Beim Erwerb weist der steile Anstieg der Kurve auf die schneller stärker werdende CR hin, bei der wiederholten gemeinsamen Darbietung von US und NS, wobei sich Letzterer zu einem CS entwickelt (vgl. ebd., S. 294ff.). In der anschließ- enden Löschungsphase schwächt sich die CR ab, sobald der CS alleine angeboten wird, um schließlich auf null zu fallen (vgl. Gerrig/Zimbardo 2008, S. 198f.). Nach einer Pause kann es zu einer Spontanerholung kommen, bei der die CR jedoch nicht so stark ausge- prägt ist wie in der Phase des Erwerbs, wodurch sie dann ebenfalls in der Löschung enden kann (Myers 2014, S. 296). 20 Kontingenz Neben der Kontiguität spielt laut Kiesel und Koch insbesondere die Kontingenz eine zent- rale Rolle in einem erfolgreichen Lernprozess. Hiermit ist die Qualität gemeint, mit der ein CS den US vorhersagen kann – je zuverlässiger dessen Vorhersage, desto größer ist die Stärke des Lernens (vgl. Kiesel/Koch 2012, S. 43). Deren Bedeutung soll am Beispiel eines Experiments von Robert Rescorla veranschaulicht werden. In diesem Experiment wurden die Hunde in drei Gruppen eingeteilt, die jeweils unterschiedliche Arten Pawlowscher Angstkonditionierung erhielten. Eine Gruppe (R) erhielt den CS (Ton) und US (elektrischer Schock) zufällig und unabhängig voneinander, während bei der zweiten Gruppe (P) der CS das Auftreten des US vorhersagte und bei der dritten Gruppe (N) sagte der CS dessen Abwesenheit voraus. Die Hunde waren während des Experiments in einer sogenannten Shuttlebox untergebracht, die mittels einer Barriere in zwei Hälften geteilt war. Die eine Hälfte enthielt ein metallenes Bodengitter, mit dem der elektrische Schock verabreicht wurde, der durch das Überspringen der Barriere in die zweite Hälfte der Box von den Hun- den vermieden werden konnte. Das Ergebnis dieses Experiments bestand laut Rescorla darin, dass in den beiden Gruppen (P und N), bei denen die An- bzw. Abwesenheit des US durch den CS zuverlässig vorhergesagt wurde, das Vermeidungsverhalten der Hunde erhöht bzw. vermindert wurde, während bei der Gruppe (R), bei der CS und US unabhän- gig voneinander während der Konditionierungsphase auftraten, kein Effekt feststellbar war, trotz gleicher Anzahl an CS-US-Paarungen wie in Gruppe (P). Rescorla konnte somit belegen, dass die Stärke der Kontingenz zwischen CS und US einen maßgeblichen Einfluss auf die Angstreaktion hatte, indem diese gefördert oder unterdrückt wurde (Rescorla 1966, S. 383f.). Die nachfolgende Abbildung zeigt eine Gegenüberstellung der Reaktionen von Hunden der Gruppe (P) mit den Reaktionen der Gruppe (R) des oben geschilderten Experiments von Rescorla (1966). 21 Abbildung 4: Die Rolle der Kontingenz beim klassischen Konditionieren Quelle: Erstellt im Auftrag der IU 2024 in Anlehnung an Gerrig/Zimbardo 2008, S. 201. Die Abbildung zeigt, wie sich beide Gruppen voneinander unterscheiden. So ist deutlich zu erkennen, dass Hunde der Gruppe (P), die unter der Kontingenzbedingung konditioniert wurden, im Durchschnitt häufiger über die Barriere sprangen, was an dem sprunghaften Anstieg der roten Kurve bei einem einsetzenden und konditionierten Stimulus zu erken- prä und post nen ist. Ebenso zeigt die Abbildung, dass die meisten Hunde dieser Gruppe kurz vor (prä- Sowohl prä als auch post CS) oder innerhalb der ersten fünf Sekunden reagierten. Danach sinkt die Kurve stetig mit sind lateinische Vorsilben und gleichbedeutend mit einem erneuten Anstieg in der Zeit nach der letzten Tondarbietung (post-CS). Bei Hunden vorher und nachher. der Gruppe (R), bei der CS und US in der Konditionierungsphase zwar mit zeitlicher Konti- guität, aber zufällig und somit nicht kontingent dargeboten wurden, hatte der Ton eine vergleichsweise nur geringe Wirkung, erkennbar an der blauen, flachen Kurve (vgl. Res- corla 1966, S. 383f.; Gerrig/Zimbardo 2008, S. 200f.). 22 Reizgeneralisierung und -diskrimination Unter Reizgeneralisierung wird die Tendenz verstanden, nach der Konditionierung einer Reaktion auf Reize, die dem konditionierten Stimulus ähneln, mit einer ähnlichen Reak- tion zu antworten (Myers 2014, S. 296f.). Dies hat im Alltag durchaus wünschenswerte Effekte. Wenn Kinder es nicht nur vermeiden, heiße Herdplatten zu berühren, sondern auch heiße Bügeleisen, führt diese Generalisierung zu einem angemessenen Verhalten. Eine Einzelfallstudie von Watson und Rayner mit einem neun Monate alten Kind, die als Fall des kleinen Albert bekannt wurde, ist ein weiteres Beispiel für die Reizgeneralisierung. Das Ziel der beiden Forscher war es, zu untersuchen, ob es möglich ist, Angst vor einem Tier zu konditionieren und diese auf andere Tiere und Objekte zu generalisieren. Zu Beginn der Studie wurde Albert mit unterschiedlichen Tieren, z. B. Hasen und Hunden, sowie mit Gegenständen, z. B. mit Masken oder Baumwolle, konfrontiert, ohne hierbei Angst zu zeigen. Während der Konditionierung präsentierten die Forscher in mehreren Durchgängen eine Ratte als NS und schlugen in dem Moment, in dem Albert die Ratte berühren wollte, hinter seinem Kopf mit einem Hammer auf eine Stahlstange, was den US symbolisiert. Das laute Geräusch führte zu einer zunächst unkonditionierten Schreckreak- tion (UR) des Kindes. Das aus heutiger Sicht ethisch bedenkliche Experiment sorgte dafür, dass der kleine Albert zuletzt Angst vor allem hatte, das pelzig war. Dies betraf die präsen- tierten Tiere (Hase, Ratte und Hund) ebenso wie den Pelzmantel und die Nikolausmaske, auf die er zuletzt mit Abwenden, Schreien und Wimmern reagierte. Watson und Rayner kamen zu dem Schluss, dass emotionale Probleme – wie beispielsweise Phobien – auf sol- Phobie che frühkindlichen Lernerfahrungen zurückzuführen sein können (Watson/Rayner 1920, „Eine beständige und irra- tionale Angst vor S. 1ff.). Die nachfolgende Abbildung zeigt den Ablauf des Konditionierungsprozesses des bestimmten Objekten, zuvor beschriebenen Experiments. Aktivitäten oder Situatio- nen, die angesichts der tatsächlichen Bedrohung stark übertrieben und unbegründet ist“ (Gerrig/ Zimbardo 2008, S. 740). 23 Abbildung 5: Reizgeneralisierung am Fallbeispiel des kleinen Albert Quelle: Erstellt im Auftrag der IU 2024 in Anlehnung an Watson/Rayner 1920. Ein gegenläufiger Prozess hierzu ist die Reizdiskrimination, die wie folgt definiert ist: „Reiz- diskrimination ist die erlernte Fähigkeit, zwischen einem konditionierten Reiz (der auf den bevorstehenden US hinweist) und anderen, irrelevanten Reizen zu unterscheiden“ (Myers 2014, S. 298). Würden wir permanent auf alle möglichen Reize reagieren, unabhängig von ihrer Relevanz, wäre das für uns sehr zeit- und energieaufwändig und würde auf Kosten unserer Handlungsfähigkeit gehen. Gerrig und Zimbardo (2008) betonen daher die zent- rale Bedeutung, die das Gleichgewicht von Reizgeneralisierung und -diskrimination für die Funktions- und Anpassungsfähigkeit eines Organismus hat. Durch diverse Lernerfahrun- gen ist dieser immer besser in der Lage, zwischen Reizen sowohl zu differenzieren als auch auf ähnliche Reize zu generalisieren, wodurch seine Fähigkeit, bestimmte Ereignisse zutreffend vorherzusagen, um darauf angemessen reagieren zu können, optimiert wird (Gerrig/Zimbardo 2008, S. 200). Äquipotenzialität vs. Preparedness Die Annahme von Äquipotenzialität geht davon aus, dass alle Reize gleichermaßen kondi- tionierbar sind (vgl. Ehlers 2003, S. 75). Gemeinsam mit der Annahme, dass durch die Kon- tiguität von neutralem und unkonditioniertem Reiz der neutrale Reiz die Fähigkeit eines 24 konditionierten Reizes (CS) erwirbt, eine konditionierte Reaktion (CR) auszulösen, bildet sie das ursprüngliche Erklärungsmodell, durch das die Effekte der klassischen Konditio- nierung erklärt wurden (ebd.; vgl. Pauli/Rau/Birbaumer 2003, S. 97f.). Anders als ursprünglich angenommen, zeigt die aktuelle Forschung zum klassischen Kon- ditionieren laut Koch und Stahl jedoch auf, dass bestimmte Stimuli leichter mit einem unkonditionierten Reiz assoziiert werden können als andere. Dies kann als Beleg dafür gewertet werden, dass wir nicht ausschließlich aufgrund unserer Erfahrung lernen, son- dern dass die unterschiedliche Assoziierbarkeit von Stimuli auf der Grundlage von biologi- schen Prädispositionen erfolgt (Koch/Stahl 2017, S. 346). Hierbei werden solche Assoziati- onen priorisiert, die eine höhere biologische Relevanz besitzen, da sie eine bessere Anpassung der jeweiligen Spezies ermöglichen (vgl. Domjan 2005, S. 179). Ein Beispiel Spezies hierfür ist die Konditionierung in nur einem einzigen Lerndurchgang, bei dem Ratten in Eine Spezies ist eine bestimmte Art oder Sorte einem Experiment von Garcia und Koelling ein aromatisiertes Futter verabreicht wurde, einer Gattung. das sie besonders gerne fraßen. Im Anschluss wurden sie Röntgenstrahlen ausgesetzt, was bei ihnen Übelkeit und Magenbeschwerden verursachte und dazu führte, dass sie von da an das Futter mieden. Die beiden Forscher vermuteten, dass die natürliche Selektion sol- che Mechanismen bevorzugt, die gustatorische und olfaktorische Schlüsselreize mit inne- rem Unwohlsein assoziieren oder aus Sicht der Ratte: „It must have been something I ate“ (Garcia/Koelling 1966, S. 124). Sokolowski (2013) weist zudem darauf hin, dass solche Lernerfahrungen sehr löschungsre- sistent sind und Geschmacksaversionen auch bei einem Zeitabstand von mehreren Stun- den, die zwischen Reiz und Reaktion liegen, erworben werden können. Aus evolutionsbio- logischer Sicht sind eine ähnliche Sensibilität und Reaktionsbereitschaft auch für bestimmte angstauslösende Reize überlebensnotwendig, wie z. B. die Angst vor Spinnen, Schlangen oder Ratten, aber auch vor Abgründen oder hohen und engen Räumen (vgl. Sokolowski 2013, S. 134f.). Solche Reize verfügen über eine hohe Prepotency, da sie rela- Prepotency tiv einfach zu konditionieren sind und im Vergleich zu alltäglichen Gegenständen, als Reize Bestimmte Reize sind für bestimmte Spezies phylo- mit einer sehr geringen Prepotency, wie z. B. ein Staubsauger, deutlich weniger Lerndurch- genetisch bedeutsamer gänge oder sogar nur einen Lerndurchgang benötigen (Bodenmann/Perrez/Schär 2011, als andere Reize, verfügen S. 57). Unsere größere Bereitschaft, spezifische Reize (CS) mit phylogenetisch bedeutsa- damit über eine höhere Prepotency und sind für men Stimuli (UCS) bevorzugt zu verknüpfen, wird als Preparedness bezeichnet (ebd., die klassische Konditio- S. 55) — ein Begriff, der von Seligman (1970) geprägt wurde. Dieser ging in seiner Prepa- nierung besser geeignet. redness-Theorie davon aus, dass phobisches Vermeidungsverhalten einen hohen Grad Phobisches Vermei- an Preparedness aufweist, da es über ein limitiertes Set möglicher Objekte verfügt, dungsverhalten Dieser Begriff beschreibt zumeist in lediglich einem Durchgang erworben wird, nicht auf kognitiven Lernprozessen die Vermeidung bestimm- basiert und hoch resistent gegenüber Löschung ist. Ängste, die im Kontrast hierzu unter ter Objekte, Aktivitäten Laborbedingungen konditioniert werden, können demgegenüber durch eine nahezu unli- oder Situationen, auf- grund einer beständigen mitierte Anzahl neutraler Stimuli und – abhängig von ihrer jeweiligen Prepotency – in und irrationalen Angst, mehreren Lerndurchgängen erworben und vergleichsweise schnell wieder gelöscht wer- die im Hinblick auf die tatsächliche „Bedrohung den (vgl. Seligman 1971, S. 307). Der Unterschied zwischen Preparedness und Prepotency stark übertrieben und besteht darin, dass z. B. Schlangen zwar eine sehr hohe Prepotency aufweisen und bei unbegründet ist“ (Gerrig/ sehr vielen Menschen Angst auslösen, sich Menschen allerdings in Bezug auf ihre Prepa- Zimbardo 2008, S. 740). redness unterscheiden können. In Gegenden, in welchen Schlangen natürlicherweise vor- kommen, zeigen Menschen, die auf dem Land wohnen und mehr Kontakt zu Schlangen haben, deutlich weniger Ängstlichkeit gegenüber ungefährlichen Schlangen als Stadtbe- wohner (Bodenmann/Perrez/Schär 2011, S. 56). 25 Das Rescorla-Wagner-Modell Das Rescorla-Wagner-Modell wurde von den beiden Psychologen Robert A. Rescorla und Allan R. Wagner entwickelt und erstmals 1972 vorgestellt. Als mathematisches Modell, das mit lediglich einer Formel auskommt, ist es dennoch in der Lage, zahlreiche Phänomene zu erklären, die beim Konditionieren zu beobachten sind. Das Modell basiert auf der grundlegenden Annahme, dass klassisches Konditionieren nur bei einem unerwarteten Reiz möglich ist und hierbei die Stärke der Konditionierung davon abhängt, wie ausge- prägt die Überraschung war, als der Reiz eintrat (vgl. Kiesel/Koch 2012, S. 43ff.). Ferner wird angenommen, dass beim klassischen Konditionieren Assoziationen zwischen den Mentale Repräsentation mentalen Repräsentationen von CS und US gebildet werden (vgl. Koch/Stahl 2017, Hierunter wird eine geis- S. 340f.). Wie weiter oben berichtet, geht die Annahme mentaler Repräsentationen über tige Abbildung verstan- den, die wichtige Eigen- eine behavioristische Perspektive von Lernprozessen weit hinaus, da diese sich aus- schaften von Objekten schließlich auf messbare Reize, Reaktionen und deren Verbindungen konzentrierte und und Erfahrungen enthält. innere Vorgänge unbeachtet ließ (vgl. Sokolowski 2013, S. 126ff.). Rescorla und Wagner (1972) gehen demgegenüber entsprechend der zu ihrer Zeit gegebenen wissenschaftli- chen Erkenntnisse davon aus, dass die Stärke der CS-US-Assoziation bestimmt, inwieweit es dem CS möglich ist, die Repräsentation des unkonditionierten Reizes zu aktivieren und damit eine konditionierte Reaktion auszulösen (vgl. Koch/Stahl 2017, S. 340). Gemäß dem Assoziative Stärke Rescorla-Wagner-Modell lässt sich die Veränderung der assoziativen Stärke pro Lern- Hiermit ist das neuronale durchgang mit folgender Formel berechnen: Ausmaß der Verbindung zwischen zwei Ereignis- sen gemeint. ∆𝑉 = 𝛼· 𝛽· 𝜆−𝑉 Laut Horstmann und Dreisbach (2017) … steht ∆ 𝑉 für die Veränderung der Assoziationsstärke nach einem Lerndurchgang zwi- schen dem Reiz und einer Reaktion; 𝛼 für die Lernrate des CS, die angibt wie stark ein Organismus auf neue Informationen reagiert. Diese wird zwischen 0 und 1 angenommen; 𝛽 beschreibt die Salienz des Stimulus. Bestimmt also wie wichtig oder auffällig ein Sti- mulus ist; 𝜆 für die maximale Assoziationsstärke zwischen einem CS und einem US. In der Regel wird hierfür 1.0 angenommen und 𝑉 für die aktuelle Assoziationsstärke zwischen einem CS und einem US. Wenn noch keine Assoziation besteht, liegt sie bei 0. Die Formel besagt grundlegend, dass die Veränderung der Assoziationsstärke ∆ 𝑉 zwi- schen Reiz und Reaktion davon abhängt, wie unerwartet bzw. überraschend der Reiz ist (𝜆 − 𝑉 ), multipliziert mit der Lernrate 𝛼, und der Wichtigkeit 𝛽des Reizes. Die Assoziati- onsstärke wächst durch jeden Lerndurchgang. Am Anfang ist der Zuwachs an assoziativer Stärke besonders groß, da der US besonders überraschend ist bzw. V noch bei 0 liegt oder niedrig ist. Im Laufe der Lerndurchgänge nimmt die Überraschung und damit auch der Lernzuwachs ab. Eine weitere Besonderheit des Modells besteht darin, dass der US durch die Kombination von mehreren CS und der Summe ihrer gemeinsamen Assoziationsstär- ken vorhergesagt werden kann. Die CS konkurrieren hierbei allerdings miteinander, wodurch sich beispielsweise das Phänomen der Blockierung erklären lässt. Bei der Blo- ckierung wird ein neuer Stimulus nicht mehr erlernt, wenn er gleichzeitig mit einem frühe- 26 ren Stimulus (CS1) dargeboten wird, der den US bereits effektiv vorhersagt. Hierdurch bleibt für den zweiten Reiz nur wenig assoziative Stärke übrig und das Lernen der redun- danten neuen Assoziation zwischen CS2 und US wird blockiert (vgl. Horstmann/Dreisbach 2017, S. 37). Nach der Erörterung der theoretischen Hintergründe des klassischen Konditi- onierens steht in den folgenden beiden Abschnitten die Bedeutung assoziativer Lernvor- gänge für die Praxis im Vordergrund. Konditionierte physiologische Reaktionen bei Drogenkonsum Aus lerntheoretischer Sicht spielen in der Suchtentwicklung auf Basis des klassischen Konditionierens Lernprozesse eine Rolle, bei denen neutrale Reize (NS), wie z. B. die per- sönliche Umgebung des Drogenkonsumenten als äußerer Reiz, sowie innere Reize, wie beispielsweise Gefühle oder Erinnerungen an Konflikte, mit der Einnahme und Wirkung von Drogen (UCR) assoziiert werden und dann als konditionierte Reize (CS) das Drogenver- langen als CR auslösen (vgl. Berking/Rief 2002, S. 178f.). Etwas mysteriös erscheint der folgende Fall eines Drogentoten, der auf der Grundlage eines medizinischen Reports sowie den ergänzenden Informationen seiner ebenfalls dro- genabhängigen Freunde von Gerevich et al. wie folgt rekonstruiert wurde: BEISPIEL Entgegen seiner ursprünglichen Absicht und dem Versprechen an seine Frau, an diesem Tag auf Drogen zu verzichten, ging der junge Mann, der K. J. genannt wurde, auf dem Weg zur Arbeit zu einem Dealer und kaufte eine Dosis Heroin. Seine Freunde, die er im Anschluss traf, hatten am gleichen Tag bei demselben Dealer Heroin gekauft. Diese berichteten später, dass sich das Heroin in seiner Qualität nicht von dem Gewohnten unterschied. Statt wie sonst üblich nach Hause zu gehen, um das Heroin zu konsumieren, ging er auf eine öffentliche Toi- lette, wo er sich die gleiche Menge injizierte, wie auch am vorangegangenen Tag am vertrauten Ort zu Hause bei seiner Frau. Der laut seinem Arzt ansonsten gesunde junge Mann verstarb. Die anschließende Autopsie ergab, dass die Kon- zentration von Heroin im Blut des Verstorbenen seiner üblichen Dosis entsprach. Weitere Substanzen, wie z. B. Alkohol oder andere Drogen, konnten ebenfalls nicht gefunden werden. Als Todesursache wurde dennoch eine Überdosis Heroin angegeben (eigene Übersetzung von Gerevich et al. 2005, S. 2). Betrachtet man die berichteten Fakten, erscheint eine Überdosis Heroin als Todesursache zweifelhaft zu sein, sodass sich die Frage stellt, was stattdessen zum Tod des jungen Man- nes geführt haben könnte. Der kanadische Psychologe Shepard Siegel verweist in diesem Zusammenhang auf ein Modell, das auf Pawlows Annahme beruht, dass Drogenkonsum zu einem Konditionie- rungsprozess führt (Siegel 1984, S. 428ff.; Pavlov 1927, S. 36f. [pdf-Version]). Bei diesem Lernprozess besteht der konditionierte Reiz aus Schlüsselreizen der Umwelt, die zum Zeit- 27 punkt des Konsums präsent sind, und aus einem unkonditionierten Stimulus, der auf den physiologischen Effekten der Droge basiert. Laut Siegel führt der wiederholte Drogenkon- sum in einer gewohnten Umgebung dazu, dass sich eine Assoziation zwischen den dort gegebenen Schlüsselreizen und den physiologischen Effekten der Droge entwickelt und diese analog zu der Glocke in Pawlows Experiment die drogenbasierte Stimulation zuver- lässig vorhersagen (Siegel 1984, S. 428ff.). Da der Körper stets bestrebt ist, ein inneres Gleichgewicht (Homöostase) zu erhalten, reagiert dieser mit Gegenmaßnahmen, indem er in der vertrauten Umgebung die Wirkung der Droge kompensiert (Gerrig/Zimbardo 2008, S. 204). Diese Anpassung der Botenstoffe im Gehirn wird auch als „Neuroadaptation“ (Myers 2014, S. 119) bezeichnet. In dem Maß, in dem sich auf diese Weise eine zuneh- mende Toleranz gegenüber der Droge entwickelt, muss der Drogenkonsum stetig erhöht werden, um auch weiterhin in der vertrauten Umwelt den gewünschten Effekt zu erzielen (Siegel 1984, S. 429; Gerrig/Zimbardo 2008, S. 204). Auf Basis dieses Modells lässt sich nach Siegel erklären, dass in einer fremden Umgebung, die nicht mit der Droge assoziiert ist, die Toleranz vermindert ist. Aufgrund der fehlenden Vorhersage der drogenbasierten Stimulation durch die Schlüsselreize ist es möglich, dass die in der vertrauten Umgebung gewohnheitsmäßig konsumierte Menge der Droge zu einer Überdosierung in der unge- Toleranz wohnten Umgebung führt (vgl. Siegel 2005, S. 296ff.). Die Annahme, dass Toleranz situati- In der Pharmakologie onsspezifisch ist, konnte sowohl durch Tierversuche als auch durch Interviews mit Dro- bezeichnet Toleranz die Gewöhnung an einen gensüchtigen, die beinahe an einer Überdosis gestorben wären, bestätigt werden (vgl. Wirkstoff, sodass die Wir- Siegel 2005; 2016). kung im Organismus nachlässt. Die Konditionierung von Immunreaktionen Wie bereits beschrieben, reagieren Organismen sehr empfindlich, wenn sie die Erfahrung machen, ihr Essen sei ungenießbar (vgl. Garcia/Koelling 1966, S. 334f.). So ist die Konditio- nierung einer Geschmacksaversion auch noch nach Stunden, die zwischen Reiz und Reak- tion liegen, möglich (Sokolowski 2013, S. 134). Immunsuppression Die Annahme, dass es ebenfalls möglich sein könnte, eine Immunsuppression zu konditi- Hierunter wird die Unter- onieren, entstand in einer Versuchsreihe von Ader und Cohen, in der Ratten in nur einem drückung der körpereige- nen Abwehr verstanden. Durchgang eine Geschmacksaversion gegenüber einer Trinklösung entwickelten, die zu vorübergehendem Unwohlsein führte. Hierbei wurde bei den Ratten eine Geschmacks- aversion gegen eine süß schmeckende Saccharin-Lösung durch deren Kombination mit einer einmaligen Injektion von Cyclophosphamid (CY), einer Substanz mit immunsuppres- siver Wirkung, konditioniert (vgl. Ader/Cohen 1975, S. 334f.). Abhängig von der konsumier- ten Menge der Saccharin-Lösung am Tag der Konditionierung, war diese Aversion mehr oder weniger ausgeprägt und entsprechend resistent gegen Löschung. Zudem schien es einen direkten Zusammenhang zwischen der konsumierten Lösungsmenge und der Sterb- lichkeitsrate der Ratten zu geben, woraufhin Ader und Cohen annahmen, dass die Paarung von Saccharin mit dem immunsuppressiv wirkendem Cyclophosphamid (CY) zu einer kon- ditionierten Unterdrückung der Immunreaktion geführt hatte. Hierdurch wurden die Rat- ten krankheitsanfälliger und einige verstarben sogar. In einem Experiment belegten Ader und Cohen diese Annahme, indem sie Ratten drei Tage nach ihrer Konditionierung mit CY ein Fremdeiweiß (Antigen) injizierten, wodurch im Allgemeinen der Körper im Rahmen der Immunreaktion zur Bildung von Antikörpern angeregt wird, deren Anstieg im Blut nach- gewiesen werden kann. Erfolgt kein Anstieg des Antikörperspiegels im Blut, weist dies auf eine Immunsuppression hin. Abhängig von der im Anschluss an die Konditionierung fol- 28 genden Versuchsbedingung, erbrachte die abschließende Blutuntersuchung laut Ader und Antikörper Cohen folgende Ergebnisse: Bei Ratten, die nach der Injektion des Antigens statt einer Sac- Dies sind große Eiweiß- körper, die als Teil der charin-Lösung Wasser erhalten hatten, sowie bei Ratten, die im Vorfeld der Injektion nicht körpereigenen Immunab- konditioniert waren, wurde ein hoher Antikörperspiegel nachgewiesen. Am höchsten war wehr spezifische Antigene der Antikörperspiegel bei der Placebogruppe, der während der Konditionierungsphase im erkennen. Placebo Vorfeld der Injektion des Antigens statt CY eine neutrale Kochsalzlösung injiziert wurde. In Ein Placebo ist kein Arz- dem Blut von Ratten, die zum Zeitpunkt der Injektion des Antigens oder kurz danach eine neimittel im eigentlichen Saccharin-Lösung erhalten hatten, waren hingegen keine Antikörper nachweisbar. Die Sinne, weil es keinen Wirkstoff enthält, aber es Konditionierung mit CY hatte bei ihnen zu einer kompletten Immunsuppression geführt sieht wie ein Medikament (vgl. ebd., S. 333ff.). aus. Diese Studie regte weitere Forschung an und führte zur Entwicklung der Psychoneuroim- munologie, ein Begriff, der von Robert Ader 1980 geprägt wurde (vgl. Gerrig/Zimbardo 2008, S. 494; Tewes 2019). Dieses interdisziplinäre und mittlerweile etablierte Forschungs- gebiet beschäftigt sich mit der Fragestellung, inwieweit die Regulation unseres Immunsys- tems autonom ist oder ob es, über unser Nerven- und Hormonsystem vermittelt, durch unser Erleben und Verhalten beeinflusst wird. Ein Team des Universitätsklinikums in Essen konnte beispielsweise belegen, dass eine Immunsuppression auch bei Menschen konditi- onierbar ist. Aktuelle Forschungsvorhaben untersuchen z. B., welche Rolle der konditio- nierte Placeboeffekt und kognitive Faktoren bei Reaktionen des Immunsystems von gesunden Personen sowie Patienten mit einer Nierentransplantation spielen (vgl. Univer- sitätsklinikum Essen 2019). Abschließend zu diesem Lernzyklus soll eine Studie von Vits et al. (2013) vorgestellt wer- den, die untersuchte, inwieweit neuropsychologische Mechanismen Placeboeffekte erklä- ren können, die im Zusammenhang mit Allergien beobachtet wurden. In dieser Studie wurden Patienten mit einem chronischen Schnupfen aufgrund ihrer Allergie gegen Haus- staubmilben in folgende drei Gruppen aufgeteilt: Die Experimentalgruppe bekam während der Konditionierungsphase ein neuartig Experimentalgruppe schmeckendes Getränk sowie ein Antihistaminikum über einen Zeitraum von fünf In einem Experiment wird bei dieser Gruppe die Tagen. Behandlung tatsächlich Die Placebogruppe erhielt das Getränk und ein Placebopräparat. durchgeführt, im Gegen- Die Kontrollgruppe bekam keinerlei Stimuli. satz zur Kontrollgruppe, die nicht behandelt wird. Antihistaminikum Sowohl Experimental- als auch Placebogruppe erhielten die Information, dass sie in dieser Dies ist ein Medikament, Studie eine 50-prozentige Chance haben, entweder das Medikament oder ein Placebo zu das allergische Reaktio- bekommen. Der Kontrollgruppe wurde gesagt, dass es das Ziel der Studie sei, die Stabili- nen vermindert. tät der allergischen Reaktion im Zeitverlauf zu beobachten. Bei allen drei Gruppen sollte der sogenannte Prick-Test (vgl. Helmholtz-Zentrum München 2019) Aufschluss über das Prick-Test Ausmaß der allergischen Reaktion geben. Nach neun Tagen ohne Behandlung wurde Ein Hauttest, der bei aller- gischen Reaktionen zu sowohl den Patienten der Experimental- als auch der Placebogruppe das aromatisierte Rötungen und zur Bildung Getränk und ein Placebo verabreicht, während die Kontrollgruppe keine Stimuli bekam. von Quaddeln am Unter- Das Ergebnis der Studie zeigte, dass infolge der Konditionierung sowohl in der Experimen- arm führt. tal- als auch in der Placebogruppe die Größe der Quaddeln signifikant vermindert war sowie ein deutlicher Rückgang der Symptome bei beiden Gruppen verzeichnet werden konnte, im Vergleich zur Kontrollgruppe. Die Autoren kamen zu dem Schluss, dass sowohl die Konditionierung als auch die kognitive Erwartung der Patienten zu diesem Ergebnis geführt hatten. Die Studie kann somit als Basis für die zukünftige systematische Erfor- 29 schung von Placeboeffekten in Kombination mit einer medikamentösen Therapie dienen und damit zu einem gesteigerten Wohlbefinden von Patienten beitragen (vgl. Vits et al. 2013). Im nachfolgenden Lernzyklus wird eine weitere Form assoziativen Lernens vorge- stellt. 1.3 Instrumentelles Lernen und operantes Konditionieren Wir wollen unsere Jacke ausziehen, aber der Reißverschluss hat sich verhakt. Zuerst zie- hen wir ihn nach oben, dann nach unten und sehen schließlich nach, ob vielleicht der Stoff der Jacke eingeklemmt ist. Das Herausziehen des Futters führt zum Erfolg und der Reißverschluss lässt sich wieder bewegen. Das merken wir uns für das nächste Mal, wenn der Reißverschluss mal wieder klemmt. Auf diese Weise wird unser zukünftiges Verhalten von dem Erfolg oder Misserfolg unseres aktuellen Tuns bestimmt und geformt. Thorndike Edward Lee Thorndike (1874–1949) war ein wichtiger Vertreter des amerikanischen Beha- viorismus (Sokolowski 2013, S. 135). Sein Interesse galt weniger den einfachen Reiz-Reak- tions-Zusammenhängen des klassischen Konditionierens, er war stattdessen an komple- xeren Verhaltensweisen interessiert (vgl. ebd., S. 99f.). Das aus seiner Forschung hervorgegangene theoretische Modell steht in diesem Abschnitt ebenso im Fokus des Interesses wie auch hierauf basierende, weitere Forschungsarbeiten. Lernen durch Versuch und Irrtum Bereits 1911 führte Thorndike experimentelle Studien mit Katzen durch (vgl. Kiesel/Koch 2012, S. 13). Hierzu hatte er einen sogenannten Problemkäfig (Puzzle-Box) entwickelt, in dem die Katzen eingesperrt waren (Myers 2014, S. 300). Anfangs öffnete sich die Tür bei den impulsiven Versuchen der Katzen, dem Käfig zu entkommen, rein zufällig. Je öfter in den Versuchsdurchgängen ein bestimmtes Verhalten zum Öffnen der Käfigtür führte, desto häufiger wurde dieses Verhalten gezeigt (Gerrig/Zimbardo 2008, S. 206). Die fol- gende Abbildung zeigt, wie die Reaktionszeit, welche die Katze braucht, um die Tür der Puzzle-Box durch das Drücken eines Hebels zu öffnen, mit der Anzahl der Lerndurchgänge abnimmt. 30 Abbildung 6: Thorndikes Puzzle-Box Quelle: Erstellt im Auftrag der IU 2024 in Anlehnung an Thorndike 1898, S. 8, zitiert nach Chance 1999. Die Katzen hatten also schrittweise auf der Basis von Versuch und Irrtum gelernt, welche Reaktion (Hebel drücken) dazu führte, der unerwünschten Umgebung (Stimulus) zu ent- kommen, um zu dem gewünschten Ergebnis (Freiheit) zu gelangen. Das Gesetz des Effekts Thorndike bezeichnete den beschriebenen Zusammenhang von Verhalten und Konse- quenzen als Gesetz des Effekts (Law of Effect), welcher darin besteht, dass Verhalten, das zu gewünschten Konsequenzen führt, öfter gezeigt und im Zeitverlauf zu dominierendem Verhalten wird. Den Lernprozess bezeichnete Thorndike als „stamping in“ (Skinner 1953, S. 61), was etwa so viel wie einstanzen bedeutet. Unerwünschte Konsequenzen führen hingegen dazu, dass die Wahrscheinlichkeit des Auftretens eines bestimmten Verhaltens abnimmt (Gerrig/Zimbardo 2008, S. 209). Methoden zum operanten Konditionieren B. F. Skinner griff Thorndikes Ansatz in einem eigenen Forschungsprogramm auf. Das Ziel bestand darin, die zugrundeliegenden Prinzipien der Verhaltenssteuerung zu erforschen, wobei Skinner jedoch bezweifelte, dass Lernkurven hierzu in der Lage sein würden (vgl. Skinner 1953, S. 59f.). Er differenzierte zwischen dem durch klassische Konditionierung erworbenen respondenten Verhalten als Reaktion auf einen Reiz und dem operanten Verhalten, infolge einer operanten Konditionierung (Koch/Stahl 2017, S. 324f.). Skinner (1953) definierte operantes Verhalten wie folgt: „The term emphasizes the fact that the behavior operates upon the environment to generate consequences“ (S. 65). Als operant 31 Respondentes Verhalten gilt ein Verhalten also dann, wenn die Handlung einen operativen Eingriff in die Umwelt Skinner verstand darun- darstellt, um damit die gewünschten Konsequenzen herbeizuführen (vgl. ebd.). Auf diese ter die Reaktion als Ant- wortverhalten auf einen Weise werden bei der operanten bzw. instrumentellen Konditionierung Assoziationen zwi- klassisch konditionierten schen dem persönlichen Verhalten und den nachfolgenden Konsequenzen gebildet (Myers Reiz (lat. respondere = 2014, S. 301). Wird beispielsweise das rücksichtsvolle Verhalten eines Kindes von seinen antworten). Operantes Verhalten Eltern mit der erhofften Bestätigung und Zuwendung beantwortet und auf diese Weise Dieser Begriff bezeichnet verstärkt, wird es dieses Verhalten künftig vermutlich öfter zeigen. „Operantes Konditio- ein Verhalten, das auf nieren verändert somit die Wahrscheinlichkeit unterschiedlicher Arten operanten Verhal- Assoziationen zwischen persönlichem Verhalten tens als Funktion der Umweltkonsequenzen, die das jeweilige Verhalten produziert“ und den hieraus resultier- (Gerrig/Zimbardo 2008, S. 208). enden Konsequenzen basiert. Abbildung 7: Skinner-Box Quelle: Erstellt im Auftrag der IU 2024 in Anlehnung an Skinner 1999, S. 630. Die obige Grafik zeigt die sogenannte Skinner-Box, die Skinner speziell für sein For- schungsvorhaben entwickelte (Skinner 1953, S. 57). Diese wurde in zahlreichen, unter- schiedlichen Versuchsanordnungen genutzt, z. B. wurden Ratten, die sich in der Box befanden, bei Drücken eines Hebels mit Futter oder Wasser belohnt. Die Häufigkeit, mit der dies geschah, wurde durch ein Messinstrument aufgezeichnet, welches sich außerhalb des Käfigs befand (Myers 2014, S. 300f.). Wie beim klassischen Konditionieren ist auch bei der operanten Konditionierung die Kontingenz der Verstärkung von großer Bedeutung, da zwischen der Reaktion (z. B. Betätigen des Hebels durch die Ratte) und den hieraus resul- tierenden Konsequenzen (z. B. Futtergabe) eine zuverlässige Beziehung bestehen muss, nicht aber bei einer anderen Reaktion des Tiers. Im assoziativen Lernprozess dienen spezi- fische Reize in einer bestimmten Situation als diskriminative Hinweisreize, wie beispiels- weise eine grüne Ampel das Verhalten verstärkt, gehen zu dürfen, während eine rote Fuß- gängerampel darauf hinweist, stehen zu bleiben, um nicht überfahren zu werden. Skinner bezeichnete die Beziehung zwischen einem diskriminativen Hinweisreiz, dem Verhalten 32 und der Konsequenz als Dreifachkontingenz und war davon überzeugt, dass hierdurch Diskriminative Hinweis- menschliches Verhalten größtenteils erklärt werden kann (Gerrig/Zimbardo 2008, reize Das sind Stimuli, die S. 208ff.). zuverlässig vorhersagen, wann ein bestimmtes Ver- Verschiedene Arten von Verstärkung halten (positiv oder nega- tiv) verstärkt wird. Dreifachkontingen In diesem Abschnitt stehen die Merkmale und Wirkungen von Verstärkern, positive und Diese ist die Lernerfah- negative Arten der Verstärkung sowie unterschiedliche Verstärkerpläne im Zentrum des rung, dass das Verhalten bei einem spezifischen, Interesses. aber nicht bei einem anderen Reiz mit hoher Merkmale und Wirkung von Verstärkern Wahrscheinlichkeit einen bestimmten Effekt auf die Umwelt hat. Zunächst lassen sich laut Myers (2014) primäre und sekundäre oder auch konditionierte Verstärker unterscheiden. Primäre Verstärker sind solche, die ungelernt sind und unsere Primäre Verstärker biologischen Bedürfnisse befriedigen, wie z. B. etwas zu trinken zu bekommen, wenn man Sie befriedigen unsere Grundbedürfnisse und Durst hat. Sekundäre Verstärker sind konditioniert und wirken durch ihre Kopplung mit müssen nicht erlernt wer- einem primären Verstärker, wie z. B. Geld, Lob oder Anerkennung, wenn wir diese mit den. Belohnung assoziieren. Wenn also biologische Bedürfnisse wie Essen durch mehr Geld Sekundäre Verstärker Sie wirken durch ihre Ver- befriedigt werden können, ist Geld ein sekundärer Verstärker, der mit dem primären Ver- bindung mit primären stärker (Essen) gekoppelt wurde. Grundsätzlich sind Menschen (anders als Ratten) auch Verstärkern und sind dazu in der Lage, unmittelbare Belohnungen zugunsten zeitverzögerter Belohnungen auf- erlernt. zuschieben, wie z. B. den Kinobesuch für die Zeit nach der Prüfung aufzuheben, dies wird als Belohnungs- bzw. Gratifikationsaufschub (engl. Delay of Gratificaton) bezeichnet, ein Begriff der von Walter Mischel et al. (1989) geprägt wurde (Myers 2014, S. 303f.). Was als Verstärker dienen kann, ist somit abhängig von dem jeweiligen Organismus und den Umweltbedingungen (vgl. Myers 2014, S. 304). Als Verstärker kann jeder Reiz fungie- ren, der die Wahrscheinlichkeit des Verhaltens durch seine kontingente Darbietung erhöht. Zum Beispiel kann die Aussicht auf ein Bad im See an einem heißen Sommertag eine willkommene Abkühlung versprechen, während die gleiche Aktion im Winter durch- aus verzichtbar ist. Für jemanden, der Schwimmen grundsätzlich nicht mag, würde die gleiche Situation, unabhängig von der Jahreszeit, möglicherweise kein positiver Verstär- ker sein. Wie das Beispiel zeigt, können Reize daher abhängig vom jeweiligen Individuum und der Situation als positiv, negativ oder neutral bewertet werden (Gerrig/Zimbardo 2008, S. 208f.). Positive und negative Verstärker Die bisherigen Beispiele zum operanten Konditionieren zeichneten sich dadurch aus, dass bei ihnen überwiegend positive Verstärker eingesetzt wurden. Bei der positiven Verstär- kung wird das Verhalten durch einen angenehmen Reiz bekräftigt (vgl. Myers 2014, S. 302). Demgegenüber ist die negative Verstärkung dadurch gekennzeichnet, dass ein unange- nehmer Reiz vermindert oder entfernt wird. Hierzu ein Beispiel aus der Forschung: In Skin- ners Versuchsreihe konnte das Bodengitter unter Strom gesetzt werden, was von der Ratte durch Drücken des Hebels aktiv beendet werden konnte (vgl. Koch/Stahl 2017, S. 325). Ein Alltagsbeispiel hierzu wäre das Schließen des Fensters bei lauten Bauarbeiten vor dem 33 Haus. Da dies vermutlich zu einer deutlichen Reduktion des Baulärms führen wird, ist es sehr wahrscheinlich, dass dieses Verhalten zukünftig in ähnlichen Situationen erneut angewandt wird. Negative Verstärkung vs. Bestrafung Von der negativen Verstärkung deutlich unterschieden werden, muss die Bestrafung, deren Ziel es ist, Verhalten zu vermindern oder zu unterbinden, statt es zu verstärken (vgl. Myers 2014, S. 306f.; Koch/Stahl 2017, S. 325). Laut Gerrig und Zimbardo (2008) ist ein Bestrafungsreiz „jeder Stimulus, der – wird er kontingent zu einer Reaktion dargeboten – die Wahrscheinlichkeit dieser Reaktion im Laufe der Zeit senkt“ (S. 209). Bei der Bestra- fung kann wie bei der Verstärkung zwischen positiver und negativer Bestrafung unter- Positive Bestrafung schieden werden. Bei der positiven Bestrafung wird ein unangenehmer Reiz als Folge Auf ein Verhalten hin wird eines Verhaltens verabreicht. Ein Alltagsbeispiel ist der Schmerz, der beim Anfassen eines ein unangenehmer Reiz zugefügt. heißen Bügeleisens dazu führt, dieses kein weiteres Mal zu berühren. Möglicherweise ist der Ausdruck „positiv“ in diesem Zusammenhang verwirrend, da er vermutlich nicht der Sicht des Bestraften entspricht. Hiermit ist jedoch gemeint, dass in der Situation etwas Negative Bestrafung von außen hinzukommt, das vorher nicht gegeben war. Bei der negativen Bestrafung Auf ein Verhalten hin wird wird ein angenehmer Reiz im Anschluss an ein Verhalten weggenommen (Gerrig/ ein angenehmer Reiz weggenommen. Zimbardo 2008, S. 209f.). Ein Alltagsbeispiel hierfür ist ein Fernsehverbot nach der schlech- ten Note in der Matheklausur. Die nachfolgende Tabelle soll das Gesagte verdeutlichen. Sie ist angelehnt an eine Abbil- dung von Myers (2014, S. 307). Tabelle 2: Positive und negative Verstärkung und Bestrafung in der Übersicht Merkmale des Reizes Reiz hinzufügen Reiz entfernen angenehm/erwünscht positive Verstärkung negative Bestrafung unangenehm/unerwünscht positive Bestrafung negative Verstärkung Quelle: Erstellt im Auftrag der IU 2020 in Anlehnung an Myers 2014, S. 307. Die Tabelle stellt die Unterschiede zwischen positiver und negativer Verstärkung und Bestrafung in der Übersicht dar. Um diese voneinander unterscheiden zu können, ist es wichtig, sich zu merken, dass positive und negative Verstärkung die Wahrscheinlichkeit einer Reaktion erhöhen, während Bestrafung das Gegenteil bewirkt, da sie die Wahr- scheinlichkeit eines bestimmten Verhaltens senkt (vgl. Gerrig/Zimbardo 2008, S. 210). Folgen von Bestrafung in der Kindererziehung Seit dem Jahre 2000 haben in Deutschland nach § 1631, Abs. 2 BGB „Kinder ein gesetzlich verbrieftes Recht auf gewaltfreie Erziehung. Körperliche Bestrafungen, seelische Verlet- zungen und andere entwürdigende Maßnahmen sind unzulässig“ (Bundesministerium der Justiz und für Verbraucherschutz 2019). 34 Ungeachtet dessen ergab eine repräsentative Befragung von 1.003 Erwachsenen, in Repräsentativ deren Haushalt mindestens ein Kind lebte, dass 40 % von ihnen ihre Kinder in den letzten In repräsentativen Stu- dien wird mittels Zufalls- zwölf Monaten mit einem Klaps auf den Po bestraft hatten, 10 % der Kinder erhielten eine auswahl eine Stichprobe Ohrfeige und 4 % bekamen als Strafe Schläge auf den Po (vgl. Forsa 2011). Aus psychologi- von Personen untersucht, scher Sicht spricht einiges gegen diese Form der Bestrafung, die von einer doch recht gro- die in Bezug auf wesentli- che Merkmale möglichst ßen Anzahl von Eltern immer noch befürwortet wird. genau mit der Population übereinstimmt. Laut Myers (2014, S. 306) konnte durch zahlreiche Studien belegt werden, dass Bestrafung dazu führt, dass … … das unerwünschte Verhalten nur unterdrückt, statt verändert wird. Die Eltern erhal- ten hierdurch allerdings den Eindruck, dass ihre Bestrafung erfolgreich war, womit wie- derum ihr Bestrafungsverhalten negativ verstärkt wird. … das Kind Aggressivität als eine Möglichkeit zur Problemlösung erlernt und nach dem Vorbild der Eltern selbst aggressiv handelt. … das Kind durch die Reizdiskrimination in der Lage ist, zwischen Situationen zu Reizdiskrimination unterscheiden und z. B. nicht mehr flucht, wenn der strafende Erwachsene in der Nähe Das ist eine während der Konditionierung erlernte ist, es aber tut, sobald es sich unbeobachtet fühlt. Fähigkeit, zwischen dem … das Kind sich vor dem strafenden Elternteil fürchtet. Durch Reizgeneralisierung kann konditionierten und es bei der operanten Konditionierung dazu kommen, dass das Kind die Bestrafung nicht anderen Reizen zu unter- scheiden und darauf nur mit dem unerwünschten Verhalten, sondern auch mit der Person und der Situation unterschiedlich zu reagie- in Verbindung bringt. ren. … beim Kind die Entstehung von Depressionen und von Gefühlen der Hilflosigkeit gefördert werden kann. Da durch Bestrafung Depressionen und Gefühle von Hilflosigkeit beim Kind begünstigt werden können, soll an dieser Stelle kurz auf das von Seligman (1972) während seiner For- schung an Hunden entwickelte Konzept der erlernten Hilflosigkeit eingegangen werden. Die wiederholte Erfahrung, unangenehmen bzw. traumatisierenden Ereignissen nicht aus- weichen zu können, führte bei den Tieren in Seligmans Studien zu Passivität und Resigna- tion, sodass sie zu einem späteren Zeitpunkt, als sie der Situation entgehen konnten, dies nicht taten. Sie hatten gelernt, dass sie nicht die Kontrolle über die Situation hatten und ergaben sich resigniert ihrem Schicksal. Seligman erkannte Parallelen zwischen erlernter Hilflosigkeit und depressiven Symptomen. Ebenso wie bei einer Depression führt auch erlernte Hilflosigkeit zu Gefühlen von Hoffnungslosigkeit und Wertlosigkeit (Seligman 1972, S. 407f., S. 407; Myers 2014, S. 581). Betroffene haben zudem den Glauben daran ver- loren, jemals Erfolg haben zu können, selbst wenn sie erfolgreich sind (vgl. Seligman 1972, S. 411). Um den Abschnitt abzuschließen, soll noch einmal Skinner zu Wort kommen, der zum Thema Bestrafung die Auffassung vertrat, dass die direkte positive Verstärkung zu bevor- zugen sei, da sie weniger objektive Nebenwirkungen zu haben scheint oder mit seinen Worten: „Direct positive reinforcement is to be preferred because it appears to have fewer objectionable by-products“ (Skinner 1953, S. 195). Im Folgenden stehen, Skinners Empfehlung folgend, die unterschiedlichen Möglichkeiten der positiven Verstärkung im Fokus des Interesses. 35 Shaping Laut Myers wird das Verhalten mittels Shaping (Verhaltensformung) durch Verstärkung schrittweise an das erwünschte Verhalten herangetragen. Shaping wird bei komplexem Verhalten, wie beispielsweise in der Tierdressur, eingesetzt, indem Reaktionen, die in die gewünschte Richtung gehen, belohnt und alle anderen ignoriert werden (Myers 2014, S. 301f.). Löschung Die Reaktion nimmt ab, wenn die Verstärkung aufhört, kann aber, wie auch beim klassi- schen Konditionieren, nach einer Pause erneut auftreten (Spontanerholung) (ebd., S. 296). Verstärkungspläne Bei der positiven Verstärkung (engl. positive reinforcement) wird laut Myers ein erwünsch- tes Verhalten jedes Mal, wenn es gezeigt wurde, durch einen angenehmen Reiz bekräftigt. Beispielsweise würde eine Ratte jedes Mal Futter bekommen, wenn sie einen Hebel betä- tigt. Die kontinuierliche Verstärkung hat jedoch den entscheidenden Nachteil, dass das erwünschte Verhalten zwar sehr schnell erlernt, aber ebenso schnell wieder gelöscht wird, sobald es nicht mehr verstärkt wird. Eine weitere Möglichkeit ist die partielle oder inter- Partielle oder intermit- mittierende Verstärkung, bei der Reaktionen diskontinuierlich verstärkt werden. Die tierende Verstärkung Ratte würde hier also nur manchmal Futter präsentiert bekommen, wenn sie einen Hebel Hierbei wird das Verhal- ten teilweise oder in unre- betätigt. Diese Form der Verstärkung verlangsamt zwar das Lernen, führt aber zu einer – gelmäßigen Abständen im Vergleich zur kontinuierlichen Verstärkung – größeren Resistenz dagegen, gelöscht zu verstärkt. werden (Myers 2014, S. 304). Diese Erkenntnis führte dazu, dass Skinner bei seinen Versu- Resistenz chen mit Tieren unterschiedliche Verstärkerpläne auf ihre Wirksamkeit hin überprüfte, die Hiermit wird allgemein die Widerstandsfähigkeit nachfolgend vorgestellt werden. bezeichnet; in diesem Fall gegenüber der Löschung des konditionierten Ver- Variable Quotenpläne haltens. Hierbei erfolgt die Verstärkung nach einer nicht vorhersehbaren und variablen Anzahl von Reaktionen, wie es z. B. bei Spielautomaten der Fall ist (Myers 2014, S. 305). Für unser Bei- spiel der Ratte bedeutet das: Die Anzahl der Hebelbetätigungen, die erforderlich sind, um Futter zu erhalten, variiert. Die Ratte könnte zum Beispiel beim ersten Mal die Belohnung nach fünf Hebelbetätigungen erhalten, dann nach sieben, dann nach vier usw. Da unbe- kannt ist, wann die Belohnung erteilt wird, und da die Verstärker im gleichen Maß wie die Reaktionen zunehmen, führt diese Art der Verstärkung zu hohen Reaktionsraten und zu einer großen Resistenz, gelöscht zu werden (Gerrig/Zimbardo 2008, S. 216f.; Myers 2014, S. 305). Feste Quotenpläne Nach Gerrig und Zimbardo erfolgt die Verstärkung hierbei nach einer bestimmten Anzahl von Reaktionen, z. B. nach jedem zweiten oder zehnten Mal. Da ein unmittelbarer Zusam- menhang zwischen Reaktionen und Verstärkung gegeben ist, wird eine hohe Wahrschein- lichkeit einer Reaktion erzeugt. Auf jeden Verstärker folgt eine Pause, die umso länger aus- fällt, je höher der Quotient ist. Unsere Ratte aus dem Beispiel würde also nach einer 36 festgelegten Anzahl Hebeldrückern (z. B. fünf) jedes Mal ihr Futter erhalten. Ist das Verhält- nis der Verstärkung hingegen zu gering, kann es sein, dass dies zur Löschung des Verhal- tens führt (vgl. Gerrig/Zimbardo 2008, S. 216). Feste Intervallpläne Diese verstärken die erste Reaktion nach einem festgelegten Zeitintervall, bei der die Aus- dauer des Verhaltens belohnt wird und langsame, aber stetige Reaktionen erzeugt wer- den. Die Ratte würde in einem festen Intervallplan also zum Beispiel nur Futter bekom- men, wenn sie den Hebel mindestens einmal alle zehn Minuten drückt (vgl. Myers 2014, S. 305). Variable Intervallpläne Hierbei wird das Zeitintervall, das angibt, wann die Wartezeit vorbei ist, willkürlich festge- legt, wodurch langsame, aber stetige Reaktionen ausgelöst werden. Nun würde die Ratte die erste Belohnung nach fünf Minuten, die nächste nach sieben Minuten und die dritte nach durchschnittlich zwei Minuten bekommen, wenn sie in diesem Zeitraum den Hebel betätigt hat. Es bleibt allgemein festzuhalten, dass (Quoten-)Pläne, bei denen Reaktion und Verstär- kung miteinander verknüpft sind, zu höheren Reaktionsraten führen als die Kopplung von Zeit und Verstärkung der Intervallpläne. Außerdem führen unvorhersehbare und damit variable Pläne zu dauerhafteren Reaktionen als vorhersehbare und festgelegte Pläne. Die nachfolgende Abbildung veranschaulicht die vorgestellten Verstärkungspläne, bei der die kurzen, schwarzen Striche Verstärker darstellen (vgl. Myers, S. 305ff.). 37 Abbildung 8: Intermittierende Verstärkungspläne Quelle: Erstellt im Auftrag der IU 2024 in Anlehnung an Myers 2014, S. 305. Ebenso wie das klassische Konditionieren unterliegt nach Myers auch das operante Kondi- tionieren biologischen Einschränkungen, da Tiere und Menschen besonders gut Assoziati- onen lernen können, die natürlicherweise miteinander verknüpft und dazu bestimmt sind, das Überleben zu sichern. Belohnt man z. B. einen Hamster mit Nahrung und konditioniert 38 im Anschluss daran ein Verhalten, das er natürlicherweise mit Futtersuche verbindet (z. B. graben), ist dies recht einfach zu erreichen. Soll er hingegen ein Verhalten zeigen, das nicht seinen natürlichen Veranlagungen entspricht, wird er dies relativ schnell wieder ver- lernen und zu seinen instinktiven Verhaltenstendenzen zurückkehren (vgl. ebd., S. 314f.). Im nachfolgenden Abschnitt stehen Lernprozesse im Mittelpunkt, die eine kognitive Ver- arbeitung erforderlich machen. Skinner weigerte sich bis zu seinem Tod kognitive Pro- Kognitive Verarbeitung zesse wie Erwartungen und Gedanken als wesentlich für die psychologische Forschung Hierbei sind höhere geis- tige Prozesse beteiligt, anzuerkennen (vgl. ebd., S. 316). Dass kognitive Prozesse jedoch auch beim operanten wie z. B. abstraktes Den- Konditionieren eine Rolle spielen, zeigen laut Myers beispielsweise Studien an Ratten, die ken oder Gedächtnis. zunächst ohne Belohnung durch ein Labyrinth geschickt werden und bei ihrer Erkun- dungstour eine geistige Abbildung des Labyrinths (kognitive Landkarte) entwickeln. Sobald der Versuchsleiter ein Stück Käse als Belohnung in den Ausgang legte, waren sie in der Lage, das Gelernte zu zeigen und sich den Käse zu holen, ein Vorgang der auch als latentes Lernen bezeichnet wird (vgl. ebd., S. 317). Latentes Lernen Das ist eine Art des Lern- ens, bei der das Gelernte zwar vorhanden, aber noch nicht sichtbar ist 1.4 Spiegelneuronen und erst gezeigt wird, wenn ein Anreiz hierfür besteht. In diesem Abschnitt stehen zunächst Spiegelneuronen im Mittelpunkt des Interesses, Spiegelneuronen anschließend wird die sozial-kognitive Lerntheorie Banduras vorgestellt. Dies sind Nervenzellen im Stirnlappen der Hirn- rinde, die reagieren, wenn Spiegelneuronen wurden erstmals von einer Forschergruppe der Universität in Parma in die Handlung eines ande- den 1990er-Jahren entdeckt (vgl. di Pellegrino et al. 1992). Bei Experimenten mit Makaken ren beobachtet wird oder bestimmte Handlungen war ihnen aufgefallen, dass bestimmte Nervenzellen im Stirn- bzw. Frontallappen (engl. selbst ausgeführt werden. frontal lobe; motorischer Kortex) im Gehirn der Affen nicht nur dann aktiv waren, wenn sie Frontallappen selbst handelten, sondern auch dann, wenn sie lediglich die Forscher bei einer Handlung So werden die vorderen beobachteten (vgl. di Pellegrino et al. 1992, S. 176). Aufgrund des Effekts, das Handeln Lappen der beiden Hälf- ten des Großhirns eines anderen zu spiegeln, wurden sie als Spiegelneuronen bezeichnet (Myers 2014, bezeichnet, auch motor- S. 319f.). ischer Kortex genannt. Er kontrolliert und steuert unsere Bewegung. 39 Abbildung 9: Gliederung der Großhirnrinde mit Funktionsbereichen Quelle: Erstellt im Auftrag der IU 2024. Vier Lappen der Diese Grafik ist eine grobanatomische Darstellung der vier Lappen der Hirnrinde und ver- Hirnrinde anschaulicht u. a. den Frontallappen des Gehirns. Diese sind folgende: Fron- tallappen (frontal lobe), Temporallappen (tempo- Rizzolatti und Craighero betonen die immense Bedeutung, die Spiegelneuronen für Men- ral lobe), Parietallappen schen haben können. Es wird vermutet, dass Spiegelneurone dazu führen, dass wir die (parietal lobe) und Okzipi- tallappen (occipital lobe). Handlungen anderer verstehen und sie die Grundlage für das Beobachtungslernen dar- stellen (vgl. Rizzolatti/Craighero 2004, S. 169). Neuere Forschungen werfen allerdings auch Kritik an der Theorie der Spiegelneuronen auf. Viele der Studien zum Nachweis von Spie- gelneuronen basieren auf Untersuchungen an Affen und sind teils nicht am Menschen rep- lizierbar. Auch ist die genaue Eingrenzung der betroffenen Gehirnareale beim Menschen schwieriger als beim Affen (Molenberghs, Cunnington & Mattingley, 2009; Pascolo & Budai, 2013). Dennoch hat das Konzept der Spiegelneurone die Frage nach der neuronalen Verar- beitung von Empathie wieder mehr in den Fokus der Forschung gerückt. Empathie wird in dem Maß gefördert, in dem es uns gelingt, uns in einen anderen Menschen hineinzuverset- Theory of Mind zen (vgl. Myers 2014, S. 320). Diese Fähigkeit wird auch als Theory of Mind bezeichnet, Das ist die persönliche welche umschreibt, dass Kinder zwischen dem dritten und fünften Lebensjahr eine Theo- Theorie von Menschen, mit der sie sich mentale rie darüber entwickeln, wie der Verstand funktioniert und wie er das Verhalten beeinflusst. (geistige) Zustände ande- Kinder verstehen zunehmend die Bedeutung und die Auswirkung von inneren Zuständen rer erklären. (Gefühle, Gedanken, Wünsche, Absichten und Überzeugungen) anderer Personen auf deren Verhalten (vgl. Lohaus et al. 2010, S. 121f.). Autistische Störung Kindern, die von einer autistischen Störung betroffen sind, wird oft eine fehlende Theory Betroffene sind im Hin- of Mind zugeschrieben, da aufgrund struktureller Veränderungen des Gehirns bei ihnen blick auf Kommunikation und soziale Interaktion Hirnareale ungenügend zusammenarbeiten, die es Personen ohne diese Störung ermögli- ebenso beeinträchtigt wie chen, eine fremde Sichtweise einnehmen zu können (vgl. ebd., S. 284; Myers 2014, S. 194). durch eingeschränkte Aktivitäten und Interes- sen. 40 Im nachfolgenden Abschnitt wird zunächst die soziale Lerntheorie Albert Banduras vorge- stellt und im Anschluss daran eine Studie, die eine Verbindung zwischen Banduras Theorie und einer fehlenden Theory of Mind bei Autismus herstellt. Lernen am Modell Wie bereits im Zusammenhang mit Bestrafung angesprochen wurde, können Kinder das aggressive Verhalten der Eltern als Vorbild nehmen und hierdurch lernen, Konflikte eben- falls gewaltsam zu lösen. Albert Bandura beschreibt diese Beobachtung in folgendem Zitat: „People are not born with preformed repertoires of aggressive behavior; they must learn them“ (Bandura 1978, S. 14). In seiner sozial-kognitiven Lerntheorie ging er davon aus, dass prosoziales wie Prosozial auch aggressives Verhalten sozial vermittelt ist. Kinder lernen durch die Beobachtung von konstruktives und hilfsbe- reites Verhalten Menschen ihrer näheren, sozialen Umgebung sowie durch Medien (TV, Internet, Filme etc.) und nehmen das vermittelte Verhalten als Modell für ihr eigenes Verhalten (vgl. ebd., S. 14f.). Seine Theorie über das Beobachtungslernen basiert auf einem berühmten Experi- ment, bei dem Vorschulkinder einen Erwachsenen dabei beobachteten, wie er eine Puppe (Bobo-Puppe) misshandelte und beschimpfte. Als die Kinder mit der Bobo-Puppe alleine waren, imitierten sie das aggressive Verhalten des erwachsenen Modells und verwendeten auch die gleichen Schimpfwörter (vgl. Bandura/Ross/Ross 1961, S. 577ff.). Nach Bandura hängt das Modelllernen von den folgenden vier Prozessen ab: 1. Aufmerksamkeit, die der Beobachter dem Modell und dessen Verhalten zuwendet. 2. Speicherung des Modellverhaltens im Gedächtnis. 3. Reproduktionskompetenz, die voraussetzt, dass es dem Beobachter möglich ist, das Reproduktionskom- Verhalten nachzuahmen. petenz Das ist die Fähigkeit, ein 4. Verstärkung und Motivation, die in dem Beobachter das Bedürfnis wecken, das Verhalten zu kopieren beobachtete Verhalten umsetzen zu wollen (vgl. Bandura 1971, S. 6ff.). und auszuführen. Während die ersten beiden Punkte für das Erlernen des Verhaltens notwendig sind, bezie- hen sich die letzten beiden auf dessen Ausführung (vgl. Lohaus et al. 2010, S. 19). Die Aufmerksamkeit, die ein Beobachter einem Modell zuwendet, geht laut Bandura mit der Bereitschaft einher, ein bestimmtes Verhalten bevorzugt zu imitieren. Basis hierfür kann u. a. die Zugehörigkeit zu einer sozialen Gruppe sein, der das Modell und der Beobachter angehören. So ist die Imitation aggressiven Verhaltens in bestimmten Grup- pen wahrscheinlicher als in anderen. Damit das Verhaltensmuster das zukünftige Handeln des Beobachters leiten kann, wird es in symbolischer Form im Gedächtnis bildlich und sprachlich repräsentiert (vgl. Bandura 1971, S. 6f.). Bei der bildlichen Repräsentation wird laut Bauer ein Abbild des Verhaltensmusters erzeugt, während die sprachliche Repräsentation in Form von Begriffen erfolgt. Der Behal- tensprozess wird besonders dann deutlich, wenn – wie bereits beim latenten Lernen erör- tert – das Verhalten erst zu einem späteren Zeitpunkt gezeigt wird. Durch Wiederholung und Übung wird das Modellverhalten zunehmend stabilisiert und damit Teil des eigenen Verhaltensrepertoires (vgl. Bauer 1979, S. 28ff.). Die Reproduktionskompetenz verweist 41 darauf, dass zuerst die körperlichen Voraussetzungen gegeben sein müssen, um bestimmte Bewegungsabläufe nachahmen zu können (vgl. Lohaus et al. 2010, S. 19). Für die Handlungsmotivation, das Verhalten auszuführen oder es zu unterlassen, ist neben äußerer Verstärkung – durch die beobachtete Belohnung oder Bestrafung des Verhaltens – außerdem die Selbstverstärkung bei persönlich wahrgenommenen Fortschritten entschei- dend (vgl. ebd., S. 18). Wie oben erwähnt, imitieren wir bevorzugt Menschen, die uns ähn- lich sind, aber auch solche, die wir für erfolgreich und bewundernswert halten. Beispiels- weise zeigen fMRT-Aufnahmen von Menschen, die andere Personen dabei beobachteten, wie sie belohnt wurden, eine Aktivierung des Belohnungssystems im Gehirn, als wären sie selbst belohnt worden, wenn sie diese als ähnlich wahrnahmen oder sympathisch fanden (vgl. Myers 2014, S. 319). Dieses Imitationsverhalten sowie dessen besondere Bedeutung zeigen sich laut Lohaus bei Kindern bereits sehr früh, da bereits wenige Tage alte Säug- linge die Zunge herausstrecken, wenn ihre Eltern dies tun. Diese frühkindliche Imitations- leistung werten diese als Kontaktaufnahme, wodurch ihr Fürsorgeverhalten und die Bin- dung an das Kind verstärkt werden (Lohaus et al. 2010, S. 107f.). 1.5 Anwendungsbeispiel Die im Folgenden vorgestellte Studie stellt eine Verbindung zwischen Banduras sozialer Lerntheorie und der im ersten Abschnitt erläuterten Theory of Mind her und zeigt, wie For- schung praktisches Handeln anleiten kann. Aus der Forschung Überimitation Das Phänomen der Überimitation führt bei Kindern im Kleinkind- und Vorschulalter dazu, Drei- bis fünfjährige Kin- dass sie auch unnötige und unsinnige Handlungen Erwachsener imitieren (Myers 2014, der neigen dazu, das Ver- halten eines Modells S. 321). Ein Experiment von Lyons/Young/Keil mit drei- bis fünfjährigen Kindern belegte, detailgenau zu kopieren, dass Kinder dieser Altersgruppe auch dann zu Überimitation neigten, wenn transparent inklusive Verhaltenswei- gemacht wurde, dass die Handlung des erwachsenen Modells unsinnig war, wie z. B. eine sen, die überflüssig sind. durchsichtige Plastikbox zuerst mit einer Feder zu berühren, bevor der darin enthaltene Dinosaurier durch Aufschrauben des Deckels der Box entnommen wurde (vgl. Lyons/ Young/Keil 2007, S. 19752). In einer aktuellen Studie von Foti et al. (2019) hingegen führte die Neigung zur Überimita- tion bei Kindern mit einer autistischen Störung (engl. Autism Spectrum Disorder; ASD) zu einer Verbesserung ihrer Leistungen bei einer Beobachtungs- und experimentellen Lern- aufgabe. Im Verlauf der drei Versuchsdurchgänge wurden ihre Leistungen kontinuierlich besser und näherten sich den Leistungen von Kindern ohne eine solche Störung stetig an. Hierbei beobachteten die Kinder beider Gruppen zunächst eine Person in einem Video, wie sie ein Haus aus Plastiksteinen baute und hierbei einige Fehler machte. Sie schlug bei- spielsweise eingesetzte Steine gegen das Haus, um sie einzufügen oder machte überflüs- sige Bewegungen (sie präsentierte z. B. jeden Stein einzeln) und bewertete die Richtigkeit oder Fehlerhaftigkeit ihrer Handlungen jeweils mit einem Kopfnicken oder -schütteln. Danach waren die Kinder aufgefordert, das Haus mit eigenen Steinen nachzubilden. Hier- bei imitierten die Kinder mit ASD auch die überflüssigen Bewegungen und falschen Versu- che des Modells, im Gegensatz zur Vergleichsgruppe von Kindern ohne eine solche Stö- 42 rung. Während die Vergleichsgruppe in den ersten beiden Versuchsdurchgängen deutlich besser abschnitt, konnten die Kinder mit ASD im dritten Durchgang aufholen und lagen auf demselben Level wie die Vergleichsgruppe. Laut Foti et al. können Kinder mit ASD Überimitation als Lernstrategie in ihrem täglichen Leben nutzen und hiermit ihre Defizite im Beobachtungslernen ausgleichen. Die Berücksichtigung dieser Erkenntnisse in Erzie- hung und Schule durch entsprechende Lernangebote kann gemäß den Autoren den Kin- dern den Erwerb neuer kognitiver und motorischer Fähigkeiten erleichtern und hierdurch ihre soziale Integration und ihr Selbstvertrauen stärken. Für weitere Einzelheiten der Stu- die siehe Foti et al. 2019. Aus der Praxis Durch Beobachtung erhalten wir von Kindesbeinen an zahlreiche Informationen über unsere soziale Umwelt und können, ohne es persönlich erlebt zu haben, allein indem wir zuschauen, unsere Fertigkeiten und Kenntnisse erweitern und etwaige Konsequenzen vor- hersagen (vgl. Gerrig/Zimbardo 2008, S.