Kognitionspsychologie: Aufmerksamkeit (PDF)
Document Details
Uploaded by StimulatingWisdom6944
HFH Hamburger Fern-Hochschule
2021
Dr. Christian Büsel
Tags
Summary
Dieser Studienbrief zur Kognitionspsychologie behandelt das Thema Aufmerksamkeit, insbesondere visuelle Aufmerksamkeit. Er beleuchtet verschiedene Theorien und Paradigmen wie frühe und späte Selektion, die Attenuationstheorie und die Load-Theorie. Der Studienbrief bietet eine Einführung in die Forschung zu diesem Thema und erläutert die verschiedenen Mechanismen, die unsere Informationsverarbeitung beeinflussen.
Full Transcript
Kognitionspsychologie Aufmerksamkeit Dr. Christian Büsel Studienbrief 1 01-4002-001-1 KGP Impressum Verfasser Dr. Christian Büsel...
Kognitionspsychologie Aufmerksamkeit Dr. Christian Büsel Studienbrief 1 01-4002-001-1 KGP Impressum Verfasser Dr. Christian Büsel Universität Innsbruck Christian Büsel studierte Kultur- und Sozialanthropologie sowie Psychologie an der Universität Wien. 2019 schloss er das Fach Psychologie mit Promotion bei Univ.- Prof. Dr. Ulrich Ansorge ab. Seither lehrt und forscht er an der Universität Innsbruck zu den Themen absichtsgesteuerter Aufmerksamkeitssteuerung, Reizverarbeitung und Reizunterdrückung. Lektorat Wissenschaftliche Mitarbeiterinnen und Mitarbeiter der Hamburger Fern-Hochschule Satz/Repro Haussatz Redaktionsschluss September 2021 1. Auflage 2021 HFH ∙ Hamburger Fern-Hochschule, Alter Teichweg 19, 22081 Hamburg Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbe- sondere das Recht der Vervielfältigung und der Verbreitung sowie der Übersetzung und des Nachdrucks, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Kein Teil des Werkes darf in irgendeiner Form ohne schriftliche Genehmigung der Hamburger Fern-Hochschule reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden. Gedruckt auf 100 % chlorfrei gebleichtem Papier. Inhaltsverzeichnis Inhaltsverzeichnis Abkürzungsverzeichnis...........................................................................................4 Einleitung.................................................................................................................5 1 Was ist Aufmerksamkeit?..................................................................................6 1.1 Frühe Selektion.............................................................................................8 1.2 Späte Selektion...........................................................................................10 1.3 Attenuationstheorie.....................................................................................11 1.4 Load-Theorie..............................................................................................11 Übungsaufgaben.................................................................................................13 2 Visuelle Suche...................................................................................................14 2.1 Merkmalsintegrationstheorie......................................................................14 2.2 Guided Search.............................................................................................16 2.3 Hinweisreizparadigma nach Posner............................................................18 2.3.1 Endogene Hinweisreize....................................................................19 2.3.2 Exogene Hinweisreize......................................................................20 Übungsaufgaben.................................................................................................22 3 Bottom-up- vs. Top-down-Debatte..................................................................23 3.1 Bottom-up-Theorie der visuellen Aufmerksamkeit....................................23 3.1.1 Additional-Singleton-Paradigma......................................................23 3.1.2 Interferenzeffekt...............................................................................25 3.1.3 Salienzkarten....................................................................................26 3.2 Top-down-Theorie der visuellen Aufmerksamkeit.....................................27 3.2.1 Contingent-Capture-Paradigma........................................................27 3.2.2 Wie viele Merkmale können parallel gesucht werden?....................29 3.3 Gegenseitige Erklärungsversuche...............................................................31 3.3.1 Search Modes...................................................................................31 3.3.2 Nicht räumliche Filterkosten............................................................32 3.3.3 Rapid Disengagement.......................................................................34 3.3.4 Intertrial Priming..............................................................................35 3.3.5 Inhibition..........................................................................................38 Übungsaufgaben.................................................................................................39 4 Selection History...............................................................................................40 4.1 Intertrial Priming........................................................................................40 4.2 Belohnung...................................................................................................41 4.3 Statistisches Lernen....................................................................................42 Übungsaufgaben.................................................................................................44 Zusammenfassung.................................................................................................45 Glossar....................................................................................................................46 Lösungen zu den Übungsaufgaben......................................................................49 Literaturverzeichnis..............................................................................................52 3 Hamburger Fern-Hochschule Abkürzungsverzeichnis Abkürzungsverzeichnis fMRT funktionelle Magnetresonanztomografie EEG Elektroenzephalografie GBVS Graph-Based Visual Saliency ms Millisekunden RT Reaktionszeit (response time) SOA Stimulus Onset Asynchrony TVA Theory of Visual Attention z. B. zum Beispiel 4 Hamburger Fern-Hochschule Einleitung Einleitung Die (visuelle) Aufmerksamkeitsforschung ist ein bedeutender Teilbereich der Kog- nitionspsychologie, der bereits vor der Kognitiven Wende in der Psychologie (ge- meinhin auf 1958 datiert) ein Begleiter der akademischen Psychologie war. Bei- spielsweise berichtete Hermann von Helmholtz in den 1860er-Jahren Experimente zur visuellen Aufmerksamkeit, die bis heute nichts an ihrer Relevanz eingebüßt ha- ben. Im Zentrum der Aufmerksamkeitsforschung steht die Frage, wie wir Menschen un- serer Umwelt Information entnehmen. Welche Mechanismen beeinflussen, worauf ich meine Aufmerksamkeit lenke? Welche Konsequenzen hat die Ablenkung unserer Aufmerksamkeit? Diese Fragen sind nicht nur von theoretischem Interesse, sondern liefern wertvolle Beiträge zur Erforschung der Optimierung von Mensch-Maschine- Interaktion, wie etwa Usability-Studien und Studien zu Human Factors. Sie werden in diesem Studienbrief einen Einblick in die visuelle Aufmerksamkeits- forschung erhalten sowie in die Hintergründe und die vorherrschenden Debatten die- ser traditionsreichen Forschungsrichtung. Es soll Ihnen jedoch auch ein Einblick in die aktuellen Entwicklungen in diesem Forschungszweig sowie in die methodische Vielfalt gegeben werden. Einige Begriffe wurden in diesem Studienbrief nicht ins Deutsche übersetzt, sondern im englischen Original belassen. Zwar ist die Bewahrung der deutschen Sprache si- cher ein nobles Unterfangen, im Sinne der Effizienz wurden jedoch manchmal die Originalbegriffe beibehalten. Damit ist gemeint, dass Ihnen, sofern das Interesse bei Ihnen geweckt wurde, der Schritt von diesem Studienbrief hin zur Originalliteratur nicht durch semantische Unklarheiten erschwert werden soll. Oft benötigen wir bei neuen Begriffen einige Anläufe, um sie uns zu merken. Daher finden Sie gegen Ende dieses Studienbriefes ein Glossar, in dem die im Text fett gedruckten Begriffe nochmals kurz und bündig erklärt werden. Zu Beginn werden einige von Ihnen vielleicht von der Abstraktheit dieses Forschungsgebietes, wie sie in den meisten Fachbereichen der Grundlagenforschung üblich ist, überrascht oder irritiert sein. Ich hoffe jedoch, Ihnen mit diesem Studienbrief eine spannende Ein- führung in die Erforschung der visuellen Aufmerksamkeit geben zu können. 5 Hamburger Fern-Hochschule 1 Was ist Aufmerksamkeit? 1 Was ist Aufmerksamkeit? Bevor wir in die gegenwärtigen und vergangenen Debatten einsteigen, sollten wir uns vergegenwärtigen, was Aufmerksamkeit nun eigentlich ist. Wir alle kennen den Begriff der Aufmerksamkeit, jedoch ist damit mitunter nicht immer dasselbe ge- meint. In der Alltagssprache umschreiben wir mit „Aufmerksamkeit“ eine Vielzahl von Phänomenen. Beispielsweise kann das lange Konzentrieren auf einen Vortrag, einen Film oder ein Videospiel mit „etwas mit Aufmerksamkeit bedenken“ um- schrieben werden. Wenn wir leicht von Dingen in unserer Umgebung abgelenkt wer- den, sind wir „unaufmerksam“, ebenso wenn wir es verabsäumen, auf Aufgabenstel- lungen aus unserer Umwelt angemessen zu reagieren. Alle diese Phänomene – und sicherlich auch mehr – involvieren den Begriff der Aufmerksamkeit. In der visuellen Aufmerksamkeit bezeichnen wir Aufmerksamkeit als jenen Prozess, der lediglich einen kleinen Teil an prinzipiell verfügbarer Information für eine tiefergehende Ver- arbeitung auswählt. Phänomene, wie etwa lange und konzentriert einem Vortrag zu lauschen, werden in der Forschung mit dem Begriff der Vigilanz umschrieben. Chun, Golomb und Turk-Browne (2011) widmeten sich in einem Review-Artikel der Ta- xonomie, also der Klassifikation verschiedener Phänomene, die landläufig als „Auf- merksamkeit“ bezeichnet werden. Darin unterscheiden sie zwischen internaler und externaler Aufmerksamkeit. Wenn wir beispielsweise mit unserer Umwelt unange- messen interagieren (z. B. an einer grünen Ampel auf die Bremse drücken), dann ist das ein Beispiel für einen Verarbeitungsfehler unserer internalen Aufmerksamkeit, da wir das falsche Verhaltensschema aus unserem Gedächtnis abgerufen haben. Wenn jedoch äußere Reize, wie etwa Objekte, Geräusche oder Gerüche, unsere Auf- merksamkeit auf sich ziehen, dann ist das als ein externaler Aufmerksamkeitseffekt zu bezeichnen. Im Rahmen dieses Studienbriefes werden wir uns, wie bereits ange- deutet, mit diesem externalen Aufmerksamkeitsbegriff beschäftigen. Stellen Sie sich vor, Sie sind in einer belebten und hektischen Einkaufsstraße. Unsere Sinnesrezeptoren registrieren eine schier unüberschaubare Menge an Information, die sich im Bruchteil einer Sekunde ändern können. So ist das Auto, das gerade noch vor mir war, plötzlich hinter mir, Menschen gehen in den Geschäften ein und aus etc. All diese Reize stellen einen Wahrnehmungsinhalt dar. Jeden Wahrnehmungs- inhalt zu verarbeiten, übersteigt jedoch unsere mentalen Kapazitäten um ein Vielfa- ches. Diese Vorstellung mag auf den ersten Blick etwas eigen anmuten: Man sieht im eigenen Blickfeld alle objektdefinierenden Eigenschaften, wie zum Beispiel die vertikale Orientierung des braunen Türstocks im rechten Augenwinkel. Auf Basis dieser Beobachtung möchte man doch annehmen, dass sämtliche Informationen im eigenen Blickfeld bewusst wahrgenommen werden können. Die Betonung des Wor- tes „können“ wird schnell ersichtlich, wenn Sie sich das Suchbild in Abbildung 1.1 ansehen: 6 Hamburger Fern-Hochschule Was ist Aufmerksamkeit? 1 Abb. 1.1: Ein bekanntes Beispiel für Unaufmerksamkeitsblindheit: ein Suchrätsel (https://www.schule-und-familie.de/malvorlagen/raestselbilder/fehlersuchbild-raupen.html abgerufen am 10.11.2020) Wie lange haben Sie gebraucht, um alle 10 Unterschiede zu finden? Sie wurden soeben Zeuginnen und Zeugen des Phänomens der Unaufmerksamkeitsblindheit, vielleicht bekannter unter der englischen Bezeichnung change blindness (für ein Re- view siehe Simons & Levin, 1997). Für gewöhnlich bezeichnet die Veränderungs- blindheit jenes Phänomen, in dem wir in dynamischen Bildwechseln Unterschiede zwischen zwei Bildern nicht erkennen. Ein Suchrätsel ist im Prinzip eine statische Variante dieser Veränderungsblindheit: Obwohl wir die beiden Bilder problemlos simultan wahrnehmen können, müssen wir unsere Aufmerksamkeit seriell auf ver- schiedene Orte in einem Bild ausrichten, um die korrespondierende Stelle im ande- ren Bild damit abzugleichen. Sobald wir einen Fehler allerdings gefunden haben, können wir ihn kaum noch übersehen. Erst die Selektion eines kleinen Ausschnittes der Szene ermöglicht also die tiefergehende Verarbeitung des sensorischen Inputs. Ein anderes bekanntes Beispiel für diesen Effekt kennen Sie eventuell bereits: In einem Video werfen sich zwei Teams mit unterschiedlich gefärbten Trikots einen Basketball zu. Sie werden dann gebeten, die Pässe innerhalb eines Teams (beispiels- weise des Teams mit den schwarzen Trikots) zu zählen. Nachdem Sie Ihre Aufgabe erledigt haben, werden Sie vielleicht erstaunt sein festzustellen, dass mitten im Vi- deo eine Person in einem Gorillakostüm durch die Szene spazierte und freundlich in die Kamera winkte. Unaufmerksamkeitsblindheit verdeutlicht, dass die visuelle Wahrnehmung zwar eine notwendige, jedoch keine hinreichende Bedingung für die bewusste Verarbei- tung visueller Information ist. Der Grund, warum wir die visuelle Information über- sehen haben, kann nicht sensorischer Natur sein: Dynamische Änderungen können auch mit den peripheren Fotorezeptoren (Stäbchen) gut wahrgenommen werden, und die Änderungen bzw. Unterschiede im Suchbild sind an sich groß genug – und um- fassen mehrere rezeptive Felder –, um zumindest sensorisch verarbeitet werden zu können. Die Änderungen bzw. Unterschiede wurden jedoch sofort sichtbar und un- übersehbar, nachdem wir einmal auf diese Umstände aufmerksam geworden sind. 7 Hamburger Fern-Hochschule 1 Was ist Aufmerksamkeit? Genau diese Tatsache ist der Grund dafür, warum Aufmerksamkeit zumeist mit dem Begriff der Selektion assoziiert wird, und viele Paper zur visuellen Aufmerksam- keitsforschung beginnen mit einer Variation des folgenden Stehsatzes: „Die visuelle Aufmerksamkeit ist jener Mechanismus, der es uns erlaubt, lediglich einen kleinen Ausschnitt der prinzipiell verfügbaren visuellen Information für eine tiefergehende Verarbeitung zu selektieren.“ Aufmerksamkeit ist also jener Mechanismus, der unsere kapazitätsbeschränkte visu- elle Wahrnehmung auf jene potenziell relevanten Orte lenkt, sodass wir zielgerichtet handeln können. Während diese Definition von Aufmerksamkeit nicht immer akzep- tiert wurde, ist sie heute beinahe unumstritten. Es gab nämlich für lange Zeit die Debatte, was der eigentliche Zweck der visuellen Aufmerksamkeit ist. Vertreterin- nen und Vertreter der einen Seite argumentierten, dass die Aufmerksamkeit primär unserer Limitation geschuldet ist, alle Informationen aus unserer Umwelt effizient zu verarbeiten. Diese Sichtweise nennt man Mangeltheorie der Aufmerksamkeit, da die Existenz der Aufmerksamkeit als Resultat des Mangels von Verarbeitungska- pazitäten gesehen wird. Ein prominenter Vertreter der Gegenseite war Allport (1987), der Aufmerksamkeit nicht als Zeichen eines Mangels ansah, sondern als Ressource. Stellen Sie sich vor, Sie stehen unter einem Apfelbaum und wollen einen der vielen Äpfel pflücken. Wenn wir unfähig wären, lediglich einen Apfel zu selektieren und mit ihm zu inter- agieren, wäre eine koordinierte Interaktion mit unserer Umwelt praktisch unmöglich. Dieser zweite Ansatz von Allport wird auch Tätigkeitstheorie der Aufmerksam- keit bzw. selection for action genannt. Man sollte jedoch nicht annehmen, dass die Tätigkeitstheorie der Aufmerksamkeit vollkommen verworfen und lediglich von his- torischem Interesse ist. Sie findet sich nämlich in Ansätzen in der Prämotortheorie von Rizzolatti, Riggio, Dascola und Umiltá (1987) wieder, nach der Aufmerksam- keitsverlagerungen der Vorbereitung zielgerichteter Handlungen dienen. Eine weitere sehr lebhaft geführte Debatte war jene um den Zeitpunkt der Selektion: Zu welchem Zeitpunkt der Reizverarbeitung erfolgt die Selektion von Information, die dann noch tiefergehender verarbeitet wird (etwa eine semantische Bedeutungs- analyse)? Symptomatisch für die Aufmerksamkeitsforschung – und das werden Sie im Laufe dieses Studienbriefes noch sehen – ist, dass es zunächst zwei stark gegen- sätzliche Antworten auf die Frage nach dem Zeitpunkt der Selektion gab, die letzt- lich in modernere Theorien mündeten, welche einen Kompromiss zwischen den an- fangs widersprüchlichen Ansichten bilden. 1.1 Frühe Selektion Eine der ersten modernen Theorien zur Aufmerksamkeit stammt von Donald Broad- bent (1958). Broadbent formulierte das sog. Filtermodell, mit dem er Erkenntnisse bisheriger Wahrnehmungs- und Aufmerksamkeitsforschung zu erklären versuchte. Cherry (1953) experimentierte mit der Methode des dichotischen Hörens: Versuchs- personen wurden simultan zwei Nachrichten, je eine pro Ohr, vorgespielt. Die Ver- suchspersonen wurden instruiert, eine der beiden Nachrichten nachzusprechen (engl. shadowing). Nach der Präsentation der auditiven Informationen konnten die Ver- suchspersonen kaum Auskunft über die nicht beachtete Information geben. Sie konn- ten lediglich berichten, wenn die Stimme von einer männlichen zu einer weiblichen Stimme wechselte oder wenn ein Beep-Ton in der nicht beachteten Botschaft einge- spielt wurde. Über den Inhalt der nicht beachteten Nachricht vermochten die Ver- suchspersonen jedoch keine Aussagen zu treffen. Anders formuliert: Wurde eine 8 Hamburger Fern-Hochschule Was ist Aufmerksamkeit? 1 Nachricht nicht beachtet, wurden lediglich physikalische Merkmale registriert (Stimme, Ton), jedoch keinerlei semantische Inhalte verarbeitet. Ein anderes Paradigma wurde von Broadbent (1954) selbst angewandt: das Split- Span-Paradigma. Ähnlich wie bei Cherrys Methode des dichotischen Hörens wur- den den Versuchspersonen im Split-Span-Paradigma mehrere Zahlenpaare dargebo- ten, jeweils eine Zahl pro Ohr. Im Anschluss wurden die Versuchspersonen gebeten, die soeben gehörten Zahlen so exakt wie möglich wiederzugeben. Broadbent fand dabei, dass Versuchspersonen bevorzugt jene Zahlen berichteten, die am selben Ohr dargeboten wurden. Er interpretierte diesen Befund dahingehend, dass Versuchsper- sonen die Information anhand physikalischer Eigenschaften wählten, in diesem Fall anhand der Seite, an der die Information dargeboten wurde. Auf Basis dieser und weiterer Befunde, die den Rahmen dieses Studienbriefes spren- gen würden, formulierte Broadbent (1958) seine Filtertheorie der Aufmerksamkeit (Abb. 1.2): Abb. 1.2: Schematische Darstellung der Filtertheorie nach Broadbent (1958) Nach der Filtertheorie gelangt jegliche Information zunächst in ein sensorisches Re- gister, das als Kurzzeitspeicher für physikalische Information (z. B. Richtung, Ton- höhe, Farbe) verstanden werden kann. Nach dieser initialen Analyse physikalischer Eigenschaften passiert die Eingangsinformation den sog. selektiven Filter. Der se- lektive Filter lässt nur einen kleinen Ausschnitt des eigentlich vorhandenen Inputs passieren. Diese gefilterte Information kann in weiterer Folge anderen Verarbei- tungsstufen zugeführt werden, wie etwa der semantischen Analyse des Inhaltes oder der Speicherung im Langzeitgedächtnis. Broadbents Filtertheorie erfuhr schnell breite Anerkennung und trug neben Noam Chomskys Kritik an Skinners behavioristischer Theorie zum Spracherwerb wesent- lich zur Kognitiven Wende der Psychologie bei. Trotzdem – oder vielleicht sogar deshalb – wurde Broadbents Filtertheorie auch häufig kritisiert. Nicht ganz klar ist beispielsweise, wie der Cocktailparty-Effekt mit Broadbents Filtertheorie erklärt werden kann. Stellen Sie sich vor, Sie wären auf einer Party mit verschiedenen Ge- sprächsgruppen. Trotz aller Umgebungsgeräusche werden Sie dennoch registrieren, wenn Ihr Name in einer anderen Gesprächsgruppe als der Ihren fällt. Scheinbar ha- ben Sie, obwohl Sie die Gespräche der anderen Gruppe nicht beachtet haben, den sensorischen Input immerhin so weit verarbeitet, dass Sie die Nennung Ihres Namens bemerkt haben. 9 Hamburger Fern-Hochschule 1 Was ist Aufmerksamkeit? 1.2 Späte Selektion Im kompletten Widerspruch zu Broadbent formulierten Deutsch und Deutsch (1963) ihre Theorie der späten Selektion. In ihrem bekannten Review-Artikel zählen Deutsch und Deutsch eine Reihe empirischer Befunde auf, die sich nur schwer mit Broadbents Konzept der frühen Selektion vereinbaren lassen. Beispielsweise konnte Peters (1954; nach Deutsch & Deutsch, 1963) nachweisen, dass, wenn Versuchsper- sonen einer von zwei simultan präsentierten Nachrichten folgen sollten, die unbe- achtete Nachricht mehr mit der Erinnerung an die beachtete Nachricht interferiert, je ähnlicher sie inhaltlich mit der beachteten Nachricht ist. Ist die nicht beachtete Nach- richt hingegen inhaltlich unähnlich zur beachteten Nachricht, gibt es kaum Interfe- renz. Dieser Befund lässt nur den Schluss zu, dass auch die nicht beachtete Nachricht inhaltlich, d. h. semantisch verarbeitet wurde. Aufgrund dieses und weiterer Befunde argumentierten Deutsch und Deutsch (1963), dass jeglicher sensorische Input parallel vollständig verarbeitet und entsprechend der Relevanz für eine etwaige momentane Aufgabe gewichtet wird. Der Input mit dem größten Gewicht wird weiterverarbeitet, was in der Speicherung des Inhaltes im Ge- dächtnis oder einer motorischen Reaktion auf einen Reiz münden kann (siehe Abb. 1.3). Sie sehen, von einem Mangel an Verarbeitungsressourcen ist in Deutsch und Deutschs Modell keine Spur. Vielmehr wird postuliert, dass perzeptive und diskri- minatorische Prozesse jeglichen Input nicht nur vollständig verarbeiten, sondern zeitgleich auch hinsichtlich ihrer momentanen Relevanz gewichtet werden. Abb. 1.3: Schematische Darstellung des Modells der späten Selektion von Deutsch & Deutsch (1963) Deutsch und Deutsch (1963) bedienten sich in ihrem Review einer Metapher, um die späte Selektion und die parallele Verarbeitung eingehender Information zu erklären. Stellen Sie sich vor, Sie wollten herausfinden, welches Kind in einer Klasse das größte ist. Sie könnten nun – wie es wohl die meisten tun würden – jede Schülerin und jeden Schüler separat messen und dann die Werte vergleichen, um zum Schluss ein Kind als das größte zu befinden. Mit etwas technischem Geschick könnten Sie jedoch auch eine Vorrichtung bauen, mit der Sie alle Schülerinnen und Schüler der Reihe nach aufstellen und eine horizontale Latte langsam immer mehr und mehr über den Kindern absenken. Sobald die Latte den Kopf des ersten Kindes berührt, wissen wir, welches Kind das größte ist. Die Schülerinnen und Schüler stellen in dieser Analogie die Informationen dar, die auf unsere Sinnessysteme treffen. Die 10 Hamburger Fern-Hochschule Was ist Aufmerksamkeit? 1 Körpergröße verbildlicht in dieser Metapher den gewichteten sensorischen Input. Die Messlatte in unserem Beispiel steht hingegen für die Barriere, die ein Reiz über- schreiten muss, damit er für tiefergehende kognitive Prozesse weiterverarbeitet wird (z. B. Enkodierung im Gedächtnis oder Repräsentation im Arbeitsgedächtnis). 1.3 Attenuationstheorie Deutsch und Deutschs (1963) Modell der späten Selektion erfuhr schnell starken Widerspruch. Einige der Argumente gegen die Theorie der späten Selektion liegen dabei auf der Hand: Die Annahme, dass auch nicht beachtete sensorische Informa- tion vollständig verarbeitet und lediglich nicht für weitere Prozesse selektiert wird, impliziert, dass unsere Verarbeitungskapazität grenzenlos zu sein scheint. Zwar kön- nen wir uns nicht jegliche auf uns eintreffende sensorische Information merken oder darauf reagieren, aber verarbeitet wird nach der Theorie der späten Selektion alles. Zweifellos fassten Deutsch und Deutsch (1963) allerdings auch Studienergebnisse zusammen, die sich nicht mit Broadbents Theorie der frühen Selektion vereinbaren lassen. Wie kann es sein, dass Informationen aus nicht beachteten Kanälen zu Inter- ferenz beim Behalten von beachteten Informationen führen? Dieser Frage nahm sich Anne Treisman, eine Schülerin Broadbents und eine Forscherin, von der wir noch hören werden, an. Treismans (1964) Attenuationstheorie kann als eine Erweiterung von Broadbents Filtertheorie verstanden werden, die nicht mehr davon ausgeht, dass unbeachtete Reize schlicht vollkommen ausgeblendet werden. Stattdessen postuliert Treisman, dass Information aus nicht beachteten Kanälen, ähnlich wie bei Deutsch und Deutsch (1963), gewichtet bzw. attenuiert wird. Im Unterschied zu Deutsch und Deutsch geht Treisman allerdings davon aus, dass diese Gewichtung bereits sehr früh stattfindet und nicht erst am Ende der Verarbeitung. Die Attenuationstheorie stellt also in gewisser Weise einen Kompromiss in der De- batte um den Zeitpunkt der Selektion eintreffender Informationen dar: Information wird bereits früh selektiert, wie es von Broadbent postuliert wurde. Zum gleichen Zeitpunkt wird allerdings auch der Input aus nicht beachteten Kanälen gewichtet. Ähnlich wie bei Deutsch und Deutsch muss diese gewichtete, nicht beachtete Infor- mation aber erst einen Schwellenwert überschreiten, um vollends ins Bewusstsein zu gelangen. Dieser Schwellenwert wird, ähnlich wie bei Deutsch und Deutsch, durch die Relevanz des nicht beachteten Inputs determiniert. Im Gegensatz zu Deutsch und Deutsch wird allerdings nicht jegliche nicht beachtete Information voll- ständig verarbeitet, sondern nur, falls es die Gewichtung des nicht beachteten Inputs zulässt. 1.4 Load-Theorie Die heute weitgehend anerkannte Lösung der Debatte zwischen früher und später Selektion in der visuellen Aufmerksamkeitsforschung wurde allerdings erst 30 Jahre später von Nilli Lavie in ihrer Load-Theorie formuliert (Lavie, 1995; Lavie & Tsal, 1994). Laut der Load-Theorie entscheidet nicht die Relevanz eines nicht beachteten Reizes, ob dieser verarbeitet wird, sondern die Verfügbarkeit von Verarbeitungsres- sourcen. Wenn wir eine Aufgabe erledigen, die hohe Anforderungen an unser visu- elles System stellt (etwa durch eine schwierige Unterscheidungsaufgabe oder eine Vielzahl von Distraktoren in einem Suchbildschirm), dann müssen wir alle unsere Verarbeitungsressourcen auf die momentane Aufgabe lenken, um sie effizient erle- digen zu können. Unter diesen Umständen spricht man von einer sogenannten High- 11 Hamburger Fern-Hochschule 1 Was ist Aufmerksamkeit? perceptual-load-Bedingung. Ist eine Aufgabe hingegen relativ einfach, etwa weil der Suchbildschirm außer dem relevanten Reiz nur wenige Distraktoren beinhaltet, spricht man von einer Low-perceptual-load-Bedingung. Lavie (1995) manipulierte die perceptual load in einer Version des Flankierreizpa- radigmas (Eriksen & Eriksen, 1974). Im herkömmlichen Flankierreizparadigma werden Versuchspersonen gebeten, die Identität eines zentral dargebotenen Zielrei- zes zu berichten (z. B. linker Tastendruck, wenn der zentrale Reiz ein B ist, und ein rechter Tastendruck, wenn der zentrale Reiz ein H ist). Wie Sie dem Namen des Paradigmas schon entnehmen konnten, wird dieser zentrale Zielreiz links und rechts von Distraktoren flankiert. Diese Distraktoren können entweder kongruent sein, d. h. mit dem Zielreiz übereinstimmen (z. B. HHH H HHH) oder inkongruent sein, d. h. nicht mit dem Zielreiz übereinstimmen (z. B. BBB H BBB). Der herkömmliche Befund ist, dass kongruente Flankierreize die Antworten beschleunigen, während inkongruente Flankierreize die Reaktionszeiten verlangsamen. Diesen Einfluss der Kongruenz zwischen Distraktoren und Zielreizen bezeichnet man oft auch als Kom- patibilitätseffekt. Lavie (1995) wandelte dieses Flankierreizparadigma für ihre Forschungsfrage leicht ab (siehe Abb. 1.4): Versuchspersonen sollten berichten, ob in der Bildschirmmitte ein z oder ein x zu sehen ist. In der Bedingung, in der die perceptual load niedrig war, wurde der Zielbuchstabe in der Bildschirmmitte in Isolation präsentiert, wäh- rend er in der Bedingung mit höherer perceptual load von irrelevanten Buchstaben umgeben war. Zusätzlich wurde über- oder unterhalb des Zielreizes ein Distraktor präsentiert, der entweder kompatibel (d. h. dieselbe Identität hatte, wie der Zielbuch- stabe) oder inkompatibel sein konnte (d. h. die Identität des anderen Zielbuchstaben hatte). Versuchspersonen wussten, dass die Reize, die über- oder unterhalb des Ziel- reizes präsentiert wurden, für die Aufgabe an sich völlig irrelevant waren. Sie wur- den weiterhin instruiert, diese irrelevanten Reize so gut wie möglich zu ignorieren. Zusätzlich zur Manipulation des Distraktors manipulierte Lavie die perceptual load, indem sie den zentral präsentierten Zielbuchstaben in Isolation präsentierte (low per- ceptual load) oder eingebettet unter anderen, irrelevanten Distraktorbuchstaben (high perceptual load). Abb. 1.4: Beispiele für Suchbildschirme in den Experimenten von Lavie (1995). Versuchspersonen sollten angeben, ob sich in der Bildschirmmitte ein „z“ oder ein „x“ befindet, während sie einen Distraktorreiz, der über oder unter der Bildschirmmitte auftauchte, ignorieren soll- ten. In der Low-perceptual-load-Bedingung (links) wurde der zentrale Buchstabe in Isola- tion präsentiert. In der High-perceptual-load-Bedingung wurde der Zielreiz (x oder z) von anderen, irrelevanten Buchstaben flankiert Lavie fand nun, dass die oben oder unten präsentierten Flankierreize die Reaktions- zeiten der Versuchspersonen nur dann beeinflussten, wenn der Zielbuchstabe in Iso- lation dargeboten wurde (low perceptual load), aber nicht, wenn der Zielbuchstabe unter mehreren irrelevanten Distraktorbuchstaben eingebettet war (high perceptual load). Lavie schloss aus diesen Ergebnissen, dass irrelevante Informationen nur dann 12 Hamburger Fern-Hochschule Was ist Aufmerksamkeit? 1 verarbeitet werden, wenn noch Verarbeitungsressourcen des Wahrnehmungssystems dafür zur Verfügung stehen. Wenn die Aufgabe jedoch komplexer und der Zielreiz unter vielen Distraktoren eingebettet ist, steigen die Anforderungen an unser perzep- tuelles System, und für die Verarbeitung irrelevanter Informationen stehen keine Verarbeitungsressourcen mehr zur Verfügung. Lavies Load-Theorie erfreut sich nach wie vor großer Anerkennung, wird weithin als Lösung in der Debatte um frühe oder späte Selektion angesehen und inspirierte eine Vielzahl von Forschung (für ein Review siehe Murphy, Groeger & Greene, 2016). Nicht unerwähnt sollte allerdings bleiben, dass es auch ganz wesentliche Kri- tikpunkte an der Load-Theorie gibt, nämlich dass die Definition von Perceptual Load oft dazu neigt, ein zirkulärer Schluss zu sein. „Was ist hohe Perceptual Load? Load, die ausreicht, um die Verarbeitung von Distraktoren zu verhindern. Was macht hohe Perceptual Load? Sie verhindert, dass Distraktoren verarbeitet werden“ (Murphy et al., 2016, S. 1329; Übersetzung durch den Verfasser). Während diese zirkuläre De- finition mit Sicherheit eine Herausforderung für die Load-Theorie darstellt, könnten neue physiologische Methoden dabei helfen, Perceptual Load besser mit neuronalen Mechanismen zu erklären (Lavie, 2005). Übungsaufgaben 1.1) Was versteht man unter dichotischem Hören? 1.2) Welche Verarbeitungsstufen postuliert Broadbent (1958) und bis zu welcher Stufe werden nach seiner Theorie auch nicht beachtete Reize verarbeitet? 1.3) Was ist die Grundaussage der Theorie der späten Selektion nach Deutsch und Deutsch (1963)? Welche Aussagen dieser Theorie könnten problematisch sein? 1.4) Worin unterscheiden sich die Theorie der späten Selektion nach Deutsch und Deutsch (1963) und die Attenuationstheorie von Treisman (1964)? 1.5) Beschreiben Sie die Load-Theorie von Lavie (1995). 13 Hamburger Fern-Hochschule 2 Visuelle Suche 2 Visuelle Suche Visuelle Aufmerksamkeit bezeichnet, wie bereits festgestellt, unsere Fähigkeit, ei- nen kleinen Ausschnitt der prinzipiell verfügbaren visuellen Information zu selek- tieren und tiefer zu verarbeiten. Bevor nun näher auf die grundlegenden Mechanis- men der visuellen Aufmerksamkeit eingegangen wird, setzen wir uns mit einigen Forschungsparadigmen der visuellen Aufmerksamkeitsforschung auseinander und beleuchten einige Meilensteine der Theorienbildung in diesem Forschungsfeld. Jede und jeder von uns weiß sicherlich schon, was wir uns unter „visueller Suche“ vorzustellen haben. Schließlich sind wir schon seit klein auf Expertinnen und Exper- ten darin. Ob wir nun Freundinnen oder Freunde in einer Menschenmenge suchen, die reifste Ananas in der Obstabteilung finden wollen oder mit dem Fahrrad fahren: Wir suchen fast permanent nach der Information, die für uns momentan relevant ist oder relevant sein könnte, während wir versuchen, irrelevante visuelle Information so gut wie möglich zu ignorieren. Dieser Vorgang ist für uns so automatisch und selbstverständlich, dass es auf den ersten Blick erstaunen mag, wie viel Forschung dieser alltägliche und unscheinbare Prozess angeregt hat. Um präzise Aussagen über grundlegende Prozesse der visuellen Aufmerksamkeit treffen zu können, müssen visuelle Suchaufgaben im Labor so stark abstrahiert wer- den, dass etwaige Effekte in den Daten tatsächlich nur auf einen der untersuchten Prozesse zurückgeführt werden können. Das bedeutet, dass sich die Grundlagenfor- schung zur visuellen Suche und Aufmerksamkeit primär auf sehr abstrakte Suchauf- gaben im Labor vor einem Computerbildschirm beschränkt, in denen Versuchsper- sonen Antworten via Tastendruck geben. Natürlich sind die Methoden der Aufmerk- samkeitsforschung nicht ausschließlich auf Reaktionszeitmessungen beschränkt, sondern können auch Augenbewegungen aufzeichnen (Eye-Tracking) oder die Ge- hirnaktivität abbilden (größtenteils mittels Elektroenzephalografie [EEG], seltener mittels funktioneller Magnetresonanztomografie [fMRT]). Wenn Sie in den folgenden Abschnitten nun also von visuellen Suchaufgaben lesen, so sind damit computergestützte Experimente gemeint, in denen simple visuelle Reize auf einem Computerbildschirm präsentiert werden und Versuchspersonen ihre Antworten entweder auf herkömmlichen Computertastaturen oder darauf speziali- sierten Response-Boxen geben. 2.1 Merkmalsintegrationstheorie Treisman und Gelade (1980) untersuchten, inwiefern Aufmerksamkeit notwendig ist, um visuelle Merkmale wahrzunehmen und zu verarbeiten. Dazu baten sie ihre Versuchspersonen, zwei Varianten (Blöcke) der visuellen Suche zu erledigen. In bei- den Varianten der Suchaufgabe sollten Versuchspersonen nach einem vorab spezifi- zierten Reiz (= Zielreiz) suchen. Wenn der Zielreiz im Suchbildschirm war, sollten sie die Antwort mit ihrer dominanten Hand geben, während sie mit ihrer nicht domi- nanten Hand antworten sollten, wenn der Zielreiz nicht im Suchbildschirm zu finden war. Der wesentliche Unterschied zwischen den beiden Blöcken bestand in der Wahl der Distraktoren, d. h. jener visuellen Reize, die nicht dem Zielreiz entsprechen. In der sog. Pop-out-Suche war der Zielreiz (z. B. ein grüner Reiz) von homogenen, also gleichfarbigen Distraktoren umgeben (z. B. blaue Reize). Wie der Abbildung 2.1a zu entnehmen ist, ist diese Suche sehr einfach und schnell zu erledigen, da sich der Zielreiz in der Farbdimension von allen ihn umgebenden Distraktoren 14 Hamburger Fern-Hochschule Visuelle Suche 2 unterscheidet. In der zweiten Art von Suche sollten die Versuchspersonen nach einer spezifischen Merkmalskombination (= Konjunktion) suchen (Abb. 2.1b): Nun sollte der Zielreiz nicht mehr nur eine vorab definierte Farbe haben, sondern zusätzlich auch eine spezifische Orientierung (z. B. ein vertikaler grüner Reiz), währen Distrak- toren jeweils eines der beiden Merkmale beinhalten konnten (also entweder vertikal oder grün). Treisman und Gelade (1980) variierten zusätzlich die Anzahl der Dis- traktoren im Suchbildschirm: Während der Zielreiz (sofern vorhanden) in einem Versuchsdurchgang von nur vier Distraktoren umgeben sein konnte, konnte er in einem anderen Durchgang von 14 oder 29 Distraktoren umgeben sein. Diese Art der Manipulation wird oft Set-Size-Manipulation genannt. Treisman und Gelade (1980) fanden, dass die Suchzeit in der Pop-out-Suche von der Set Size unbeeinflusst blieb: Egal wie viele Distraktoren den Zielreiz umgaben, er wurde stets schnell gefunden, und die Anzahl der Distraktoren ließ die Suchzeit un- berührt. Anders verhielt es sich allerdings in der Konjunktionssuche: Die Suchzeit stieg streng monoton mit der Erhöhung der Distraktorzahl an. Besonders eindrück- lich zeigt sich dieser Effekt anhand der Suchfunktionen der beiden Arten der Suche (Abb. 2.1c): Die Suchfunktion stellt die Suchzeit als Funktion der Anzahl von Dis- traktoren im Suchbildschirm dar. Eine flache Suchfunktion bedeutet, dass die Such- zeit unabhängig von der Anzahl der Distraktoren gleich bleibt, während eine Stei- gung in der Suchfunktion verdeutlicht, dass die Suchzeit in Abhängigkeit von der Set Size ansteigt. Abb. 2.1: (a) Beispiel für eine Pop-out-Suche. Der Zielreiz unterscheidet sich in einer Dimension von allen umgebenden Reizen (hier: Farbe) (b) Beispiel für eine Konjunktionssuche. Der Zielreiz ist durch eine Kombination mehre- rer Merkmale (hier: Farbe und Orientierung) gekennzeichnet (c) Schematische Darstellung der Ergebnisse: In der Konjunktionssuche steigt die Such- zeit als eine Funktion der Anzahl der Reize im Suchbildschirm (gestrichelte Linie), während die Suchzeit in der Pop-out-Suche unabhängig von der Anzahl der Reize im Suchbildschirm konstant bleibt (durchgängige Linie) Basierend auf ihren Ergebnissen argumentierten Treisman und Gelade (1980), dass Aufmerksamkeit nicht für jede Art von Suche benötigt wird: Ist der Zielreiz ein Pop- out-Reiz, manchmal auch Singleton genannt, dann können wir alle Reize in einer Szene parallel danach absuchen, ohne jedes Item einzeln analysieren zu müssen. Diese Art der parallelen Suche wird als Evidenz dafür interpretiert, dass unsere Su- che auch prä-attentiv vonstatten gehen kann. An dieser Stelle sei nochmals an Broadbents (1958) Filtertheorie erinnert: Einströmende Reize können bereits vor der Zuwendung von Aufmerksamkeit auf der Basis von physikalischen Merkmalen un- terschieden werden. Um also in der Sprache von Broadbent zu bleiben: Für diese parallele Suche reicht uns auch das sensorische Register, um die Suche effizient 15 Hamburger Fern-Hochschule 2 Visuelle Suche erledigen zu können, und wir müssen für das Auffinden des Zielreizes keine Auf- merksamkeitsressourcen verbrauchen. Gänzlich anders sieht es jedoch aus, wenn wir uns in Abbildung 2.1c die Suchfunk- tion für die Konjunktionssuche ansehen: Je mehr Distraktoren im Suchbildschirm sind, desto länger dauert die Suche. Die steigende Suchfunktion in der Konjunkti- onssuche wird als Evidenz dafür gesehen, dass die Suche nach Merkmalskombinati- onen attentiv erfolgen muss, einzelne Reize also mit Aufmerksamkeit bedacht wer- den müssen, bevor entschieden werden kann, ob es sich bei dem beachteten Reiz um den Zielreiz oder um einen Distraktor handelt. Die eben beschriebenen Befunde ließen Treisman und Gelade (1980) schlussfolgern, dass Aufmerksamkeit als eine Art „Merkmalskleber“ (engl. glue) gesehen werden kann: um mehrere Merkmale miteinander kombinieren zu können, muss ein Reiz mit Aufmerksamkeit bedacht werden. Ist es hingegen nicht nötig, dass ein Reiz mit einer ganz spezifischen Merkmalskombination gefunden werden muss, sondern sich der Zielreiz auf einer einzigen Merkmalsdimension (z. B. Farbe, Orientierung, Hellig- keit, Form, Bewegung) von allen ihn umgebenden Reizen unterscheidet, so kann diese Suche ohne die Zuwendung von Aufmerksamkeit erfolgen. 2.2 Guided Search Während die Merkmalsintegrationstheorie als Meilenstein in der Forschung zur visuellen Aufmerksamkeit gesehen werden kann, werden heute zum größten Teil alternative Theorien zur visuellen Suche herangezogen, allen voran die Theory of Visual Attention (TVA; Bundesen, 1990) und das Guided-Search-Modell (Wolfe, 1994; Wolfe, 2007; Wolfe, Cave & Franzel, 1989). Beide Theorien sind über weite Strecken identisch: Sie nehmen dieselben grundlegenden Prozesse an, die der visu- ellen Aufmerksamkeit zugrunde liegen, und nehmen auch an, dass die Interaktionen zwischen diesen Prozessen sehr ähnlich sind. Eine Stärke und zugleich Schwäche der TVA ist, dass die TVA ein sehr mathematisches Modell ist. Durch diesen Um- stand lassen sich zwar sehr präzise Vorhersagen ableiten, allerdings leidet auch die Zugänglichkeit zum Modell unter dessen Komplexität. Im Gegensatz dazu hat das Guided-Search-Modell von Jeremy Wolfe in der Aufmerksamkeitsforschung mehr Resonanz gefunden, da es intuitiver und deskriptiver ist. Zudem wird es fortlaufend weiterentwickelt und ist seit seiner ersten Formulierung (Wolfe et al., 1989) bereits dreimal um neue Befunde ergänzt worden (Guided Search 4.0; Wolfe, 2007). Das Guided-Search-Modell versucht zu erklären, warum wir unsere Aufmerksam- keit dorthin lenken, wohin wir sie lenken. Zu diesem Zweck geht die Guided-Search- Theorie von einer sog. Aktivierungskarte aus, die topografisch organisiert ist. Das bedeutet, dass Regionen, die in unserer Umwelt benachbarte Positionen einnehmen, auch in der Aktivierungskarte benachbart sind. Der Ort mit der höchsten Aktivierung in der Aktivierungskarte gewinnt das Rennen um unsere Aufmerksamkeit und wird beachtet (siehe auch Müller, Krummenacher & Schubert, 2015). Die Aktivierungs- karte erhält Input von zwei separaten Mechanismen: dem Bottom-up- und dem Top- down-Mechanismus. Der Bottom-up-Mechanismus berechnet automatisch Merkmalskontraste, die in ei- ner visuellen Szene vorhanden sind. Wenn sich ein Reiz in einem oder mehreren Merkmalen von benachbarten Reizen unterscheidet, ergibt sich daraus ein sog. Sali- enzsignal. Dieses Salienz-signal wird nicht nur durch den Unterschied zwischen zwei Reizen determiniert, sondern auch durch deren Nähe zueinander, der 16 Hamburger Fern-Hochschule Visuelle Suche 2 Homogenität der umgebenden Reize und der Anzahl der umgebenden homogenen Reize (z. B. Bravo & Nakayama, 1992). Abbildung 2.2 stellt diese Einflüsse auf die Stärke des Salienzsignals grafisch dar. Um all diese Faktoren noch zusätzlich mit einem realistischen Beispiel zu verdeutlichen, stellen wir uns vor, wir wollen in der Obstabteilung einen besonders schönen roten Apfel kaufen. Wenn wir vor einer Steige stehen, die voller grüner Granny-Smith-Äpfel ist, dann fällt uns ein einzelner roter Apfel mitten unter den Granny Smiths recht deutlich auf, d. h. der rote Apfel ist salient. Stehen wir jedoch vor einer Kiste, die voll mit unterschiedlichen Äpfeln ist (grünen, gelben, rot-gelben), dann ist der einzelne rote Apfel zwar immer noch auffällig, jedoch nicht mehr so auffällig, als würde er nur unter einfarbigen Äpfeln liegen. Zudem ist der Kontrast meines roten Apfels auch wesentlich stärker, wenn er zwischen vielen grünen Äpfeln liegt und nicht nur zwischen zwei grünen Äpfeln. Der Bottom-up-Mechanismus kann uns bei sehr einfachen Suchen, wie etwa der Pop-out-Suche in Treisman und Gelade (1980) sehr dienlich sein: Er findet automa- tisch und ohne unser Zutun statt. Wenn wir nur nach auffälligen Merkmalen suchen, ist es also nicht zwangsläufig notwendig, dass wir ein bestimmtes Merkmal in unse- rer Aufgabenkontrollstruktur repräsentieren. Abb. 2.2: Einflüsse auf die Stärke des Salienzsignals Der Top-down-Mechanismus repräsentiert hingegen unsere Absichten, die wir in unserer Aufgabenkontrollstruktur gespeichert haben. Der Top-down-Mechanismus gewichtet dabei den Input, den wir vom Bottom-up-Mechanismus erhalten. Suchen wir beispielsweise nach einer bestimmten Orientierung oder Farbe, dann wird die Aktivierung von Regionen, die das gesuchte Merkmal in sich tragen, nochmals auf- gewichtet. Die Top-down-Gewichtungen werden im Guided-Search-Modell für jede Merkmalsdimension (Farbe, Orientierung etc.) in separaten Merkmalskarten vorge- nommen. Abbildung 2.3 versucht, diesen Umstand zu verbildlichen. Beachten Sie dabei bitte, dass die exakten Werte für die Bottom-up-Aktivierung und die Top- down-Gewichte willkürlich gewählt wurden und lediglich dazu dienen sollen, das Konzept der Gewichtungen bildlich darzustellen. 17 Hamburger Fern-Hochschule 2 Visuelle Suche Abb. 2.3: Schematische Darstellung des Zusammenspiels von Bottom-up- und Top-down-Prozessen, wie es im Guided-Search-Modell von Wolfe (1994) postuliert wird Nach dem Guided-Search-Modell wird die Aufmerksamkeit auf den Ort mit der höchsten Aktivierung in der Aktivierungskarte gelenkt und zwar nach dem Winner- take-all-Prinzip. Das bedeutet, dass man nicht den Ort mit der zweit- oder dritt- höchsten Aktivierung mit Aufmerksamkeit bedenkt, sondern nur jenen Ort mit der höchsten Gesamtaktivierung. Erst wenn der Ort mit der höchsten Gesamtaktivierung beachtet wurde, können andere Stellen der visuellen Szene mit Aufmerksamkeit be- dacht werden. 2.3 Hinweisreizparadigma nach Posner Bevor wir uns näher mit den Top-down- und Bottom-up-Prozessen beschäftigen, werfen wir noch einen Blick auf ein historisch sehr bedeutsames Untersuchungspa- radigma: das Hinweisreizparadigma (oder Cueing Paradigma) nach Posner (1980; siehe auch Posner, Snyder & Davidson, 1980). Mithilfe des Hinweisreizparadigmas (Cues) wurde eine Vielzahl an Aufmerksamkeitseffekten erstmals beschrieben, und es wird heute sehr oft in einer modifizierten Form verwendet. Posner verwendete zwei Arten von Hinweisreizen (endogene und exogene bzw. zentrale und perip- here Hinweisreize), mit denen er endogene und exogene Aufmerksamkeitsverlage- rungen beschrieb. Im Hinweisreizparadigma werden Versuchspersonen gebeten, nach einem Zielreiz zu suchen, der an einer von mehreren Positionen in einem Suchbildschirm auftreten kann. Es handelt sich also, wie bereits bekannt, um eine visuelle Suchaufgabe. Im Gegensatz zu den bisher beschriebenen visuellen Suchaufgaben wird den Versuchs- personen zeitlich kurz vor dem Suchbildschirm ein sog. Hinweisreiz präsentiert, der die korrekte Zielreizposition mit einer bestimmten Wahrscheinlichkeit (Prädiktabi- lität) vorhersagt. Sofern nicht anders angegeben, sagen die Hinweisreize die korrekte Zielreizposition lediglich auf Zufallsniveau voraus. Das bedeutet, dass der Hinweis- reiz bei zwei möglichen Zielreizpositionen die korrekte Position in 50 % der Durch- gänge anzeigt, bei vier möglichen Zielreizpositionen in 25 % der Durchgänge usw. Sagt der Hinweisreiz in einem Durchgang die korrekte Zielreizposition voraus, spricht man von einem validen Durchgang. Zeigt der Hinweisreiz hingegen eine Po- sition an, an deren Stelle im Suchbildschirm ein Distraktor präsentiert wird, spricht 18 Hamburger Fern-Hochschule Visuelle Suche 2 man von einem invaliden Durchgang. Durch diese Variation der Hinweisreizvalidi- tät lässt sich ein Marker für die Aufmerksamkeitslenkung durch den Hinweisreiz berechnen: der Validitätseffekt. Der Validitätseffekt ist die Reaktionszeitdifferenz zwischen Durchgängen mit invaliden und validen Hinweisreizen: Validitätseffekt = Reaktionszeitinvalide – Reaktionszeitvalide Wenn ein Hinweisreiz die Aufmerksamkeit auf sich zieht und die Aufmerksamkeit an die Stelle des Hinweisreizes wandert, befindet sich die Aufmerksamkeit im Falle eines validen Durchganges bereits an der korrekten Zielreizposition und muss nicht neu, d. h. auf die korrekte Zielreizposition, ausgerichtet werden. Ist ein Hinweisreiz hingegen invalide, befindet sich unsere Aufmerksamkeit beim Auftauchen des Such- bildschirms an der Position eines Distraktors, und unsere Aufmerksamkeit muss erst auf die Position des Zielreizes verlagert werden, um eine Antwort darauf geben zu können (z. B. „Ist der Zielreiz ein E oder ein H?“). Der Validitätseffekt bildet also die Zeit ab, die eine Neuausrichtung der Aufmerksamkeit in Anspruch nimmt und liefert Evidenz dafür, ob der Hinweisreiz die Aufmerksamkeit auf sich gelenkt hat. Mithilfe des Hinweisreizparadigmas wurde zudem eine sehr wichtige Unterschei- dung zwischen zwei Arten der Aufmerksamkeitsverlagerung popularisiert: offene und verdeckte Aufmerksamkeitsverlagerungen. Werfen Sie einen Blick auf Abbil- dung 2.4. Dort sehen Sie, dass die Hinweisreize für lediglich 50 Millisekunden (ms) präsentiert werden und die zeitliche Differenz zwischen dem Auftreten des Hinweis- reizes und dem Auftreten des Zielreizes lediglich 150 ms beträgt. Dieses Intervall ist zu kurz, um eine Augenbewegung (Sakkade) zu initiieren und auszuführen. Das be- deutet, dass etwaige gefundene Aufmerksamkeitseffekte durch verdeckte Aufmerk- samkeitsverlagerungen zustande gekommen sein müssen, d. h. durch Aufmerksam- keitsverlagerungen, die ohne korrespondierende Augenbewegungen zustande ge- kommen sind. Von offenen Aufmerksamkeitsverlagerungen spricht man hingegen, wenn der Ort der Aufmerksamkeit mit der Ausrichtung des Blickes übereinstimmt. Auch wenn diese Unterscheidung aufs Erste eigenwillig erscheinen mag: Verdeckte Aufmerksamkeitsverlagerungen sind uns allen bekannt, etwa wenn wir etwas aus den Augenwinkeln beobachten, ohne dass wir unseren Blick darauf ausrichten. 2.3.1 Endogene Hinweisreize In einer Version seines Hinweisreizparadigmas präsentierte Posner seinen Versuchs- personen sog. endogene Hinweisreize. Diese endogenen Hinweisreize wurden zent- ral in der Bildschirmmitte präsentiert (siehe Abb. 2.4). Da der Hinweisreiz eine Be- deutung haben muss, der man eine Richtung entnehmen kann (wie etwa einem Pfeil), spricht man bei den endogenen Hinweisreizen auch von „symbolischen“ Hinweis- reizen. 19 Hamburger Fern-Hochschule 2 Visuelle Suche Abb. 2.4: Aufbau eines Durchgangs im Hinweisreizparadigma nach Posner (1980) mit endogenen Hinweisreizen. In der oberen Reihe wird ein valider Durchgang dargestellt, in dem der Hin- weisreiz die korrekte Zielreizposition anzeigt. In der unteren Reihe zeigt der Hinweisreiz je- doch die inkorrekte Position an, weshalb man in diesem Fall von einem invaliden Durch- gang spricht. Posner variierte nun die Vorhersagekraft dieser zentralen Hinweisreize: In einem Set von Durchgängen zeigte der Hinweisreiz die korrekte Zielreizposition lediglich auf Zufallsniveau (50 %) an. In einem anderen Set von Durchgängen zeigte der Hinweis- reiz die korrekte Zielreizposition hingegen mit einer Vorhersagekraft von 80 % vo- raus. Posner (1980) fand, dass zentral präsentierte Hinweisreize nur dann zu Validitätsef- fekten führten, wenn sie die Zielreizposition überzufällig oft korrekt anzeigten. Nicht prädiktive Hinweisreize hingegen zogen keinen Validitätseffekt nach sich: Die Re- aktionszeiten unterschieden sich nicht signifikant zwischen validen und invaliden Versuchsdurchgängen. Posner schloss aus dieser Beobachtung, dass wir scheinbar in der Lage sind, zentrale Hinweisreize zu ignorieren, wenn sie uns nicht bei der Bewältigung der Aufgabe helfen. Es wird gemutmaßt, dass dem so ist, da dem sym- bolischen Hinweisreiz willentlich die Bedeutung entnommen werden muss, die Auf- merksamkeit also unter unserer Kontrolle steht. 2.3.2 Exogene Hinweisreize Im Gegensatz zu endogenen Hinweisreizen erscheinen exogene Hinweisreize direkt an einer der möglichen Zielreizpositionen, weshalb sie auch oft periphere Hinweis- reize genannt werden. In Abbildung 2.5 sehen Sie Beispiele dafür, wie periphere Hinweisreize gestaltet sein können. Es ist nicht unbedingt relevant, wie exakt peri- phere Hinweisreize gestaltet sind. So können sie, wie in Abbildung 2.5 dargestellt, durch eine Verdickung der Platzhalter gekennzeichnet sein (z. B. Büsel, Pomper & Ansorge, 2018; Carmel & Lamy, 2015) oder aber auch aus Punkten um die Platzhal- ter bestehen (z. B. Folk, Remington & Johnston, 1992; Irons, Folk & Remington, 2012). Relevant ist, dass periphere Hinweisreize direkt an einer der potenziellen Zielreizpositionen auftauchen. 20 Hamburger Fern-Hochschule Visuelle Suche 2 Abb. 2.5: Aufbau eines Durchgangs im Hinweisreizparadigma nach Posner (1980) mit exogenen Hin- weisreizen. Im Gegensatz zu endogenen Hinweisreizen erscheinen exogene Hinweisreize direkt an einer der möglichen Zielreizpositionen Ähnlich wie bei den endogenen Hinweisreizen manipulierte Posner die Vorhersage- kraft der exogenen Hinweisreize (50 % vs. 80 %). Wie bereits bei den endogenen Hinweisreizen fand Posner Evidenz für Aufmerksamkeitsverlagerungen (d. h. Vali- ditätseffekte) für exogene Hinweisreize, die eine Vorhersagekraft von 80 % aufwie- sen. Anders als für endogene Hinweisreize fand Posner allerdings auch einen Vali- ditätseffekt für Hinweisreize, welche die korrekte Zielreizposition lediglich auf Zu- fallsniveau vorhersagten. Das bedeutet, dass wir scheinbar nicht in der Lage sind, periphere Reize willentlich zu unterdrücken, und dass ihre Fähigkeit, unsere Auf- merksamkeit anzuziehen, automatisch und scheinbar reizgetrieben (d. h. bottom-up) zu sein scheint. Warum scheinen periphere (Hinweis-)Reize in der Lage zu sein, unsere Aufmerk- samkeit automatisch und unwillentlich anzuziehen? Eine Erklärung, die auch evolu- tionäre Ansätze miteinbezieht, stammt von Sokolov (1963; zitiert nach Folk & Re- mington, 2015). Nach Sokolov entnehmen wir der Welt ständig Informationen über unsere Umgebung und bilden auf Basis unserer Erfahrungen Vorhersagen über diese. Wenn nun plötzlich ein markanter, peripherer Reiz auftritt, könnte dieser eine Gefahr, wie etwa ein Raubtier, repräsentieren, woraufhin wir schnelle Entscheidun- gen treffen müssen, um unser Überleben zu sichern („fight or flight“). Da dieser Orientierungsreflex auf periphere Reize evolutionär alt ist, sei er kaum kontrollier- bzw. unterdrückbar (siehe allerdings den Abschnitt zur Top-down-Kontrolle unten). Ein weiteres interessantes Phänomen wurde bezüglich peripherer Hinweisreize beo- bachtet, nämlich die Inhibition of Return (Klein, 2000; Posner & Cohen, 1984). Die Inhibition of Return bezeichnet das Phänomen, dass sich Validitätseffekte bei Intervallen von über 150 ms zwischen dem Auftreten des Hinweisreizes und des Zielreizes umkehren: Valide Durchgänge führen nun zu signifikant längeren Reakti- onszeiten als invalide Durchgänge. Es wird angenommen, dass eine Stelle, die kurz davor mit Aufmerksamkeit bedacht wird, für kurze Zeit nicht mehr als Ziel der Auf- merksamkeit infrage kommt. Manche Forscher mutmaßen, dass damit verhindert werden soll, dass die salienteste Position immer und immer wieder beachtet wird (Itti & Koch, 2001). Neuere Forschung zeigt jedoch, dass man sich die Aufmerksamkeitsverlagerungen nicht als einen Entweder-oder-Prozess vorstellen sollte, in dem nur eine Stelle mit Aufmerksamkeit bedacht wird und dann eben nicht mehr, sondern dass die Aufmerk- samkeit stattdessen zyklisch alle potenziell relevanten Positionen einer Szene abtas- tet (engl. sampled): Variiert man das Intervall zwischen Hinweis- und Zielreizen zwischen 10 und 1000 ms, zeigt sich für jedes dieser Intervalle ein Hin und Her 21 Hamburger Fern-Hochschule 2 Visuelle Suche zwischen Validitätseffekten und Inhibition of Return. Diesen Befund nennt man at- tentional sampling (Landau & Fries, 2012). Übungsaufgaben 2.1) Was ist der Unterschied zwischen Pop-out-Suche und Konjunktionssuche? 2.2) Welche Aussagen lassen sich von der Suchfunktion ableiten? 2.3) Welche Interaktion zwischen Bottom-up- und Top-down-Prozessen beschreibt die Guided- Search-Theorie von Wolfe (1994)? 2.4) Beschreiben Sie den Aufbau des Hinweisreizparadigmas. Wie wird der Validitätseffekt berech- net und was sagt er aus? 2.5) Welche Unterschiede konnten zwischen endogenen und exogenen Hinweisreizen gefunden werden? 22 Hamburger Fern-Hochschule Bottom-up- vs. Top-down-Debatte 3 3 Bottom-up- vs. Top-down-Debatte Im Kapitel der Guided Search wurde bereits beschrieben, dass für die visuelle Suche sowohl Bottom-up- als auch Top-down-Mechanismen rekrutiert werden. Wenn man bedenkt, wann das Guided-Search-Modell zum ersten Mal beschrieben wurde (Wolfe et al., 1989), kann man nur erstaunt darüber sein, wie fortschrittlich dieses Modell für seine Zeit war. Seit Ende der 80er-Jahre tobt nämlich eine Debatte zwi- schen Vertreterinnen und Vertretern der Bottom-up-Perspektive (z. B. Theeuwes, 1992, 2010) sowie Vertreterinnen und Vertretern der Top-down-Perspektive (z. B. Ansorge & Heumann, 2003; Folk et al., 1992) der Aufmerksamkeit, die sich nur langsam und zögerlich dem Ende zuneigt (Luck, Gaspelin, Folk, Remington & Theeuwes, 2020). Es sei vorausgeschickt, dass keine Seite dieser Debatte annahm bzw. annimmt, dass nur einer der beiden Mechanismen hauptverantwortlich für die visuelle Aufmerk- samkeit sei. Beide Seiten dieser Debatte nehmen an, dass sowohl Bottom-up- als auch Top-down-Mechanismen in einem Suchprozess eine Rolle spielen. Hinter- grund dieser Debatte war und ist allerdings, welcher Prozess die frühesten Stadien der Aufmerksamkeitslenkung steuert bzw. dominiert. Auch wenn diese Debatte mit- unter mit harten Bandagen geführt wurde, motivierte sie eine Unmenge an For- schung, die unser Wissen um visuelle Aufmerksamkeitsprozesse enorm vertieft hat. 3.1 Bottom-up-Theorie der visuellen Aufmerksamkeit Die Bottom-up-Theorie der visuellen Aufmerksamkeit besagt, dass der salienteste (d. h. auffälligste) Reiz in einer visuellen Szene unsere Aufmerksamkeit automatisch auf sich zieht (Itti & Koch, 2001; Theeuwes, 2010). Laut dieser Perspektive ist es irrelevant, welche Absichten die suchende Person hat (ob die Person also etwa nach einem bestimmten Merkmal sucht), lediglich die Auffälligkeit eines Reizes entschei- det, ob er die Aufmerksamkeit kapert. Top-down-Suchabsichten kommen laut der Bottom-up-Theorie der visuellen Aufmerksamkeit nur nach der Selektion eines Rei- zes zum Tragen, wenn man entscheiden muss, ob es sich bei dem selektierten Reiz um den von mir gesuchten handelt. In der initialen (prä-attentiven) Phase der visuel- len Suche hätten Top-down-Prozesse hingegen keinen Einfluss. Die Bottom-up-Theorie der visuellen Aufmerksamkeit hat den Vorteil, dass sie sehr leicht und intuitiv nachvollziehbar ist. Zudem gibt es eine Menge an empirischer Evidenz für diese Perspektive, die primär aus dem Additional-Singleton-Paradigma (Theeuwes, 1991, 1992) stammt. 3.1.1 Additional-Singleton-Paradigma Das Additional-Singleton-Paradigma wurde Anfang der 90er-Jahre von Jan Theeu- wes entwickelt und wird bis heute in seiner ursprünglichen Form weiterverwendet. Bevor wir uns aber näher ansehen, wie und was das Additional-Singleton-Paradigma misst, beleuchten wir den Begriff Singleton etwas näher. Singletons sind Reize, die sich in einer Merkmalsdimension (z. B. Farbe, Orientie- rung, Größe, Helligkeit etc.) von allen umgebenden Reizen unterscheiden und des- halb besonders auffällig sind (siehe Abb. 3.1). Vielleicht kommt Ihnen diese Defini- tion bereits bekannt vor, und zwar aus dem Abschnitt zur Merkmals- 23 Hamburger Fern-Hochschule 3 Bottom-up- vs. Top-down-Debatte integrationstheorie: In der Pop-out-Suche sollten Versuchspersonen genau nach ei- nem solchen Farb-Singleton suchen. Abb. 3.1: Beispiele für verschiedene Arten von Singletons Theeuwes (1992) bat seine Versuchspersonen, nach einem Singleton in einer Dimen- sion zu suchen und ein anderes Merkmal zu berichten (z. B. „Ist die Linie im Zielreiz horizontal oder vertikal?“), beispielsweise nach einem grünen Diamanten unter grü- nen Kreisen (Abb. 3.2a). Das bedeutet, der Zielreiz ist ein Form-Singleton. In 50 % der Durchgänge ist das zu suchende Singleton das einzige Singleton im Suchbild- schirm und daher auch der salienteste Reiz. In den anderen 50 % der Durchgänge wird zusätzlich zum Zielreiz jedoch ein weiteres Singleton präsentiert: Einer der Dis- traktorkreise wird mit einer einzigartigen Farbe (z. B. Rot) eingefärbt (Abb. 3.2b). Es ist wichtig zu beachten, dass das rote Farb-Singleton niemals mit dem Form-Sin- gleton koinzidiert. Versuchspersonen haben also jeden Grund, das Farb-Singleton so gut wie möglich zu ignorieren. Zusätzlich zur Variation, ob ein zusätzliches Farb- Singleton im Suchbildschirm präsentiert wurde oder nicht, variierte Theeuwes auch die Anzahl der Reize im Suchbildschirm, um demonstrieren zu können, dass es sich bei seiner Art von Suche um eine prä-attentive Suche handelt. Abb. 3.2: (a) Ein Beispiel für einen Durchgang des Additional-Singleton-Paradigmas von Theeuwes (1992) ohne zusätzliches (Farb-)Singleton (b) Ein Beispiel für einen Durchgang des Aditional-Singleton-Paradigmas mit zusätzli- chem (Farb-)Singleton (c) Schematische Darstellung der Ergebnisse: Reaktionszeiten (RTs) aus Durchgängen mit einem Farbdistraktor (gepunktete Linie) waren signifikant langsamer als RTs aus Durchgängen ohne Farbdistraktor 24 Hamburger Fern-Hochschule Bottom-up- vs. Top-down-Debatte 3 3.1.2 Interferenzeffekt Theeuwes (1992) fand mithilfe seines Additional-Singleton-Paradigmas den soge- nannten Interferenzeffekt: Reaktionszeiten waren systematisch und signifikant langsamer, wenn das zusätzliche Farb-Singleton im Suchbildschirm präsentiert wurde, als wenn der Zielreiz das einzige Singleton und daher der salienteste Reiz im Suchbildschirm war (Abb. 3.2c). Zusätzlich dazu gaben Versuchspersonen wesent- lich mehr fehlerhafte Antworten, wenn das zusätzliche Farb-Singleton im Suchbild- schirm präsentiert wurde, als wenn das Farb-Singleton nicht präsentiert wurde. Des Weiteren fand Theeuwes keinen Einfluss der Reizanzahl im Suchbildschirm, was darauf hindeutet, dass die Versuchspersonen die Suche prä-attentiv erledigen konn- ten und der Interferenzeffekt tatsächlich in den frühesten Stufen der visuellen Ver- arbeitung entstanden ist. Was bedeutet dieser Interferenzeffekt? Theeuwes (1992) sieht ihn als Evidenz dafür, dass der saliente Farbdistraktor die Aufmerksamkeit initial an seine Stelle lenkt und somit die Suchzeit nach dem Zielreiz verlängert. Ähnlich dem oben angesprochenen Validitätseffekt handelt es sich beim Interferenzeffekt also um ein Differenzmaß, das die Verlagerung der Aufmerksamkeit vom Distraktor hin zum Zielreiz repräsen- tiert – mit dem Unterschied, dass es im Additional-Singleton-Paradigma keine zeit- liche Diskontinuität zwischen dem Distraktor bzw. Hinweisreiz und dem Zielreiz gibt. Abgesehen davon kann die Distraktorposition im Additional-Singleton-Para- digma niemals mit der Zielreizposition koinzidieren, weshalb eine willentliche Auf- merksamkeitsverlagerung hin zum Distraktor für die Versuchspersonen kontrapro- duktiv wäre. Neben dem Umstand, dass der Interferenzeffekt vielfach repliziert wurde (für ein Review siehe Theeuwes, 2010), ist er nicht nur zwischen Studien stabil, sondern auch über enorm viele Durchgänge für jede Versuchsperson. In seinem Experiment 1B untersuchte Theeuwes (1992), wie sehr sich Übung auf den Interferenzeffekt aus- wirkt, um zu testen, ob der Effekt tatsächlich unwillkürlich und automatisch ist oder ob er durch Übung vermindert bzw. gar beseitigt werden kann. Dazu ließ Theeuwes seine Versuchspersonen 288 Übungsdurchgänge (im Gegensatz zu etwa 20 bis 40 Übungsdurchgängen in herkömmlichen Experimenten, die von der Analyse ausge- schlossen werden) absolvieren, gefolgt von 1728 Hauptdurchgängen (also jenen Durchgängen, die analysiert werden). Trotz dieser exzessiven Übung mit der Auf- gabe zeigten sich dennoch praktisch gleichbleibende Interferenzeffekte durch das zusätzliche Farb-Singleton im Suchbildschirm. Ferner konnte Theeuwes (1992) feststellen, dass die Interferenz durch ein zusätzli- ches Singleton nicht in jeder Merkmalsdimension dieselben Konsequenzen hatte: Wenn Versuchspersonen nach einem grünen Kreis suchen sollten, der von roten Kreisen umgeben war, dann interferierte ein roter Diamant, der in der Hälfte der Durchgänge im Suchbildschirm präsentiert wurde (Zielreiz = Farb-Singleton, Addi- tional Singleton = Form-Singleton), nicht mit der Suche. Theeuwes erklärt diese Asymmetrie in den Interferenzeffekten durch die unterschiedliche relative Salienz der Distraktoren. Diesen Umstand können wir uns auch bewusst machen, wenn wir überlegen, ob uns im Straßenverkehr eher ein Warnhinweis mit einer spezifischen Farbe auffallen würde oder mit einer spezifischen Form. 25 Hamburger Fern-Hochschule 3 Bottom-up- vs. Top-down-Debatte 3.1.3 Salienzkarten Salienz als Konzept ist recht intuitiv verständlich: Ein Ort bzw. Reiz, der sich be- sonders stark von seiner direkten Umgebung unterscheidet, ist auffällig, d. h. salient. Auffälligkeit beruht laut dieser Herangehensweise also ausschließlich auf objektiven Eigenschaften eines Bildes bzw. einer Szene. Entsprechend gab es viele Versuche, Algorithmen zu entwickeln, die auf Basis von Bildanalysen jenen Ort in einer Szene ermitteln können. Bekannte Beispiele dafür sind das Salienzmodell von Itti und Koch (2001; Itti, Koch & Niebur, 1998) oder der Graph-Based-Visual-Sa- liency(GBVS)-Algorithmus von Harel, Koch und Perona (2006). Das Salienzmodell von Itti und Koch (2001) analysiert ein Bild anhand mehrerer Merkmalskarten (vgl. Guided Search; Wolfe, 2007): je einer Merkmalskarte für Farbe, Intensität sowie Orientierung. Das Bild wird anhand dieser Merkmale in separaten Merkmalskarten analysiert. Anschließend werden die resultierenden Merkmalskarten wieder linear (d. h. ungewichtet) miteinander kombiniert und bilden die sogenannte Salienzkarte, die in Form einer Heatmap dargestellt wird. Jener Ort mit der höchsten Gesamtakti- vierung ist der Ort mit der höchsten Salienz und wird entsprechend den beiden The- orien als Erstes beachtet. Das Salienzmodell und GBVS können den Ort der ersten Fixation mit einer Akkuratheit von 84 % bzw. 98 % vorhersagen (Harel et al., 2006). Während das Salienzmodell und GBVS heute tendenziell im technischen und mili- tärischen Bereich verwendet werden, können beide Modelle auch die Salienz im Ad- ditional-Singleton-Paradigma von Theeuwes (1992) recht präzise vorhersagen. Wer- fen Sie bitte einen Blick auf Abbildung 3.3. Diese Abbildung stellt eine Salienzkarte eines Versuchsdurchgangs des Additional-Singleton-Paradigmas dar, in der ein zu- sätzliches Farb-Singleton im Suchbildschirm enthalten ist. Wie unschwer erkennbar ist, sind sowohl der Zielreiz als auch das Farb-Singleton die salientesten Reize im Suchbildschirm. Bei genauerer Betrachtung stellt man sogar fest, dass das zusätzli- che Farb-Singleton noch um eine Spur salienter als der Zielreiz ist. Abb. 3.3: Links sehen Sie einen Durchgang aus dem Additional-Singleton-Paradigma mit einem zu- sätzlichen Farb-Singleton. Rechts sehen Sie die Salienzkarte desselben Durchgangs. Die Salienzkarte wurde mit dem GBVS-Algorithmus von Harel et al. (2006) erstellt. Wie aber wird verhindert, dass wir stets nur den salientesten Ort beachten? Letztlich ist es auch möglich, dass saliente Orte zwar potenziell relevant sind, allerdings nicht jene Information beinhalten, nach der ich suche. Laut Itti und Koch (2001) gewinnt der Ort mit der höchsten Salienz zwar das Rennen um die Aufmerksamkeit, wenn diese Position von uns allerdings als irrelevant klassifiziert wird, wandert die Auf- merksamkeit zum Ort mit der zweithöchsten Salienz. Den Mechanismus, der verhin- dern soll, dass wir immer wieder zurück zum Ort mit der höchsten Aufmerksamkeit wandern, kennen wir bereits aus dem Hinweisreizparadigma von Posner (1980): In- hibition of Return. Itti und Koch postulieren, dass ein vormals beachteter Ort als irrelevant markiert wird und die Inhibition of Return verhindert, dass unsere Auf- merksamkeit immer wieder auf dieselbe Position zurückwandert. 26 Hamburger Fern-Hochschule Bottom-up- vs. Top-down-Debatte 3 3.2 Top-down-Theorie der visuellen Aufmerksamkeit Im Gegensatz zur Bottom-up-Theorie der visuellen Aufmerksamkeit räumt die Top- down-Theorie den Absichten der suchenden Person wesentlich mehr Einfluss ein. Top-down-Mechanismen umfassen zum einen explizite Suchabsichten („Ich muss jetzt nach Merkmal XY suchen“), aber auch unter anderem Inhalte des Langzeitge- dächtnisses (Giammarco, Plater, Hryciw & Al-Aidroos, 2020), Motivationen (Ray- mond & O’Brien, 2009), Süchte (Field & Cox, 2008) oder konzeptionelle Assozia- tionen (Wyble, Folk & Potter, 2013). Kurz gesagt, Top-down-Mechanismen umfas- sen jene Prozesse, die innerhalb des Organismus stattfinden, im Gegensatz zu Bot- tom-up-Mechanismen, die dem Organismus durch die Umwelt auferlegt werden. Diese Definition impliziert nicht, dass Top-down-Prozesse willkürlich und kontrol- liert sein müssen, wie etwa Theeuwes (2018) argumentiert (siehe aber Gaspelin & Luck, 2018a). Wie wir gleich im Contingent-Capture-Paradigma sehen werden, kann auch eine Top-down-Steuerung der Aufmerksamkeit automatisch und unfreiwillig geschehen. 3.2.1 Contingent-Capture-Paradigma Das Contingent-Capture-Paradigma wurde 1992 von Folk et al. im Rahmen ihrer Forschung für die National Aeronautics and Space Administration (aka NASA) ent- wickelt. Beim Contingent-Capture-Paradigma handelt es sich um eine modifizierte Version des Hinweisreizparadigmas von Posner (1980): Versuchspersonen sollten entweder nach einem einzelnen, plötzlich auftauchenden weißen Reiz (Onset) su- chen oder nach einem roten Reiz, der unter weißen Distraktoren auftauchte. In bei- den Fällen sollten die Versuchspersonen via Tastendruck angeben, ob es sich bei dem Zielreiz um ein „X“ oder um ein „=“ handelt. Zeitlich kurz vor dem Suchbild- schirm wurden an einer der möglichen Zielreizpositionen, also peripher, Hinweis- reize präsentiert, die entweder weiße Onset-Hinweisreize oder rote Hinweisreize wa- ren (siehe Abb. 3.4). Abb. 3.4: Schematischer Aufbau eines Durchgangs im Contingent-Capture-Paradigma von Folk et al. (1992). In diesem Beispiel sollen Versuchspersonen nach einem roten Zielreiz suchen (rechts). Zeitlich kurz vor dem Suchbildschirm werden Hinweisreize präsentiert, die entwe- der zu den Suchabsichten der Versuchspersonen passen (unten), oder Hinweisreize, die nicht zu den Suchabsichten der Versuchspersonen passen (oben) In Abbildung 3.4 sehen wir beispielhaft, wie Durchgänge in der Farbsuchbedingung aussehen konnten. Wie bereits bei Posner (1980) konnten die vor dem 27 Hamburger Fern-Hochschule 3 Bottom-up- vs. Top-down-Debatte Suchbildschirm präsentierten Hinweisreize an der nachfolgenden Zielreizposition auftreten (valide Bedingung) oder an einer Distraktorposition (invalide Bedingung). Zu beachten ist, dass die Hinweisreize im Schnitt über alle Durchgänge hinweg keine Vorhersagekraft über die korrekte Zielreizposition hatten, also lediglich in 25 % der Durchgänge valide waren. Die wichtige Modifikation in dem experimentellen Design von Folk et al. (1992) betraf aber die Hinweisreizpassung: Der Hinweisreiz konnte entweder top-down passend sein, also mit den Suchabsichten der Versuchspersonen übereinstimmen, o- der top-down nicht passend, also nicht mit den Suchabsichten der Versuchspersonen übereinstimmen. Im konkreten Beispiel in Abbildung 3.4 wäre die Top-down-Such- einstellung „Suche nach dem roten Zielreiz“. Entsprechend sind die roten Hinweis- reize top-down passend und die weißen Onset-Hinweisreize top-down nicht passend. Folk et al. (1992) konnten demonstrieren, dass sich Validitätseffekte nur für jene Hinweisreize finden lassen, die mit den momentanen Suchabsichten der Versuchs- personen übereinstimmten, also top-down passend waren. Top-down nicht passende Hinweisreize konnten hingegen ignoriert werden und zeitigten keinen Validitätsef- fekt (siehe Abb. 3.5). Abb. 3.5: Der Contingent-Capture-Effekt: Validitätseffekte werden nur für jene Hinweisreize gefun- den, die mit den Suchabsichten der Versuchspersonen übereinstimmen (gestrichelte Linie), nicht aber für Hinweisreize, die nicht damit übereinstimmen (durchgezogene Linie). Was bedeutet dieses Ergebnis nun in der Debatte um den Einfluss von Top-down- und Bottom-up-Mechanismen auf die visuelle Aufmerksamkeit? Folk et al. (1992) konnten mit ihrem Contingent-Capture-Paradigma nachweisen, dass ein Reiz nicht nur salient sein muss, um die Aufmerksamkeit anzuziehen, sondern dass er auch zu den Suchabsichten der suchenden Person passen muss. Aus einer strikten Bottom- up-Perspektive hätten nämlich sowohl top-down passende als auch top-down nicht passende Hinweisreize die Aufmerksamkeit aufgrund ihrer Salienz auf sich ziehen müssen, was sich in Validitätseffekten für beide Arten von Hinweisreizen hätte zei- gen müssen. Wenn in weiterer Folge nun vom Contingent-Capture-Effekt zu lesen ist, bezieht sich diese Bezeichnung auf eben jene gefundenen selektiven Validitäts- effekte für top-down passende Hinweisreize. Der Contingent-Capture-Effekt zeigt noch eine weitere, weiter oben bereits ange- deutete Eigenschaft der top-down gesteuerten Aufmerksamkeitslenkung auf: Auf- grund der mangelnden Vorhersagekraft der Hinweisreize für die kommende Ziel- reizposition hatten die Versuchspersonen keinerlei Anlass, die Hinweisreize zu be- achten, da der Hinweisreiz in 75 % der Durchgänge die inkorrekte Zielreizposition anzeigte. Für gewöhnlich werden Versuchspersonen auf diesen Umstand aufmerk- sam gemacht und explizit aufgefordert, die Hinweisreize so gut wie möglich zu ig- norieren. 28 Hamburger Fern-Hochschule Bottom-up- vs. Top-down-Debatte 3 Der Contingent-Capture-Effekt wurde in zahlreichen Folgestudien repliziert und um darauf aufbauende Ergebnisse ergänzt. Büsel, Voracek und Ansorge (2018) publi- zierten eine Metaanalyse, welche die Ergebnisse von 68 Experimenten zum Contin- gent-Capture-Effekt zusammenfasste. Sie konnten dabei herausfinden, dass der ge- wichtete und gemittelte Contingent-Capture-Effekt ein Hedges g (standardisierte Mittelwertsdifferenz für kleine Stichproben) von 1,78 ist, wobei bereits ab einer Ef- fektstärke von 0,8 von einem großen Effekt gesprochen wird. Laut der Contingent-Capture-Hypothese bilden Menschen sogenannte Top-down- Suchschablonen, welche die Suchabsichten der Personen repräsentieren. Diese Suchschablonen werden temporär im visuellen Arbeitsgedächtnis gespeichert und sind in der Lage, die Aufmerksamkeit auf jene Merkmale zu lenken, die für eine momentane Aufgabe relevant sind (Desimone & Duncan, 1995). Gemeinhin wird angenommen, dass der mediale frontale Gyrus und höhere visuelle Areale für die Repräsentation von Aufgaben und Merkmalen verantwortlich sind (Lara & Wallis, 2015; Leber, 2010). 3.2.2 Wie viele Merkmale können parallel gesucht werden? Eine der momentan meistdebattierten Fragen in der visuellen Aufmerksamkeitsfor- schung ist, nach wie vielen Merkmalen Menschen parallel suchen können. Wie so oft ist die Forschung in dieser Frage entlang von theoretischen und methodischen Trennlinien in zwei Lager gespaltet: Während eine Fraktion von Forscherinnen und Forschern davon ausgeht, dass man lediglich nach einem Merkmal zu einem gege- benen Zeitpunkt effizient suchen kann (z. B. Büsel, Pomper & Ansorge, 2018; Ort, Fahrenfort & Olivers, 2017), nehmen andere Fachleute an, dass die Suche nach mehr als einem Merkmal ohne Einbußen möglich ist (Irons et al., 2012; Grubert & Eimer, 2016; Kerzel & Witzel, 2019). Bevor wir uns dieser Frage näher annehmen, möchte ich darauf hinweisen, dass es für alle Beteiligten in dieser Debatte evident ist, dass wir nach mehr als nur einem Merkmal suchen können. Wer von uns ist noch nicht in ein Modekaufhaus gegangen und wollte beispielsweise ein Hemd in der einen oder anderen Farbe kaufen. Unsere Arbeitsgedächtniskapazität ist nicht so gering, dass wir das Kaufhaus zweimal ab- klappern müssen und dabei jeweils nach einer der beiden gewünschten Farben su- chen. Vielmehr geht es in dieser Debatte darum, ob mehrere Merkmale in einer Such- schablone repräsentiert werden oder ob separate Suchschablonen gebildet werden, zwischen denen wir je nach Bedarf wechseln müssen. Sollten separate Suchschablo- nen gebildet werden und sollte zwischen den Aufgabenrepräsentation bzw. Such- schablonen gewechselt werden müssen, würde das für eine weniger effiziente Suche sprechen, da ein Aufrechterhalten von und ein Wechsel zwischen Aufgabenreprä- sentationen für gewöhnlich mit Kosten assoziiert ist (Monsell, 2003). Irons et al. (2012) ließen ihre Versuchspersonen eine Version des Contingent-Cap- ture-Paradigmas erledigen, in der die Versuchspersonen nach nicht nur einer, son- dern mehreren Farben suchen sollten. Das bedeutet, dass der Zielreiz in einem Durchgang rot sein konnte und in einem anderen Durchgang grün. Versuchsperso- nen mussten also eine Suchabsicht für zwei Merkmale etablieren. Entsprechend gab es nicht mehr nur eine top-down passende Hinweisreizfarbe, sondern zwei. Zudem gab es auch Durchgänge, in denen die Hinweisreize eine aufgabenirrelevante, d. h. top-down nicht passende Farbe hatten. Irons et al. fanden auch in dieser Zweifarbva- riante des Contingent-Capture-Paradigmas einen Contingent-Capture-Effekt: Hin- weisreize, welche die gesuchten Farben hatten, führten zu einem Validitätseffekt, 29 Hamburger Fern-Hochschule 3 Bottom-up- vs. Top-down-Debatte während top-down nicht passende Hinweisreize ignoriert werden konnten. Grubert und Eimer (2016) konnten diesen Befund in einer EEG-Studie replizieren. Beide Forschungsgruppen interpretierten den Contingent-Capture-Effekt in der Zweifarb- suche als Evidenz dafür, dass die Suchschablone mehr als nur eine Farbe beinhalten konnte. Diese Befunde stehen im Widerspruch zur One-Template-Hypothese von Olivers, Peters, Houtkamp und Roelfsema (2011), die besagt, dass das visuelle Arbeitsge- dächtnis zwar mehrere Merkmale behalten kann, zu einem gegebenen Zeitpunkt al- lerdings nur ein Merkmal mit der Aufmerksamkeit interferieren, also als Suchschab- lone dienen kann. Sie bauen ihre Hypothese hauptsächlich auf der Forschung von Olivers (2009) auf, der eine Gedächtnisaufgabe mit dem Additional-Singleton-Para- digma kombinierte. Versuchspersonen sollten sich in jedem Durchgang eine Farbe merken, die nach einem Durchgang des Additional-Singleton-Paradigmas abgefragt wurde. Das Farb-Singleton im Additional-Singleton-Paradigma konnte dabei entwe- der die zu merkende Farbe oder eine andere, für die Gedächtnisaufgabe irrelevante Farbe haben. Olivers fand, dass ein Farb-Singleton mehr mit der Suche nach dem Form-Singleton interferierte, wenn das Farb-Singleton die zu merkende Farbe hatte. Sollten sich Versuchspersonen jedoch mehrere Farben merken, dann interferierten die zu merkenden Farben nicht mehr stärker mit der Suche als eine andere, für die Gedächtnisaufgabe irrelevante Farbe. Büsel, Pomper und Ansorge (2018) untersuchten, wie sich Farbwechsel im Contin- gent-Capture-Paradigma auf die Reaktionszeiten der Versuchspersonen auswirken. Dazu ließen sie ihre Versuchspersonen jeweils zwei Blöcke in einer Einfarbsuche und in einer Zweifarbsuche absolvieren. Dieses Vorgehen erlaubte den Autoren, Switch Costs und Mixing Costs zu berechnen. Switch Costs bezeichnen potenzielle Reaktionszeitverlangsamungen in Zweifarbbedingungen, wenn die Zielreizfarbe von einem Durchgang zum nächsten wechselt. Monsell (2003) vergleicht Switch Costs in Analogie zum Autofahren mit einem „mentalen Gangwechsel“: Wenn ich in einem Durchgang eine Aufgabe erledigen muss und im nächsten Durchgang eine andere Aufgabe, dann muss die Aufgabenrepräsentation aktualisiert werden, was mit Kosten verbunden ist. Mixing Costs vergleichen hingegen Reaktionszeiten aus Auf- gabenwiederholungsdurchgängen in Blöcken, in denen Versuchspersonen zwei Auf- gaben erledigen müssen, mit Durchgängen aus Blöcken, in denen nur eine Aufgabe erledigt werden muss. Für gewöhnlich wird gefunden, dass selbst Aufgabenwieder-