Einführung in die empirisch-wissenschaftliche Psychologie (IU Internationale Hochschule) (PDF)
Document Details
Uploaded by SumptuousAntagonist
IU Internationale Hochschule
Tags
Summary
Das Dokument ist ein Lernprogramm zur Einführung in die empirisch-wissenschaftliche Psychologie und vermittelt grundlegende Informationen, Methoden und Konzepte der Psychologie. Es fokussiert auf den empirischen Erkenntnisgewinn, den Ablauf von Forschungsprojekten, sowie quantitative, qualitative und Mixed-Methoden. Der Kurs wird für Studierende an der IU Internationale Hochschule angeboten.
Full Transcript
EINFÜHRUNG IN DIE EMPIRISCHWISSENSCHAFTLICHE PSYCHOLOGIE DLBPSEEWP01 EINFÜHRUNG IN DIE EMPIRISCHWISSENSCHAFTLICHE PSYCHOLOGIE IMPRESSUM Herausgeber: IU Internationale Hochschule GmbH IU International University of Applied Sciences Juri-Gagarin-Ring 152 D-99084 Erfurt Postanschrift: Albert-Proeller-S...
EINFÜHRUNG IN DIE EMPIRISCHWISSENSCHAFTLICHE PSYCHOLOGIE DLBPSEEWP01 EINFÜHRUNG IN DIE EMPIRISCHWISSENSCHAFTLICHE PSYCHOLOGIE IMPRESSUM Herausgeber: IU Internationale Hochschule GmbH IU International University of Applied Sciences Juri-Gagarin-Ring 152 D-99084 Erfurt Postanschrift: Albert-Proeller-Straße 15-19 D-86675 Buchdorf [email protected] www.iu.de DLBPSEEWP01 Versionsnr.: 001-2023-1030 N.N. © 2023 IU Internationale Hochschule GmbH Dieses Lernskript ist urheberrechtlich geschützt. Alle Rechte vorbehalten. Dieses Lernskript darf in jeglicher Form ohne vorherige schriftliche Genehmigung der IU Internationale Hochschule GmbH (im Folgenden „IU“) nicht reproduziert und/oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden. Die Autor:innen/Herausgeber:innen haben sich nach bestem Wissen und Gewissen bemüht, die Urheber:innen und Quellen der verwendeten Abbildungen zu bestimmen. Sollte es dennoch zu irrtümlichen Angaben gekommen sein, bitten wir um eine dementsprechende Nachricht. 2 INHALTSVERZEICHNIS EINFÜHRUNG IN DIE EMPIRISCH-WISSENSCHAFTLICHE PSYCHOLOGIE Einleitung Wegweiser durch das Studienskript................................................. 6 Literaturempfehlungen............................................................ 7 Übergeordnete Lernziele.......................................................... 9 Lektion 1 Psychologie als empirische Wissenschaft 11 1.1 1.2 1.3 1.4 1.5 12 13 19 21 24 Gegenstand der Psychologie.................................................. Wie entsteht Wissen?......................................................... Systematik wissenschaftlicher Methoden...................................... Hypothesen................................................................. Variablen................................................................... Lektion 2 Problemstellung und Forschungskreislauf 29 2.1 Forschungskreislauf.......................................................... 30 2.2 Stichprobenziehung......................................................... 37 2.3 Techniken der Datensammlung............................................... 46 Lektion 3 Forschungsdesigns 3.1 3.2 3.3 3.4 3.5 Experimentelle Forschungsdesigns............................................ 52 Kontrolle von Störvariablen................................................... 54 Prä- und quasi-experimentelle Forschungsdesigns.............................. 56 Nicht experimentelle Forschungsdesigns....................................... 57 Voraussetzungen für Kausalschlüsse........................................... 58 Lektion 4 Quantitative Erhebungsmethoden 4.1 4.2 4.3 4.4 4.5 4.6 51 61 Besonderheiten psychologischer Erhebungsmethoden.......................... 62 Einführung in die Messtheorie................................................. 63 Fragebögen und Ratings...................................................... 65 Psychometrische Maße von quantitativen Methoden............................ 72 Psychologisches Testen...................................................... 75 Biophysiologische und neurophysiologische Messungen........................ 78 3 Lektion 5 Qualitative und Mixed-Forschungsmethoden 5.1 5.2 5.3 5.4 5.5 81 Prinzipien qualitativen Forschens............................................. 82 Qualitative Erhebungsmethoden.............................................. 84 Qualitative Analyseverfahren................................................. 89 Gütekriterien qualitativer Forschung........................................... 92 Mixed-Methoden............................................................. 93 Lektion 6 Forschungsethik 97 6.1 Bekannte sozialpsychologische Studien mit forschungsethischen Problemen...... 98 6.2 Ethischer Umgang mit Untersuchungspersonen............................... 100 6.3 Regeln guter wissenschaftlicher Praxis........................................ 103 Verzeichnisse Literaturverzeichnis............................................................. 108 Abbildungsverzeichnis.......................................................... 114 4 EINLEITUNG HERZLICH WILLKOMMEN WEGWEISER DURCH DAS STUDIENSKRIPT Dieses Studienskript bildet die Grundlage Ihres Kurses. Ergänzend zum Studienskript stehen Ihnen weitere Medien aus unserer Online-Bibliothek sowie Videos zur Verfügung, mit deren Hilfe Sie sich Ihren individuellen Lern-Mix zusammenstellen können. Auf diese Weise können Sie sich den Stoff in Ihrem eigenen Tempo aneignen und dabei auf lerntypspezifische Anforderungen Rücksicht nehmen. Die Inhalte sind nach didaktischen Kriterien in Lektionen aufgeteilt, wobei jede Lektion aus mehreren Lernzyklen besteht. Jeder Lernzyklus enthält jeweils nur einen neuen inhaltlichen Schwerpunkt. So können Sie neuen Lernstoff schnell und effektiv zu Ihrem bereits vorhandenen Wissen hinzufügen. In der IU Learn App befinden sich am Ende eines jeden Lernzyklus die Interactive Quizzes. Mithilfe dieser Fragen können Sie eigenständig und ohne jeden Druck überprüfen, ob Sie die neuen Inhalte schon verinnerlicht haben. Sobald Sie eine Lektion komplett bearbeitet haben, können Sie Ihr Wissen auf der Lernplattform unter Beweis stellen. Über automatisch auswertbare Fragen erhalten Sie ein direktes Feedback zu Ihren Lernfortschritten. Die Wissenskontrolle gilt als bestanden, wenn Sie mindestens 80 % der Fragen richtig beantwortet haben. Sollte das einmal nicht auf Anhieb klappen, können Sie die Tests beliebig oft wiederholen. Wenn Sie die Wissenskontrolle für sämtliche Lektionen gemeistert haben, führen Sie bitte die abschließende Evaluierung des Kurses durch. Die IU Internationale Hochschule ist bestrebt, in ihren Skripten eine gendersensible und inklusive Sprache zu verwenden. Wir möchten jedoch hervorheben, dass auch in den Skripten, in denen das generische Maskulinum verwendet wird, immer Frauen und Männer, Inter- und Trans-Personen gemeint sind sowie auch jene, die sich keinem Geschlecht zuordnen wollen oder können. 6 LITERATUREMPFEHLUNGEN ALLGEMEIN Döring, N./Bortz, J. (2016): Forschungsmethoden und Evaluation. 5. Auflage, Springer, Wiesbaden. Hussy, W./Schreier, M./Echterhoff, G. (2013): Forschungsmethoden. 2. Auflage, Springer, Berlin. LEKTION 1 BDP – Berufsverband Deutscher Psychologinnen und Psychologen/DGPs – Deutsche Gesellschaft für Psychologie (2016): Berufsethische Richtlinien. (Im Internet verfügbar). LEKTION 2 Lippe, P. von der/Kladroba, A. (2002): Repräsentativität von Stichproben. In: Marketing, 24. Jg., Heft 2, S. 139–146. (Im Internet verfügbar). Squire, P. (1988): Why the 1936 Literary Digest poll failed. In: Public Opinion Quarterly, 52. Jg., Heft 1, S. 125–133. LEKTION 3 Campbell, D. T./Stanley, J. C. (2015): Experimental and quasi-experimental designs for research. Houghton Mifflin Company, Boston. (Im Internet verfügbar). LEKTION 4 Lück, H. E. (2009): Der Hawthorne-Effekt – ein Effekt für viele Gelegenheiten? In: Gruppendynamik und Organisationsberatung, 40. Jg., Heft 1, S. 102–114. Porst, R.(2014): Question Wording – Zur Formulierung von Fragebogen-Fragen. In: Porst, R.: Fragebogen. Ein Arbeitsbuch. 4. Auflage, Springer, Wiesbaden, S. 99–119. LEKTION 5 Mayring, P. (2016): Einführung in die qualitative Sozialforschung. 6. Auflage, Beltz, Weinheim. 7 LEKTION 6 DFG – Deutsche Forschungsgemeinschaft (2019): Leitlinien zur Sicherung guter wissenschaftlicher Praxis. Kodex. DFG, Bonn. (Im Internet verfügbar). Simmons, J. P./Nelson, L. D./Simonsohn, U. (2011): False-positive psychology: Undisclosed flexibility in data collection and analysis allows presenting anything as significant. In: Psychological Science, 22 Jg., Heft 11, S. 1359–1366. 8 ÜBERGEORDNETE LERNZIELE Der Kurs Einführung in die empirisch-wissenschaftliche Psychologie vermittelt grundlegende Informationen und Übersichten über die Psychologie als Wissenschaft. Dieser Kurs konzentriert sich auf die Empirie als Methode der Erkenntnisgewinnung und des Wissenszuwachses. Außerdem werden Studierende dabei unterstützt, wissenschaftliche Wege zum Erkenntnisgewinn und zur Argumentation in allen forschungsbezogenen und praktisch orientierten Bereichen der Psychologie anzuwenden. Es werden grundlegende Begrifflichkeiten erläutert, deren fachgerechte, sprachliche Benutzung für psychologische Kommunikation unabdingbar ist. Dazu gehören u. a. Begriffe wie Variable, Hypothesen, Operationalisierung, Messen etc. Studierende lernen den Ablauf von Forschungsprojekten – von der Planung über die Bestimmung von ethisch relevanten Bedingungen bis zur Durchführung und Ergebnispräsentation. Der Kurs führt die quantitativen, qualitativen und Mixed-Forschungsmethoden mit einem besonderen Fokus auf quantitative Verfahren ein. Zusätzlich bietet der Kurs eine grobe Gliederung der Psychologie als empirische Wissenschaft, die dem Studierenden als Grundlage zur Einordnung später folgender methodischer Inhalte, wie z. B. Statistik, Forschungsmethoden oder Diagnostik dient. Es entstehen so Schubladen, die sich im weiteren Studienverlauf mit dem entsprechenden Inhalt füllen lassen. 9 LEKTION 1 PSYCHOLOGIE ALS EMPIRISCHE WISSENSCHAFT LERNZIELE Nach der Bearbeitung dieser Lektion werden Sie wissen, … – warum die Psychologie eine empirische Wissenschaft ist. – wie sich wissenschaftliche von nicht wissenschaftlichen Wegen des Erkenntnisgewinns unterscheiden. – welche psychologischen Forschungsmethoden es gibt. – wie wissenschaftliche Hypothesen formuliert werden. – welche Arten von Variablen es gibt. 1. PSYCHOLOGIE ALS EMPIRISCHE WISSENSCHAFT Einführung Der Wunsch, mit Menschen zu arbeiten, stellt die primäre Motivation für die Auswahl des Studiengangs Psychologie dar. Daher ist es für viele Psychologiestudierende erstaunlich, dass Module über Psychologie als empirische Wissenschaft, wissenschaftliche Methodenlehre und Statistik einen substanziellen Bestandteil des Studiums darstellen. Im Studium lernen Studierende, wissenschaftliche Erkenntnisse zu verstehen, zu beurteilen und selbst zu produzieren. Diese Fähigkeiten sind später im Berufsleben nicht nur im Bereich der psychologischen Forschung, sondern auch in den psychologischen Anwendungsbereichen von entscheidender Bedeutung. Beispielsweise sind in einer psychotherapeutischen Praxis wissenschaftlich-methodische Kenntnisse erforderlich, um eine wirksame evidenzbasierte Intervention für die Patienten auszuwählen. Im Personalwesen brauchen Psychologen wissenschaftlich-methodische Kenntnisse, um Mitarbeiterund Führungskräftebefragungen durchzuführen. Auch Schulpsychologen sollten anhand ihrer wissenschaftlich-methodischen Kenntnisse angemessene Verfahren auswählen, um zu entscheiden, welche Schüler besondere Förderangebote benötigen. Das sind nur einige Beispiele, die verdeutlichen, wie wichtig es für Psychologen in allen Bereichen ist, die Psychologie als eine empirische Wissenschaft zu begreifen und eine wissenschaftliche Denkweise zu entwickeln. In dieser Lektion wird begründet, warum die Psychologie eine wissenschaftliche Disziplin ist und es wird ein Überblick über wissenschaftliche Grundlagen und Methoden in der Psychologie gegeben. 1.1 Gegenstand der Psychologie Die Psychologie ist eine Wissenschaft über das Erleben, Verhalten und Handeln des Menschen (Hussy 2013a, S. 2). Diese auf den ersten Blick einfache Definition umfasst die Erforschung vielfältiger und komplexer Fragen: Wie kann man Gefühle klassifizieren? Welche Interaktionsmuster können zwischen Kindern und Eltern erkannt werden? Wovon hängt unser Wohlbefinden ab? Was wirkt, um Symptome der Depression abzubauen? Wie die eingeführten Beispielfragestellungen zeigen, hat die Psychologie als Wissenschaft nicht nur das Ziel, menschliches Erleben, Verhalten und Handeln zu beschreiben, sondern auch zu erklären, zu verändern und vorherzusagen (Allport 1940): Beschreiben: Für die Psychologie relevante Merkmale werden klassifiziert, benannt und definiert und es werden Zusammenhänge erfasst. So werden in der Klinischen Psychologie psychiatrische Störungen des Erlebens und Verhaltens in Kategorien klassifiziert (Angststörungen, Suchterkrankungen, depressive Störungen etc.). Es kann auch beschrieben werden, ob es einen Zusammenhang zwischen dem Geschlecht und 12 bestimmten Störungen gibt. In einer repräsentativen Studie in Deutschland wurde beispielsweise festgestellt, dass mehr Mädchen als Jungen zwischen elf und 19 Jahren an depressiven Symptomen leiden (Klasen et al. 2017). Erklären: Es wird herausgefunden, welches Merkmal ein anderes kausal verursacht. In dem vorherigen Beispiel wurde der Zusammenhang zwischen Geschlecht und Depression im Jugendalter beschrieben. Die Ursache für die unterschiedliche Häufigkeit ist noch unbekannt. Eine mögliche Erklärung sind hormonelle Unterschiede und Veränderungen des Körpers, die bei Mädchen früher auftreten als bei Jungen. Vorhersagen: Es wird künftiges Erleben und Verhalten prognostiziert. Beispielsweise kann geschaut werden, bei welchen Jugendlichen eine Verschlechterung der Symptome wahrscheinlich ist. Mit diesen Jugendlichen können Behandlungsmaßnahmen durchgeführt werden. Verändern: Es werden psychologische Merkmale beeinflusst und verändert. Es wird z. B. eine therapeutische Intervention mit den Jugendlichen durchgeführt, um die depressiven Symptome abzubauen. In der Psychologie werden relevante Fragestellungen anhand empirischer Forschungsmethoden untersucht. Empirische Forschungsmethoden basieren auf konkreter Erfahrung. In den empirischen Wissenschaften (neben Psychologie u. a. auch Physik, Biologie, Maschinenbau etc.) werden Hypothesen und Theorien formuliert, die in einem nächsten Schritt mit der Realität konfrontiert werden. Sachverhalte werden beobachtet oder gemessen und nicht durch logische, rein gedankliche Schlussfolgerungen, wie etwa in der Philosophie, behauptet. Das folgende Beispiel verdeutlicht den Vorteil der empirischen Forschung gegenüber Schlussfolgerungen, die sich auf logische Überlegungen stützen: Der griechische Philosoph Aristoteles hatte beschlossen, dass Männer mehr Zähne als Frauen hätten. Er glaubte, dass der männliche Körper mehr Wärme und Blut aufweise. Im Rahmen einer empirischen Wissenschaft hätte der Philosoph die Zähne bei beiden Geschlechtern gezählt, um festzustellen, dass Männer und Frauen die gleiche Anzahl an Zähnen haben (Russell 1976, S. 6). Empirische Forschungsmethoden Die empirischen Forschungsmethoden (engl. „empirical research“) zielen auf die Überprüfung durch Erfahrung ab. In der Psychologie werden häufig Phänomene (z. B. Intelligenz, Einstellungen etc.) untersucht, die nicht direkt beobachtet werden können (wie die Anzahl der Zähne) und erst erschlossen werden müssen. Daher sind in der Psychologie zusätzlich zu den Beobachtungsmethoden, die in allen empirischen Wissenschaften eingesetzt werden, auch diverse Methoden der empirischen Sozialforschung notwendig (z. B. Interviews oder Befragungen). Gerade in der Psychologie wird kritisch diskutiert, inwieweit empirische Forschungsergebnisse mit der Realität korrespondieren. Mit dieser Frage beschäftigen sich die Wissenschaftstheorien. 1.2 Wie entsteht Wissen? Zentrales Ziel jeder Wissenschaft ist das Generieren von Wissen. Die Psychologie als Wissenschaft möchte Wissen zu Fragen, die sich auf die Gegenstandsbereiche, d. h. auf menschliches Erleben, Verhalten und Handeln beziehen, generieren. Solche Fragen sind häufig auch in unserem Alltag relevant: So fragt sich ein junger Lehrer, ob Jungen aggressiver sind als Mädchen. Das ist auch in der psychologischen Forschung eine relevante Frage: 13 Alltagspsychologie Die Alltagspsychologie bezieht sich auf Fragen über das menschliche Erleben und Denken, die in unserem Alltag relevant sind, aber nicht wissenschaftlich überprüft werden. Gibt es Geschlechterunterschiede im aggressiven Verhalten von Jugendlichen? Es sind nicht die Fragen an sich, die die Psychologie als Wissenschaft von der sogenannten Alltagspsychologie unterscheiden, sondern die Herangehensweise, um diese Fragen zu beantworten. Vielleicht denkt der Lehrer aus unterschiedlichen Gründen, die später dargestellt werden: „Es ist klar. Jungen sind aggressiver als Mädchen“. Der Aggressionsforscher Björkqvist (2018) behauptet jedoch, dass eine solche Aussage falsch und sogar unsinnig ist. Seine Behauptung basiert auf eigenen Forschungsarbeiten und einer Recherche publizierter Studien zum Thema. Aufgrund dieser empirischen Arbeiten kam er zu der Schlussfolgerung, dass die Häufigkeit von aggressivem Verhalten bei Mädchen und Jungen gleich ist. Beide Geschlechter unterscheiden sich allerdings in der Form ihrer Aggression: Jungen sind häufiger körperlich aggressiv, während Mädchen häufiger indirekte verbale und verdeckte Strategien der Aggression verwenden. In diesem Abschnitt werden die beiden Herangehensweisen des Erkenntnisgewinns („alltagspsychologisch“ und wissenschaftlich) einander gegenübergestellt. Der „alltagspsychologische“ Erkenntnisgewinn Döring und Bortz (2016, S. 6) fassen eine Reihe nicht wissenschaftlicher Strategien des Erkenntnisgewinns zusammen und diskutieren ihre Grenzen. Wie könnte der Lehrer zu der Schlussfolgerung kommen, dass Jungen aggressiver sind, obwohl wissenschaftliche Ergebnisse diese Hypothese nicht bestätigen konnten? Welche Grenzen und Fehleranfälligkeit bringt seine Entscheidung mit sich? Berufung auf Autoritäten: Ein Weg zum Erkenntnisgewinn im Alltag ist der Einbezug von Aussagen von Autoritätspersonen und Experten. Auch wenn solche Aussagen in diesem Fall auf wissenschaftlichen Erkenntnisse basieren können, ist diese Strategie trotzdem fehleranfällig. Es sollte kritisch betrachtet werden, welcher Grad an tatsächlicher Expertise die Quellen haben und ob es im Hintergrund subjektive Meinungen und Interessen gibt. Nehmen wir an, dass der Lehrer ein Interview mit einem Experten im Bereich der körperlichen Aggression gehört hat. Möglicherweise hat der Experte verallgemeinert, dass Jungen aggressiver sind als Mädchen. Obwohl er eigentlich nur die körperliche Aggression gemeint hat, wurde seine Aussage aus dem Kontext gerissen. gesunder Menschenverstand: Gesunder Menschenverstand (engl. „common sense“) meint die geteilte Überzeugung einer Gruppe von Personen. Dies ist jedoch problematisch, da das, was als gesunder Menschenverstand angesehen wird, stark von den sozialen und kulturellen Besonderheiten, Vorurteilen sowie Interessen der Gruppe abhängt. Aus gesundem Menschenverstand heraus könnte der Lehrer denken, dass Mädchen häufiger in die Opferrolle geraten, sodass er behaupten würde, dass sie weniger aggressiv sind. Intuition: Im Alltag stützt man sich häufig auf die eigene Intuition. So könnte der Lehrer behaupten „Ich hatte bisher keine Fälle aggressiver Kinder in meinen Klassen. Vom Bauchgefühl her würde ich sagen, dass Jungen aggressiver sind als Mädchen“. Die Grenzen dieses Weges zum Erkenntnisgewinn liegen darin, dass unsere Intuition, „Bauchgefühl“ oder Instinkt von vielen Faktoren, wie Vorurteilen, Mythen, eigenen Wünschen und Ängsten, beeinflusst werden. Unsere Intuition bleibt in neuen Situationen robust, was problematisch ist, wenn sie zu falschen Erkenntnissen führt. 14 anekdotische Evidenz: Weiter ist es möglich, dass die eigene Lebenserfahrung oder Beispiele aus unserem Umfeld oder den Medien zum Erkenntnisgewinn einbezogen werden. Dieser nicht wissenschaftliche Weg des Erkenntnisgewinns wird anekdotische Evidenz genannt. Der Lehrer aus unserem Beispiel könnte denken: „Bisher waren nur Jungen in meinen Klassen aggressiv. Daher sind Jungen aggressiver als Mädchen“. Problematisch dabei ist es, dass die persönlichen Erfahrungen stark von der eigenen Person sowie von der kulturellen und sozialen Umgebung abhängig sind. Logik: Nicht selten stützen sich Menschen auf logische Argumente. Der Lehrer könnte argumentieren: „Jungen haben mehr Energie und sind stärker. Daher sind sie aggressiver als Mädchen“. Zusätzlich zu diesen alltagspsychologischen Wegen zum Erkenntnisgewinn führen Döring und Bortz (2016, S. 6) noch zwei weitere Strategien an: Es handelt sich um Überzeugungen, die durch religiöse Dogmen oder durch Tradition und überliefertes Wissen früherer Generationen entstanden sind. In unserem Beispiel würden dazu Argumentationen aufgrund von traditionellen oder religiös-dogmatischen Geschlechterrollen passen. Problematisch dabei ist es, dass solche Erkenntnisse robust sind und häufig im Gegensatz zu anerkannten wissenschaftlichen Befunden stehen. Natürlich können die aufgeführten Strategien in vielen Fällen zu richtigen Schlussfolgerungen führen. Häufig helfen sie uns, schnell und ökonomisch Entscheidungen im Alltag zu treffen, da wir nicht über die notwendigen Ressourcen verfügen, um wissenschaftliche Wege des Erkenntnisgewinns zu verfolgen. Dennoch sind „alltagspsychologische“ Strategien des Erkenntnisgewinns aufgrund ihrer Subjektivität und Fehleranfälligkeit ungeeignet, um ein System psychologischen Wissens zu entwickeln. Aus diesem Grund sind in der Psychologie als Wissenschaft Methoden notwendig, die die Grenzen „alltagspsychologischer“ Strategien zu überwinden versuchen. Welche Konsequenzen hat nicht wissenschaftlicher Erkenntnisgewinn im psychologischen Beruf? Psychologen beraten in ihrem Beruf häufig andere Personen oder Personengruppen. In den berufsethischen Richtlinien für Psychologen ist verankert, dass Psychologen stets einen hohen Kompetenzstand anstreben. Außerdem sollten sie sich ihrer Verantwortung gegenüber den Klienten bewusst sein (BDP/DGPs 2016, S. 14). Nichtsdestotrotz kann es passieren, dass Psychologen aus unterschiedlichen Gründen nicht wissenschaftlich gewonnenes Wissen in der Beratung mit ihren Klienten verbreiten. Welche Folgen könnte das haben? Berufsethische Richtlinien Die berufsethischen Richtlinien für Psychologen umfassen Leitfäden zum Schutz von Klienten und der eigenen Person, denen alle Psychologen folgen. Beispiel: In einer psychotherapeutischen Praxis wird Diagnostik von Autismus-SpektrumStörungen (ASS) durchgeführt. Kinder mit einer ASS haben Schwierigkeiten in der sozialen Interaktion und Kommunikation. In den schwerwiegenden Fällen erleben die Betroffenen und ihre Familien einen großen Leidensdruck. Einer der Mythen über die ASS ist, dass sie durch Impfungen entsteht. Erklärt ein Psychologe betroffenen Eltern, dass die Störung möglicherweise durch eine Impfung entstanden sein könnte, ist eine Reihe negativer Konsequenzen möglich: Zum einen könnten Schuldgefühle bei den Eltern entstehen, weil sie ihr Kind haben impfen lassen. Zum anderen könnten Eltern entscheiden, zukünftig ihre Kinder nicht mehr impfen zu lassen oder Bekannten von Impfungen abraten. Ähnliches 15 passierte in Großbritannien Ende der 1990er-Jahre. Es wurden Erkenntnisse publiziert, dass die Masernimpfung ASS verursachen kann. Später wurden diese Erkenntnisse als falsch bezeichnet (Deer 2011). Dennoch sank die Anzahl der Masernimpfungen von 92 % im Jahr 1996 auf 85 % im Jahr 2006, was die Fallzahlen von Masern erhöhte (McIntyre/ Leask 2008). Um verantwortlich im psychologischen Beruf zu handeln, müssen Psychologen anstreben, ihre Aussagen auf wissenschaftliche Strategien zum Erkenntnisgewinn zu stützen. Der wissenschaftliche Erkenntnisgewinn Gute wissenschaftliche Praxis Die gute wissenschaftliche Praxis umfasst Richtlinien für die Durchführung von objektiven, ethisch angemessenen, praktisch und wissenschaftlich relevanten Studien. Forschungsstand Der aktuelle Forschungsstand umfasst alle bekannte Theorien und wissenschaftliche Ergebnisse zu einem Thema. 16 Die wissenschaftlichen Strategien zum Erkenntnisgewinn haben zum Ziel, zuverlässige und gültige Erkenntnisse zu generieren. Das wird gewährleistet, indem auf Basis theoretischer Überlegungen sowie früherer empirischer Erkenntnisse und mithilfe zuverlässiger Methoden nach neuen Erkenntnissen gesucht wird. Der Forschungsprozess ist systematisch, nachvollziehbar, wird detailliert dokumentiert und kann überprüft und repliziert werden. Die hohen Standards des wissenschaftlichen Erkenntnisgewinns werden in dem Kodex guter wissenschaftlicher Praxis zusammengefasst (DFG 2019). Wissenschaftliche und universitäre Einrichtungen in Deutschland verpflichten sich, dem Kodex zu folgen und sollen ihren Mitarbeitern sowie Studierenden die notwendigen Kenntnisse und Ressourcen (z. B. Zugang zur relevanten Literatur) bereitstellen, damit diese dem Kodex folgen können. Der wissenschaftliche Erkenntnisgewinn unterscheidet sich vom „alltagspsychologischen“ Weg in den folgenden Aspekten (nach Döring/Bortz 2016, S. 8): Die Forschungsfragen sind empirisch überprüfbar und eindeutig formuliert: Der Ausgangspunkt des Erkenntnisgewinns ist die Formulierung konkreter überprüfbarer Fragestellungen. Vage und zu allgemeine Aussagen sollten vermieden werden. Der bisherige Forschungsstand wird berücksichtigt: Bei der Formulierung der Fragestellungen und der Auswahl von Forschungsmethoden sollten bereits bestehende Theorien sowie frühere empirische Ergebnisse berücksichtigt werden. Eine sorgfältige Recherche des Forschungsstandes ist notwendig, um Studien durchzuführen, die sich neuen Fragestellungen widmen, für die es noch keine, nicht ausreichende oder widersprüchliche Ergebnisse gibt. Außerdem ist es möglich, dass sich die Fragestellungen auf das Replizieren früherer Ergebnisse beziehen. Die Erhebung, Aufbereitung und Analyse von Daten ist systematisch und basiert auf etablierten wissenschaftlichen Methoden: Empirische Daten werden anhand angemessener Forschungsdesigns, möglichst mittels einer repräsentativen Stichprobe, gültiger Erhebungsinstrumente und Auswertungsstrategien erhoben und analysiert. Wichtig ist es, wissenschaftliche Gütekriterien einzuhalten. Beispielsweise werden standardisierte Fragebögen als ein objektives Verfahren eingesetzt (im Gegensatz zu den subjektiven Strategien zum Erkenntnisgewinn, die am Anfang dieses Kapitels diskutiert wurden). Ethische Prinzipien werden berücksichtigt: Im Bereich Psychologie werden die wichtigsten Prinzipien der Berufsethik und der Forschungsethik durch den Bundesverband Deutscher Psychologinnen und Psychologen (BDP) und die Deutsche Gesellschaft für Psychologie (DGPs) formuliert. Zum Beispiel sollten Teilnehmer an einem psychologischen Forschungsprojekt über die Ziele und den Ablauf der Studie aufgeklärt werden, bevor sie in ihre Teilnahme einwilligen. Der Forschungsprozess ist transparent und wird detailliert dokumentiert: Die Daten werden zum Zweck der Nachprüfbarkeit und Nachvollziehbarkeit archiviert. Das Forschungsprojekt sollte so detailliert dokumentiert und beschrieben werden, dass alle Informationen vorliegen, um dasselbe Projekt wiederholt durchzuführen. Seit einigen Jahren gibt es mehrere Register zu geplanten Studien, die die Transparenz von Forschungsvorhaben erhöhen sollen. Die Daten werden zumindest in elektronischer Form für mehrere Jahre aufbewahrt. International gibt es die Tendenz, dass Daten bei Veröffentlichungen in anonymisierter Form für alle Leser bereitgestellt werden, damit die Analyse von jedem nachgeprüft werden kann. Ergebnisse werden unter Berücksichtigung widersprüchlicher Befunde und Limitationen der eigenen Untersuchung interpretiert: Die Ergebnisse sollten im Kontext der ursprünglichen Erwartungen und des Forschungskontextes interpretiert werden. Eine Verallgemeinerung von einzelnen Ergebnissen sollte vermieden werden. In der psychologischen Forschung werden keine Sachverhalte bewiesen (wie z. B. in der Mathematik), sondern die Ergebnisse werden als Hinweise für bestimmte Sachverhalte interpretiert. Die Ergebnisse werden öffentlich zugänglich gemacht: Wissenschaftliche Ergebnisse werden im Idealfall erst in seriösen peer-reviewed Fachzeitschriften veröffentlicht und in Vorträgen vor dem Fachpublikum vorgestellt und erst nach einer fachlichen Rückmeldung der breiten Öffentlichkeit vorgelegt. Im Rahmen eines Peer-Review-Verfahrens werden Studien und ihre Ergebnisse fachlich überprüft und, wenn notwendig, bearbeitet und verbessert. Diese Verfahren verlaufen häufig verdeckt (blind peer-review), damit die Gutachter bei ihrer Rückmeldung objektiv bleiben. Durch das Bestreben, wissenschaftliche Erkenntnisse öffentlich zugänglich zu machen, werden Open-Science-Quellen immer populärer. Diese Quellen sind für alle zugänglich, im Gegensatz zu anderen Fachzeitschriften, bei denen der Zugang nur kostenpflichtig möglich ist (die universitäre Bibliothek ermöglicht Studierenden den Zugang, indem sie diese Kosten übernimmt). In den kommenden Jahren werden die Anstrengungen darauf gerichtet sein, die wissenschaftlichen Standards bei Open-Science-Quellen zu sichern. Peer-Review Die Peer-Review ist die Begutachtung durch Experten im Themenfeld. Wissenschaftstheorie Die Voraussetzungen und die Möglichkeiten von wissenschaftlich-empirischen Prozessen und Methoden werden durch die Wissenschaftstheorie, ursprünglich ein Zweig der Philosophie, beschrieben und normativ festgelegt. Die Wissenschaftstheorie im Allgemeinen beschäftigt sich mit den Vorannahmen über die Beschaffenheit der Untersuchungsgegenstände, die Anforderungen an Theorien, die Grenzen und Voraussetzungen von Forschungsmethoden sowie mit der gesellschaftlichen Funktion und Verantwortung der Wissenschaft (Chalmers 2007). Die Wissenschaftstheorie beschreibt, inwieweit die Forschungsmethoden zur Überprüfung der Realität eingesetzt werden können und wie eine Verknüpfung von Theorie und Erfahrung (d. h. empirischen Daten) stattfinden kann. Für die wissenschaftlich-empirische Psychologie sind besonders zwei Wege der wissenschaftlichen Schlussfolgerung anhand Theorie und Daten relevant (Hussy 2013a, S. 7): Wissenschaftstheorie Eine Disziplin, die Voraussetzungen, Anwendung und Grenzen von Forschungsprozessen und Methoden beschreibt und philosophisch reflektiert. Induktion: Beim induktiven Vorgehen werden Schlussfolgerungen von Einzelfällen auf das Allgemeine gemacht. In der psychologischen Forschung werden aus erhobenen empirischen Daten Muster herausgearbeitet, die zur Bildung neuer Theorien verwendet werden. Erkenntnisse aus induktiven Methoden lassen sich nicht falsifizieren oder beweisen und sollten daher kritisch betrachtet werden. Sie sind aber von großer Bedeu- 17 tung, da sie neue Gesetzmäßigkeiten erkennen lassen. Das induktive Vorgehen ist besonders dann angebracht, wenn es weniger Wissen und Literatur zu bestimmten Problemen gibt. Deduktion: Beim deduktiven Vorgehen werden Schlussfolgerungen über Einzelfälle aus dem Allgemeinen gezogen (aus Regeln, Gesetzmäßigkeiten, Theorien etc.). In der psychologischen Forschung werden aus Theorien Hypothesen gebildet, die anhand empirischer Daten überprüft werden. Die Analyse der empirischen Daten führt zu einer Widerlegung oder einer vorläufigen Bestätigung der Hypothesen und somit der Theorie. Da das deduktive Vorgehen mit der Ableitung von Hypothesen aus der Theorie beginnt, ist das Vorgehen besonders dann angebracht, wenn bereits Wissen über die Thematik vorhanden ist. Valide wissenschaftliche Erkenntnisse entstehen i. d. R. durch einen Forschungsprozess, der sowohl induktive als auch deduktive Vorgehensweisen einschließt. Zunächst werden Daten zur Systematisierung einer Theorie verwendet. In einem nächsten Schritt werden aus dieser Theorie Hypothesen gebildet, um die Gültigkeit der Theorie zu überprüfen. Abbildung 1: Der Prozess induktiver und deduktiver Forschung Quelle: erstellt im Auftrag der IU, 2020. 18 1.3 Systematik wissenschaftlicher Methoden Eine Systematik wissenschaftlicher Methoden ist nach unterschiedlichen Kriterien möglich. Für die Psychologie relevante Forschungsmethoden schließen Verfahren der Datengewinnung und Datenauswertung ein. Außerdem unterscheidet man zwischen quantitativen und qualitativen Forschungsmethoden. Bei der Anwendung quantitativer sowie qualitativer Forschungsmethoden in derselben Untersuchung spricht man von MixedMethoden. In diesem Lernzyklus werden auch Methoden vorgestellt, die besonders für die angewandten Psychologiebereiche relevant sind, aber auch im Rahmen von Forschungsarbeiten Anwendung finden (Diagnostik, Intervention und Evaluation). Methoden der Datengewinnung und Datenauswertung Methoden der Datengewinnung sind alle Verfahren, mit denen menschliches Erleben, Verhalten und Handeln registriert und in einer Form gespeichert werden, die eine Auswertung erlaubt. Möchte man z. B. untersuchen, ob sich Menschen an Geschehnisse vor ihrem dritten Lebensjahr erinnern, kann die folgende einfache empirische Untersuchung durchgeführt werden: Teilnehmer sollen die Frage „Erinnern Sie sich an Situationen vor Ihrem dritten Lebensjahr?“ auf einer dreistufigen Skala („nie“, „manchmal“, „häufig“) beantworten. Die Antworten können dann durch die Symbolisierung mit Zahlen gespeichert werden (für „nie“ wird eine 1 eingesetzt, für „manchmal“ eine 2 und für „häufig“ eine 3). Diese Zahlen sind der Ausgangspunkt für die Anwendung der Forschungsmethoden zur Datenauswertung. Mit den Methoden der Datenauswertung werden die erhobenen und auf der beschriebenen Weise gespeicherten Daten im nächsten Schritt zusammengefasst und systematisiert, um die Fragestellung empirisch zu überprüfen. So kann etwa berechnet werden, wie viele von den befragten Menschen sich manchmal oder häufig an Geschehnisse vor dem dritten Lebensjahr erinnern. Das heißt, es wird die Häufigkeit für einen Wert größer als 1 berechnet. Quantitative Forschungsmethoden Quantitative Forschungsmethoden beschreiben die Erhebung und Auswertung von standardisierten Daten, die in numerischer Form gespeichert werden. Solche Daten werden mit Tests oder standardisierten Aufgaben gemessen (z. B. Intelligenztest, Reaktionszeit, Hautleitfähigkeit etc.) oder anhand standardisierter Fragebögen und Interviews erhoben. Bei standardisierten Fragebögen und Interviews sind die Fragen und Antwortmöglichkeiten streng vorgegeben. Quantitative Forschungsmethoden schließen i. d. R. die Erhebung von Daten anhand einer größeren Personengruppe ein. Bei den meisten quantitativen Untersuchungen wird das deduktive Vorgehen der Schlussfolgerung anhand Theorie und Empirie angewandt. Quantitative Forschungsmethoden Diese umfassen Erhebungs- und Analyseverfahren standardisierter Daten. Die quantitativen Methoden werden kritisiert, da sie durch die standardisierte Erhebungsund Analysemethoden weniger die subjektive Natur des menschlichen Erlebens berücksichtigen. 19 Qualitative Forschungsmethoden Qualitative Forschungsmethoden Diese beinhalten Erhebungs- und Analyseverfahren unstandardisierter Daten. Qualitative Forschungsmethoden umfassen die Erhebung und Analyse von unstandardisierten Daten. Daten werden dabei meist anhand unstandardisierter Interviews, Gruppengesprächen und Beobachtungen erhoben und in ihrer Ursprungsform gespeichert (z. B. als Text und nicht in numerischer Form). In der Regel wird eine kleinere Personengruppe als bei quantitativen Forschungsmethoden untersucht. Die Analyse der Daten versucht, mehr in die Tiefe der Problematik zu gehen und interindividuelle Unterschiede zu berücksichtigen. Die Vorgehensweise bei der qualitativen Forschung folgt meist (jedoch nicht immer) dem induktiven Vorgehen. Qualitative Untersuchungen sind also vor allem dann sinnvoll, wenn wenig über die Thematik bekannt ist und neue Theorien und Hypothesen generiert werden sollen. Mixed-Forschungsmethoden Mixed-Methoden Die Mixed-Methoden umfassen die Erhebung und Analyse standardisierter und unstandardisierter Daten. Quantitative und qualitative Forschungsmethoden bringen unterschiedliche Vor- und Nachteile mit sich. In der psychologischen Forschung gibt es in den vergangenen Jahrzehnten die Tendenz, die Vorteile beider Forschungsmethoden zu integrieren und die sogenannten Mixed-Methoden-Untersuchungsdesigns anzuwenden (englisch „mixedmethods“ design). Je nach Fragestellung und Forschungsstand zu der Thematik, können Mixed-Methoden zum induktiven oder deduktiven Schlussfolgern angewandt werden. Methoden aus den anwendungsnahen Themenbereichen der Psychologie Einige Methoden aus den anwendungsnahen Bereichen der Psychologie werden auch im Forschungskontext eingesetzt. Im Folgenden werden die drei Methoden Diagnostik, Intervention und Evaluation dargestellt. Psychologische Diagnostik Im Rahmen der psychologischen Diagnostik werden Personen anhand ihrer Eigenschaften Gruppen zugeordnet. Die psychologische Diagnostik bezieht sich auf die empirisch basierte Schätzung von Merkmalen und Veränderungen von Personen oder Personengruppen anhand angemessener wissenschaftlich-fundierter Methoden (Tests, Fragebögen, Interviews, Verhaltensbeobachtungen, Anamnese etc.). Es werden Personen mit ähnlichen Eigenschaften in Gruppen klassifiziert, sodass diagnostische Fragestellungen beantwortet und Maßnahmen vorgenommen werden können (Therapie, Training, Wechsel gegenwärtiger Rahmenbedingungen etc.; für eine Übersicht unterschiedlicher Definitionen siehe Beauducel/Leue 2014, S. 14). Die psychologische Diagnostik spielt in vielen Anwendungsbereichen der Psychologie eine wichtige Rolle. Beispielsweise dient die psychologische Diagnostik Psychologen dazu, psychiatrische Diagnosen zu stellen, die zur Therapieplanung wichtig sind. Im Rahmen der Pädagogischen Psychologie wird anhand psychologischer Diagnostik eingeschätzt, wie Schüler im Vergleich zu Gleichaltrigen abschneiden und ob eine besondere Art der Schule empfohlen werden sollte. In der forensischen Psychologie wird die psychologische Diagnostik eingesetzt, um die Art des Haftvollzuges zu entscheiden. Im Rahmen der Diagnostik werden sowohl quantitative (Tests, Fragebögen etc.) als auch qualitative Methoden (Interviews, Interpretation von Bildern etc.) eingesetzt. Die psychologische Diagnostik führt häufig zu psychologischen Interventionen (Therapie, Beratung, Training etc.). Psychologische Interventionen finden vor allem in den Bereichen Klinische Psychologie und Gesundheitspsychologie Anwendung. Interventionen haben 20 zum Ziel, durch geplante Maßnahmen einer Störung bzw. einem Problem vorzubeugen (Prävention) bzw. diese zu behandeln (Therapie) Eine breitere Definition schließt auch weitere Maßnahmen zur Veränderung psychologischer Merkmale (z. B. Coaching) ein. Die Interventionsforschung stellt einen wichtigen Bereich der Psychologie als Wissenschaft dar. Da bei der Untersuchung von Veränderungen psychologischer Merkmale mit spezifischen Schwierigkeiten gerechnet werden sollte, beruht die Interventionsforschung auf für diesen Themenbereich typischen Forschungsmethoden. Einen weiteren Bezugsaspekt, warum der Begriff der psychologischen Intervention im Rahmen der Darstellung der Psychologie als Wissenschaft einbezogen werden sollte, ist die Diskussion um die Anwendung evidenzbasierter Interventionen. Interventionen, die im Rahmen mehrerer Untersuchungen mit hohen Gütekriterien wirksam waren, werden als evidenzbasiert gekennzeichnet. Es ist zu erwarten, dass evidenzbasierte Intervention bessere und ökonomischere Ergebnisse als andere Interventionen zeigen werden. Die Anwendung evidenzbasierter Interventionen setzt einen stärkeren Informationsaustausch und intensivere Zusammenarbeit zwischen Forschenden und Praktikern voraus. Die Überprüfung der Wirksamkeit von Interventionen wird Evaluation genannt. Die Evaluation wird jedoch nicht nur im klinischen Bereich eingesetzt. Auch im Bildungsbereich, in der Entwicklungshilfe sowie in der Wirtschaft ist Evaluation ein wichtiger Begriff. Eine breitere Definition umfasst die systematische Beschreibung und Bewertung von Menschen, Organisationseinheiten oder/und Prozessen (Hussy 2013a, S. 29). In den angewandten Psychologiebereichen wird eine Evaluation durchgeführt, um praktische Maßnahmen zu überprüfen, zu verbessern oder über ihre Anwendung zu entscheiden. Im Rahmen der Evaluation werden Methoden aus dem Forschungskontext angewandt. Gleichzeitig stellen Evaluationsstudien, wie bereits erwähnt, einen wichtigen Bereich der psychologischen Forschung dar. Evaluation Die Evaluation bezieht sich auf die Wirksamkeitsüberprüfung von Maßnahmen. 1.4 Hypothesen Die Formulierung wissenschaftlicher Hypothesen ist ein wichtiger Schritt im Forschungsprozess, der besonders für die quantitativen Forschungsmethoden unentbehrlich ist. Was ist aber eine wissenschaftliche Hypothese und wie unterscheidet sich diese von Alltagshypothesen? Eine wissenschaftliche Hypothese stellt eine vorläufige, auf dem Forschungsstand basierende Antwort auf eine Frage dar (Hussy/Jain 2002). Sie ist empirisch tastbar, d. h., abstrakte Begriffe (Intelligenz, Emotionen etc.) können operationalisiert und gemessen werden. Außerdem ist die Hypothese widerlegbar. Zudem geht sie über den Einzelfall hinaus und beansprucht somit eine Allgemeingültigkeit (Eid/Gollwitzer/Schmitt 2017, S. 38). In der Wissenschaft stützen sich solche Vermutungen immer auf bestehende Theorien und frühere Forschungsergebnisse. Das bedeutet, dass im Fall, dass es zu einer Fragestellung noch kein wissenschaftliches Vorwissen gibt und eine Vermutung aus Erkenntnissen benachbarter Bereiche nicht abgeleitet werden kann, keine wissenschaftliche Hypothese formuliert werden kann. In diesem Fall wird die Forschungsfrage exploratorisch untersucht. Die vier Eigenschaften – theoretische Begründbarkeit, empirische Testbarkeit, Widerlegbarkeit und prinzipielle Allgemeingültigkeit – unterscheiden eine wissenschaftliche von einer nicht wissenschaftlichen Hypothese. Hypothese Die Hypothese ist eine Vermutung auf der Basis des aktuellen Forschungsstandes. Operationalisieren Das Operationalisieren von Variablen bzw. Merkmalen bezieht sich auf die Art und Weise, wie diese erhoben werden (durch Messen, bestimmte Fragen, Beobachtung etc.). 21 Tabelle 1: Unterschiede zwischen nicht wissenschaftlichen und wissenschaftlichen Hypothesen Nicht wissenschaftliche Hypothese Eigenschaft aus dem Bauchgefühl, Tradition etc. aus dem Stand der Forschung (Theorien, empirische Erkenntnisse) Beispiel Das Sternzeichen beeinflusst die Persönlichkeitseigenschaften. Das Wissen über das Sternzeichen beeinflusst die selbsteingeschätzten Persönlichkeitseigenschaften. Erklärung Bisher liegen keine empirischen Ergebnisse vor, dass unser Geburtsdatum bzw. Sternzeichen unsere Persönlichkeitseigenschaften beeinflusst. Menschen, die sich für Sternzeichen interessieren und typische Eigenschaften ihres Sternzeichens kennen, schätzen sich selbst gemäß diesen Eigenschaften ein. nicht testbar testbar Beispiel Männer sind besser als Frauen. Männer sind in ihrem visuellräumlichen Vorstellungsvermögen besser als Frauen. Erklärung Diese Hypothese kann nicht getestet werden, weil die Formulierung zu global ist. Es ist unmöglich zu operationalisieren, was hier „besser“ bedeutet. Das visuell-räumliche Vorstellungsvermögen kann anhand konkreter Testverfahren gemessen werden. nicht widerlegbar widerlegbar Beispiel Manche Frauen reden häufiger über ihre Gefühle als Männer, manche nicht. Frauen reden häufiger über ihre Gefühle als Männer. Erklärung Die Hypothese kann nicht widerlegt werden, weil sie in sich eine Widersprüchlichkeit beinhaltet. Die Hypothese kann widerlegt werden, wenn die Frauen, die an einer Befragung teilnehmen, seltener über ihre Gefühle reden als Männer. prinzipiell nicht allgemeingültig prinzipiell allgemeingültig Beispiel Dein Freund wird sich wegen zu hohen Alkoholkonsums morgen an nichts erinnern. Der Alkoholkonsum stört die Übertragung von Informationen vom Kurz- ins Langzeitgedächtnis. Erklärung Die Hypothese bezieht sich auf einen Einzelfall und ist somit nicht allgemeingültig. Diese Hypothese ist prinzipiell allgemeingültig, da sie sich auf grundlegende Mechanismen bei allen betroffenen Menschen bezieht. Eigenschaft Eigenschaft Eigenschaft Quelle: erstellt im Auftrag der IU, 2020. 22 Wissenschaftliche Hypothese Bei der quantitativen Forschung werden i.d.R. statistische Hypothesen zu den Fragestellungen formuliert, die anhand statistischer Tests überprüft werden. Um die Bedingungen für das statistische Testen zu bestimmen, werden die Forschungshypothesen oder auch statistische Hypothesen in bestimmter Art und Weise formuliert: Es werden immer eine Nullhypothese (H0, „H“ für Hypothese) und eine Alternativhypothese (H1) bestimmt. Die Nullhypothese postuliert stets, dass kein Effekt besteht. Der Effekt bezieht sich an dieser Stelle auf die untersuchten statistischen Marker (Mittelwert, Mittelwertunterschied, Korrelation, d. h. Zusammenhang etc.). Ein Beispiel für eine Nullhypothese ist die folgende: „Es gibt keinen Zusammenhang zwischen dem elterlichen Erziehungsverhalten und dem Verhalten des Kindes“. Die Alternativhypothese lautet z. B.: „Es gibt einen Zusammenhang zwischen negativen Erziehungspraktiken und dem oppositionellen Verhalten des Kindes“. Es gibt Theorien und auch empirische Erkenntnisse, die beschreiben, dass die negativen Erziehungsstrategien der Eltern (z. B. inkonsequentes Erziehungsverhalten, Überreagieren, körperliche Gewalt) einen negativen Einfluss auf das Kind haben. Daher werden wir vermuten, dass die Alternativhypothese zutrifft. Wir werden sie in diesem Fall auch eine Arbeitshypothese nennen. Unabhängig davon, ob unsere Arbeitshypothese die Null- oder die Alternativhypothese ist, werden die H0 und H1 immer beim statistischen Testen formuliert. Dies hat eine Bedeutung für die Anwendung statistischer Verfahren. In Forschungshypothesen werden Vermutungen zu dem Vorhandensein, der Stärke und der Richtung von Effekten formuliert. Das oben genannte Beispiel für die Alternativhypothese „Es gibt einen Zusammenhang zwischen negativen Erziehungspraktiken und dem oppositionellen Verhalten des Kindes“ ist eine Hypothese über das Vorhandensein eines Zusammenhanges. Da auch andere Faktoren möglich sind, die das Verhalten eines Kindes beeinflussen (genetische Anlage, Beziehungen zu Gleichaltrigen etc.), kann man eine vorläufige Vermutung über einen mittelstarken Effekt postulieren: „Es gibt einen mittelstarken Zusammenhang zwischen negativen Erziehungspraktiken und dem oppositionellen Verhalten des Kindes“. Außerdem ist es möglich, eine Alternativhypothese über die Richtung zu postulieren, die in diesem Fall wie folgt lautet: „Es gibt einen positiven Zusammenhang zwischen negativen Erziehungspraktiken und dem oppositionellen Verhalten des Kindes“. Das bedeutet, je mehr negative Erziehungspraktiken die Eltern anwenden, desto trotziger und oppositioneller verhält sich das Kind. Die Unterscheidung zwischen gerichteten und ungerichteten Hypothesen hat eine entscheidende Bedeutung für das statistische Vorgehen. Arbeitshypothese Die Arbeitshypothese ist eine Hypothese, die unsere theoretisch begründete Vermutung widerspiegelt. Das kann entweder die Nullhypothese oder die Alternativhypothese sein. Weiterhin differenziert man zwischen Unterscheidungshypothesen, Zusammenhangshypothesen und Veränderungshypothesen (Döring/Bortz 2016, S. 146). Bei Unterscheidungshypothesen werden Vermutungen über Unterschiede zwischen Gruppen postuliert – z. B. „Unterscheiden sich Eltern mit hohem und niedrigem sozioökonomischen Status in ihrem Erziehungsverhalten?“ Die oben genannte Hypothese über den Zusammenhang zwischen Erziehungsverhalten und Verhalten des Kindes stellt eine Zusammenhangshypothese dar. Sie enthält genau wie die Unterscheidungshypothesen keine Information über Ursache und Folge, kann aber trotzdem zur Erklärung von Mechanismen herangezogen werden. Es ist möglich, dass das Erziehungsverhalten das Verhalten des Kindes beeinflusst, aber auch umgekehrt ist es denkbar, dass Eltern von sehr trotzigen und oppositionellen Kindern mehr negative Erziehungspraktiken anwenden, d. h., das Verhalten des Kindes stellt die Ursache dar. 23 Wenn Merkmale über die Zeit hinweg erhoben werden, ist es möglich, dass eine Veränderungshypothese formuliert wird. Erhebt man das kindliche Verhalten über mehrere Messzeitpunkte vor und nach einem Elterntraining zur Verbesserung des Erziehungsverhaltens, kann die Veränderungshypothese folgendermaßen postuliert werden: „Das oppositionelle Verhalten ist nach dem Elterntraining geringer ausgeprägt als vor dem Training“. Auch wenn bei Veränderungshypothesen Zusammenhänge über die Zeit hinweg untersucht werden, können auch hier nicht immer Aussagen über Ursachen und Folgen gemacht werden. Das hängt stark vom experimentellen Design ab. 1.5 Variablen Variable Eine Variable ist ein Merkmal, das unterschiedliche Ausprägungen annehmen kann. Eine der Haupteigenschaften von wissenschaftlichen Hypothesen ist es, dass sie testbar sind. Das bedeutet, dass alle Merkmale aus der Hypothese angemessen operationalisiert werden. Einige Merkmale, die in unterschiedlichen Bereichen der Psychologie relevant sind, können direkt gemessen werden – z. B. wird die Reaktionszeit in Millisekunden gemessen, das Alter in Jahren, die Punkte in einem Schultest werden gezählt etc. Die meisten Merkmale in der Psychologie beziehen sich auf abstrakte Phänomene, die nicht direkt beobachtet werden können (z. B. Persönlichkeit, Identität, Lebenszufriedenheit etc.). Daher werden in der Psychologie unterschiedliche Techniken verwendet, um diese abstrakten Merkmale zu erfassen (z. B. Selbstbericht, Verhaltensbeobachtung, psychologische Tests und Aufgaben etc.). Die anhand dieser Techniken erhobenen Größen werden Variablen genannt. Der Begriff (engl. „variable“ = variabel, veränderlich) beinhaltet die wichtigste Eigenschaft von Variablen, nämlich dass sie unterschiedliche Ausprägungen annehmen können. Der deutsche Begriff Merkmal und aus dem Englischen stammende Begriff Variable werden in der Statistik synonym verwendet. Wenn eine Variable direkt gemessen oder gezählt werden kann, wird sie manifest genannt. Man nimmt an, dass es dabei keinen Messfehler gibt. Beispiele für manifeste Variablen sind die Reaktionszeit, die Schlafdauer, das Cortisolniveau im Speichel etc. Die abstrakten Phänomene in der Psychologie, die indirekt gemessen werden können, werden latente Variablen genannt. Beispielsweise wird die latente Variable Familienfunktionsniveau anhand von zehn Fragen, die auf einer dreistufigen Skala beantwortet werden können, gemessen. Da man bei jeder der zehn Fragen direkt eine Antwort erheben kann, handelt es sich bei den einzelnen Fragen um manifeste Variablen. Diese manifesten Variablen werden dafür verwendet, die latente Variable Familienfunktionsniveau zu erfassen. Da es sich bei den latenten Variablen häufig um komplexe Konstrukte handelt, wird davon ausgegangen, dass es auch einen Messfehler gibt. Um reliable Merkmale zu haben, wird versucht, den Messfehler möglichst klein zu halten. Die Unterscheidung zwischen latenten und manifesten Variablen ist besonders für einige quantitative Forschungsmethoden relevant (z. B. Faktorenanalyse). In der quantitativen Forschung spricht man auch über abhängige Variablen (AV) und unabhängige Variablen (UV). Die Variation der AV wird in Abhängigkeit von den Ausprägungen der UV untersucht. Untersucht man etwa den Zusammenhang zwischen Emotionsregula- 24 tion und Geschlecht, stellt Emotionsregulation die AV und Geschlecht die UV, weil sich das Geschlecht nicht nach unterschiedlichen Ausprägungen der Emotionsregulation verändert. Je nachdem, wie die Variablen erfasst werden, erhalten sie unterschiedliche Eigenschaften: Variablen, deren Ausprägungen ausgezählt werden können und zur Erfassung von Häufigkeit dienen, heißen diskrete Variablen (es handelt sich um eine Anzahl von etwas). Variablen, die gemessen werden sollen, nennt man stetige Variablen. Die Ausprägungen von Variablen werden als Zahlen gespeichert. Je nachdem, ob es auch inhaltlich sinnvoll ist, diese Ausprägungen bzw. Zahlen in eine Rangreihe zu bringen oder damit zu rechnen, unterscheidet man zwischen nominalskalierten, ordinalskalierten und intervallskalierten Variablen sowie Variablen mit einer Ratio-Skala. Die Eigenschaften von Variablen unterschiedlicher Skalenniveaus sind für die Entscheidung wichtig, anhand welcher Methoden diese Variablen analysiert werden sollen. Die Ausprägungen nominalskalierter Variablen bilden Kategorien ab (z. B. Geschlecht: „weiblich“ vs. „männlich“, Nationalität: „deutsch“, „französisch“ etc.). Nehmen wir an, dass das Geschlecht von Teilnehmern einer Untersuchung mit Zahlen gespeichert wird („0“ für männlich und „1“ für weiblich). Um das Skalenniveau der Variable zu bestimmen, schaut man sich an, ob es inhaltlich sinnvoll ist, mit diesen Zahlen zu arbeiten (siehe Tabelle weiter unten). Es handelt sich bei der Variable Geschlecht um zwei Kategorien. Die Zahlen können aber nicht inhaltlich sinnvoll in eine Rangreihe gebracht werden. Auch wenn einige Personen darüber streiten würden, kann man nicht sagen, dass 1 (weiblich) in diesem Fall besser als 0 (männlich) ist. Es ist auch nicht inhaltlich sinnvoll, mit den Zahlen zu rechnen und beispielsweise das durchschnittliche Geschlecht zu bestimmen. Es handelt sich um eine Nominalskala. Ein Beispiel für eine ordinalskalierte Variable ist der Bildungsabschluss (z. B. „1“ für Bachelor, „2“ für Master, „3“ für Promotion). Man kann die Personen wieder in drei Kategorien aufteilen. Außerdem ist es aber auch möglich, die Personen nach ihren Ausprägungen von 1 bis 3 in einer Rangreihe zu ordnen. Es ist legitim, zu sagen, dass 2 (Master) hier höher ist als 1 (Bachelor), da der Masterabschluss fortgeschrittenere Kenntnisse als der Bachelorabschluss voraussetzt. Ist es möglich, mit den Zahlen inhaltlich sinnvoll zu rechnen? Dafür muss man sich ansehen, ob die Abstände zwischen den Ausprägungen gleich sind. Nur wenn die Abstände zwischen den Ausprägungen gleich sind, kann man mit den Ausprägungen rechnen (z. B. Ausprägungen addieren oder subtrahieren). Ist also der Unterschied zwischen 1 (Bachelor) und 2 (Master) derselbe wie zwischen 2 (Master) und 3 (Promotion)? Obwohl es schwer ist, diese Frage zu beantworten, kann man davon ausgehen, dass die Unterschiede vermutlich nicht gleich sind, weil sich die Abschlüsse in ihrer Dauer, ihrer Intensität und ihrer Qualität unterscheiden. Man kann aber die Ausprägungen in eine Rangreihe bringen und mit den Rangordnungen inhaltlich sinnvoll rechnen (z. B. diese addieren oder subtrahieren). Da bei der Variable Bildungsabschluss die Unterscheidung in Kategorien sowie eine Rangreihe sinnvoll ist (nicht aber das Rechnen mit den Ausprägungen), handelt es sich um eine ordinalskalierte Variable. 25 Parametrisch Beim parametrischen Testen wird immer ein Parameter (z. B. der Mittelwert) einbezogen, indem eine Verteilung vorausgesetzt wird. Bei intervallskalierten Variablen ist es möglich, Kategorien zu bestimmen, die Ausprägungen in eine Rangreihe zu bringen und damit z. B. den Durchschnitt oder die Standardabweichung zu berechnen (parametrisch). Ein Beispiel für eine intervallskalierte Variable ist das Alter (in Jahren). Es ist inhaltlich sinnvoll, zu sagen, dass die Ausprägung 20 höher als zehn ist, da es sich um das Zählen der Jahre seit der Geburt handelt. Darüber hinaus ist es inhaltlich sinnvoll, zu behaupten, dass der Unterschied zwischen neun und zehn derselbe ist wie zwischen zehn und elf, elf und zwölf usw. Es ist inhaltlich sinnvoll, mit den Zahlen zu rechnen und z. B. das Durchschnittsalter zu bestimmen. Nach der Intervallskala ist noch die sogenannte Verhältnisskala (oder Ratio-Skala) zu nennen. Dabei handelt es sich um Merkmale, bei denen die Ausprägungen inhaltlich sinnvoll in eine Reihenfolge gebracht werden können, den gleichen Abstand aufweisen und zudem einen absoluten Nullpunkt besitzen (z. B. bei Mengen). Die Intervallskala und die Verhältnisskala werden häufig als metrische Skala zusammengefasst. Im Folgenden beziehen wir uns alleine auf die Intervallskala, da die statistischen Verfahren und ihre Interpretation für die Intervallund die Verhältnisskala gleich sind. Tabelle 2: Bestimmung des Skalenniveaus von Variablen Rechnen ist inhaltlich sinnvoll: gleicher Abstand zwischen den Merkmalsausprägungen Absoluter Nullpunkt Skala Kategorie Reihenfolge ist inhaltlich sinnvoll Nominal ✓ X X X Ordinal ✓ ✓ X X Intervall ✓ ✓ ✓ X Ratio ✓ ✓ ✓ ✓ Quelle: erstellt im Auftrag der IU, 2020. ZUSAMMENFASSUNG Die Psychologie ist eine empirische Wissenschaft, bei der Erkenntnisse auf Erfahrung basieren, d. h., es werden Daten erhoben und analysiert. Es wird angestrebt, dass der Weg zum Erkenntnisgewinn objektiv, systematisch und transparent ist. Für die Psychologie relevante Erhebungsund Auswertungsmethoden umfassen quantitative, qualitative und Mixed-Methoden. Bei den quantitativen Methoden werden standardisierte Daten erhoben und ausgewertet, indem z. B. psychologische Tests, experimentelle Aufgaben oder Fragebögen und Interviews mit vorgegebenen Antworten eingesetzt werden. Bei den qualitativen Forschungsmethoden werden unstandardisierte Daten erhoben und analysiert. Dafür werden bspw. Interviews mit offenen Fragen eingesetzt. Die Mixed-Methoden kombinieren quantitative und qualitative Strategien. 26 Die quantitative Forschung folgt i. d. R. der deduktiven Vorgehensweise, bei der wissenschaftliche Hypothesen anhand empirischer Daten überprüft werden. In der qualitativen Forschung werden häufig empirische Daten gesammelt und analysiert, sodass neue Theorien und Hypothesen abgeleitet werden (induktives Vorgehen). Entscheidende Schritte für den Forschungsprozess sind die Formulierung von Hypothesen und die Operationalisierung von Variablen. Wissenschaftliche Hypothesen zeichnen sich dadurch aus, dass sie aus dem aktuellen Forschungsstand abgeleitet werden, testbar, widerlegbar und allgemein gültig sind. Die in den Hypothesen formulierten Variablen können ein unterschiedliches Skalenniveau haben – nominalskaliert, ordinalskaliert, intervallskaliert oder verhältnisskaliert. Bei der Nominalskala bilden die Antwortmöglichkeiten Kategorien. Bei der Ordinalskala können die Antwortmöglichkeiten inhaltlich sinnvoll in eine Rangordnung gebracht werden. Es ist aber nicht sinnvoll, mit den Antwortmöglichkeiten direkt zu rechnen. Bei der Intervallskala ist sowohl eine Rangreihe als auch das mathematische Rechnen mit den Werten einer Variable inhaltlich sinnvoll. Die Intervallskala wird auch als metrische Skala bezeichnet. Hat eine metrische Variable einen absoluten Nullpunkt, handelt es sich um eine Verhältnisskala. Die Bestimmung des Skalenniveaus von Variablen hat eine Bedeutung für die Auswahl von Analysemethoden. 27 LEKTION 2 PROBLEMSTELLUNG UND FORSCHUNGSKREISLAUF LERNZIELE Nach der Bearbeitung dieser Lektion werden Sie wissen, … – – – – – wie Forschungsprojekte in der Psychologie ablaufen. wie wissenschaftliche Fragestellungen abgeleitet werden. welche Arten der Stichprobenziehung es gibt. welche Faktoren die Repräsentativität einer Stichprobe bestimmen. welche Techniken der Datensammlung es gibt. 2. PROBLEMSTELLUNG UND FORSCHUNGSKREISLAUF Einführung Ein Studierender im Fach Psychologie an der IU möchte selbstständig ein Abschlussarbeitsthema auswählen und eine empirische Untersuchung dazu durchführen. Aber wie soll er anfangen? Wie wählt man ein Forschungsthema und Fragestellungen aus? Was macht man danach? Welche Schritte sollten zuerst berücksichtigt werden, bevor man mit der eigentlichen Datenerhebung und Datenanalyse beginnt? Diese Lektion gibt einen Überblick über die einzelnen Schritte, die bei Forschungsprojekten im Bereich der Psychologie durchlaufen werden. Darüber hinaus werden Techniken der Stichprobenziehung und Datensammlung konkret erläutert. 2.1 Forschungskreislauf Wissenschaftliche Studien (einschließlich Projekten während des Studiums und Abschlussarbeiten) durchlaufen, unabhängig von der Vorgehensweise (induktiv oder deduktiv) und den Forschungsmethoden (quantitativ oder qualitativ), ähnliche Schritte. Die Abbildung unten stellt den üblichen Ablauf wissenschaftlicher Untersuchungen dar. Es ist wichtig, ethische Aspekte bei jedem Forschungsschritt zu berücksichtigen – nicht nur bei der Planung, sondern auch bei der Datenerhebung, der Datenauswertung und dem Zusammenfassen der Ergebnisse. Dennoch sollten spätestens vor der Datenerhebung kritische ethische Aspekte geklärt werden. In der Regel wird an dieser Stelle das Ethikvotum einer Ethikkommission eingeholt, die darüber entscheidet, ob ein Forschungsvorhaben ethisch vertretbar ist. In Abhängigkeit von der Zielsetzung und der Methodik der Untersuchung (induktiv oder deduktiv) ist es möglich, dass Arbeitsschritte gleichzeitig ablaufen oder anhand von Informationen aus einem Schritt an einem zurückliegenden Schritt gearbeitet wird. So können aufgrund der Rückmeldung der Ethikkommission andere Erhebungsmethoden ausgewählt werden. Bei qualitativen Methoden ist es außerdem üblich, dass die Analyse der Daten parallel zu der Erhebung läuft. Auch bei quantitativen Methoden ist das möglich, insbesondere um die Datenqualität zu kontrollieren. 30 Abbildung 2: Ablauf wissenschaftlicher Untersuchungen Quelle: erstellt im Auftrag der IU, 2020. Auswahl eines Forschungsthemas Zuerst werden der Untersuchungsgegenstand (auch Forschungsthema) ausgewählt und die Fragestellung bzw. Fragestellungen (auch Problemstellungen) formuliert. Diese Aufgabe fällt sogar erfahrenen Forschern, die sich einem neuen Thema widmen, nicht leicht. Zum einen spielt dabei das eigene Interesse eine große Rolle. Zum anderen ist es notwendig, den Stand der Forschung sehr gut zu kennen, um zu erfassen, wo noch Forschungslücken und Forschungsbedarf bestehen. Döring und Bortz (2016, S. 150) formulieren die folgenden Prinzipien bei der Auswahl eines Forschungsthemas und entsprechender Fragestellungen: 31 Replikationsstudie Eine Replikationsstudie ist eine exakte Wiederholung einer früheren Untersuchung. Fachdatenbanken In Fachdatenbanken kann (systematisch) nach publizierter wissenschaftlicher Literatur gesucht werden. 32 persönliches Interesse am Thema: Da Forschungsprozesse meist intensiv und zeitaufwendig sind, ist es von Vorteil, wenn Forschende persönliches Interesse am Thema haben, sodass sie motiviert bleiben. Das bedeutet nicht unbedingt, dass Forschende selbst betroffen sind (z. B. Forschende, die Panikattacken erlebt haben, untersuchen wichtige Aspekte von Panikattacken). theoretische und methodische Vorkenntnisse: Forschende orientieren sich bei der Themenauswahl an der eigenen Qualifikation und eigenen Kenntnissen. Bei interdisziplinären Studien werden Experten aus unterschiedlichen Fächern involviert. So werden bei großen und komplexen psychologischen Projekten auch Statistiker einbezogen. Da studentische Arbeiten selbstständig durchgeführt werden sollten, ist die Themenwahl auf die Psychologie und evtl. benachbarte Disziplinen begrenzt. Forschungsstand: Eine umfangreiche Recherche des aktuellen Forschungsstandes ist notwendig, um Forschungslücken zu erkennen. Außerdem können anhand der Kenntnis des aktuellen Forschungsstandes besonders relevante Forschungsarbeiten identifiziert werden. wissenschaftliche Relevanz: Nach den Grundlagen wissenschaftlicher Standards sollen Forschungsarbeiten einen neuwertigen Beitrag leisten. Wissenschaftlich relevante Untersuchungen können sich aber auch einem bereits viel erforschten Thema von besonderer Bedeutung widmen. So ist es möglich, Replikationsstudien durchzuführen. Diese haben das Ziel, besonders wichtige wissenschaftliche Erkenntnisse erneut zu untersuchen und zu validieren. praktische Relevanz: Bei der Auswahl des Forschungsthemas ist es auch wichtig, seine praktische Relevanz im Auge zu behalten. Praktisch relevante Studien bringen wichtige Informationen für Entscheidungen und Maßnahmen in den Anwendungsfeldern der Psychologie und benachbarter Disziplinen und werden als angewandte Forschung bezeichnet. Grundlagenforschung (d. h. die wissenschaftliche Untersuchung von psychologischen Mechanismen und Funktionen) hat per Definition keinen direkten Anwendungsschwerpunkt. Die Grundlagenforschung kann aber indirekt praktisch relevant sein, da sie das notwendige Wissen für die Durchführung von angewandter Forschung liefert. empirische Untersuchbarkeit des Themas: Manchmal gibt es Einschränkungen, die die Untersuchung wissenschaftlich und praktisch relevanter Themen behindern. Dazu gehören ethische Grenzen, zu hoher Aufwand für die Forschenden und Teilnehmenden, eine schwer erreichbare Zielgruppe oder mangelnde Verfügbarkeit von Hilfsmitteln. Beispielsweise könnten in Einzelgesprächen mit Führenden während einer Diktatur wichtige psychologische Eigenschaften und motivationale Aspekte erkannt werden, die die Entstehung von solchen Regimen in der Zukunft verhindern könnten. Natürlich ist eine solche Untersuchung aufgrund der schwierigen Erreichbarkeit der Zielgruppe und der mangelnden Motivation zur Teilnahme nicht möglich. Um die Fragestellungen zu formulieren, ist insbesondere eine umfangreiche und gründliche Recherche in Fachbüchern, Fachzeitschriftenartikeln und Fachdatenbanken notwendig. Die unterschiedlichen Möglichkeiten zur Literaturrecherche werden hier näher dargestellt. Die aktuellsten Ergebnisse findet man i. d. R. in neu publizierten oder sogar „Preprint“Fachartikeln. Diese werden in Fachzeitschriften herausgegeben und können direkt bei der Fachzeitschrift oder über die Fachdatenbanken gesucht werden. Für die Psychologie rele- vante Fachdatenbanken umfassen z. B. Web of Science, PsycInfo und Psyndex. Es gibt auch Fachdatenbanken zu spezifischen Themen. Beispielsweise umfasst PubMed Studien mit einem klinischen, biologischen oder neurowissenschaftlichen Fokus zusammen. Möchte man Literatur zum Thema Trauma finden, ist es sinnvoll, in der themenspezifischen Fachdatenbank PILOTS zu schauen (The Published International Literature on Traumatic Stress). Außerdem werden manche Studienprotokolle in Register eingefügt, bevor mit der Datenerhebung angefangen wird. Der Vorteil, nach aktuellen Forschungsprojekten in Studienregistern zu suchen, ist, dass diese aktuelle Themen und Fragestellungen enthalten können, für die es noch keine Publikationen gibt. Außerdem wurde die Vorgehensweise von Studienprotokollen in Registern in der Regel von Fachexperten bereits überprüft und entsprechend angepasst. Mit einer Registrierung von Studien wird das Risiko für zwei Arten von Verzerrungen verringert: Zum einen kann vermieden werden, dass Ergebnisse, bei denen sich die Arbeitshypothese nicht bestätigen ließ (nicht signifikante Ergebnisse) nicht veröffentlicht werden (Dieses Problem ist auch als File-DrawerProblem bekannt). Zum anderen sollten sich die Forschenden eng an den Auswertungsplan und an die Untersuchung ursprünglicher Hypothesen halten und nicht die Analyse an die vorhandenen Daten anpassen. Um Forschungsergebnisse schneller auszutauschen, gibt es heute die Tendenz, Manuskripte zu wissenschaftlichen Untersuchungen noch vor dem Peer-Review und der Publikation als Preprint online zur Verfügung zu stellen. Beispielsweise wurde im Februar 2020, nur zwei Monate, nachdem die Covid19-Erkrankung in der chinesischen Stadt Wuhan auffällig wurde und die Covid19-Pandemie auslöste, einer der ersten Artikel zur psychologischen Belastung und der Nutzung von sozialen Medien während der Quarantäne als Preprint publiziert (Gao et al. 2020). Auch wenn die Preprints i. d. R. die neusten Entwicklungen in der Wissenschaft darstellen, sollten sie kritisch betrachtet werden, da sie keinen Peer-Review-Prozess durchlaufen haben. Das heißt, dass die Forschungsgruppe möglicherweise kein externes Feedback zum Vorgehen und zu den Ergebnissen bekommen hat. Um einen Einblick in den Forschungsstand zu gewinnen, können auch narrative oder systematische Übersichtsarbeiten sowie Metaanalysen einbezogen werden. In narrativen Reviews fassen Experten die wichtigsten Erkenntnisse zu einer Problemstellung zusammen. Narrative Reviews haben keinen Anspruch auf vollständige Recherche bestehender Publikationen, sondern legen einen Schwerpunkt auf besonders wichtige wissenschaftliche Literatur. Bei einer systematischen Übersichtsarbeit werden Publikationen in den wissenschaftlichen Fachdatenbanken nach im Vorfeld definierten Such- und Einschlusskriterien ausgewählt. Auf diese Weise wird versucht, alle relevanten Literaturquellen zu einem Thema einzubeziehen. Die Ergebnisse dieser systematischen Recherche werden meist inhaltlich nach gemeinsamen Themen und Problemen zusammengefasst. Werden in einem nächsten Schritt die Ergebnisse der einzelnen ausgewählten Studien rechnerisch anhand angemessener Methoden zusammengefasst, spricht man von einer Metaanalyse. In einigen Fällen werden auch bei systematischen Übersichten die Daten rechnerisch zusammengefasst. Die Metaanalyse bietet aber eine statistische Möglichkeit, die unterschiedlich großen Studien mit einem unterschiedlichen Gewichtungswert in den Gesamtwert einzubeziehen. Preprint Ein Preprint ist ein wissenschaftlicher Artikel, der vor dem Peer-Review und vor der eigentlichen Publikation online zur Verfügung gestellt wird. Metaanalyse In einer Metaanalyse werden die Ergebnisse mehrerer Untersuchungen zu derselben Fragestellung zusammengerechnet. 33 Häufig entwickelt sich die Themenfindung in einem Prozess von sehr vagen Aussagen zu konkreten Fragestellungen. Erst wenn ein Themenbereich ausgewählt wird, kann konkreter betrachtet werden, wo noch Forschungslücken bestehen. Die folgende Abbildung zeigt beispielhaft, wie ein Forschender zur folgenden Fragestellung kommt: „Verändern angstbezogene Informationen die Angsterwartungen von Kindern?“ (Field/Hole 2003, S. 34). Abbildung 3: Ablauf bei der Themenauswahl wissenschaftlicher Untersuchungen Quelle: Field/Hole 2003, S. 34. 34 Methodenauswahl und Durchführung Nachdem die Fragestellung formuliert wurde, entscheidet man sich, ob ein induktives oder deduktives Verfahren angebracht ist. Da bei der Fragestellungformulierung im Beispiel eine Theorie, dass angstbezogene Informationen die Entwicklung von Phobien fördern, existiert und auch Studienergebnisse über Erwachsene diese Theorie bestätigen konnten, ist ein deduktives Vorgehen angebracht. In dem Fall, dass es keine Theorien und früheren Ergebnisse gibt, oder dass diese nicht auf die konkrete Zielgruppe übertragen werden können, ist das induktive Vorgehen sinnvoll. Im Anschluss werden die Forschungsmethoden zur Datenerhebung und Datenanalyse ausgewählt. Zu diesem Zweck sind umfassende Kenntnisse über die Möglichkeiten und Limitationen unterschiedlicher Methoden notwendig. Es wird etwa die Entscheidung getroffen, ob qualitative oder quantitative, subjektive oder objektive Methoden der Datenerhebung und Datenanalyse angewandt werden. Die Forschenden entscheiden sich, welche Personengruppe zur Untersuchung der Fragestellungen am besten passt, wie viele Personen man untersuchen möchte und in welchem Zeitraum die Erhebung stattfinden soll. Wichtig ist, dass ethische Aspekte, besonders zum Schutz der Teilnehmenden und Forschenden, bei der Methodenwahl berücksichtigt werden. In einem nächsten Schritt werden alle notwendigen Materialien vorbereitet. Dazu gehören u. a. Informationsblätter und Einverständniserklärungen für die Teilnehmenden, Fragebögen, Protokolle sowie Bereitstellung von Apparatur. Des Weiteren werden Teilnehmende rekrutiert, d. h., Informationen über die Studie werden direkt oder indirekt über bestimmte Organisationen (z. B. Schule) an den Teilnehmenden weitergeleitet und sie werden zur Teilnahme eingeladen. Danach erfolgt die Erhebung und Analyse der empirischen Daten. Dabei werden die einzelnen Schritte sorgfältig dokumentiert. Die Dokumentation während der Erhebung kann beim nächsten Schritt der Datenanalyse helfen, systematische Fehler zu identifizieren. Nehmen wir an, dass während der Datenanalyse erkannt wurde, dass alle Testergebnisse eines konkreten Testleiters von den restlichen Daten abweichen. Es kann anhand der Dokumentation nachgeprüft werden, ob dieser Testleiter alle Schritte nach dem Protokoll durchgeführt hat. Auch die Dokumentation während der Datenanalyse kann hilfreich sein, um Fehler zu finden oder Analyseschritte anzupassen und erneut durchzuführen. Für die Datenanalyse werden die erhobenen Daten erst in einer geeigneten Form gespeichert. Quantitative Daten werden in Datenmasken und Auswertungsprogramme, wie Excel, IBM SPSS oder R, übertragen. Qualitative Daten werden anhand geeigneter Programme transkribiert und systematisiert. Es erfolgt die Datenauswertung, die sich nach quantitativen und qualitativen Methoden unterscheidet. Zu den quantitativen Datenanalysemethoden gehören statistische Auswertungsstrategien. Die Statistik umfasst zwei Grundbereiche – deskriptive Statistik und schließende Statistik (Inferenzstatistik). In der deskriptiven Statistik werden Verteilungen von Variablen und Zusammenhänge in der Stichprobe beschrieben. In der Inferenzstatistik werden Aussagen 35 Inferenzstatistik In der Inferenzstatistik werden auf Basis der Stichprobe und bestimmter Fehlerannahmen Schlussfolgerungen auf die Grundgesamtheit gezogen. über die Grundgesamtheit auf Basis der Sachverhalte in der Stichprobe gemacht. Es gibt unterschiedliche Vorgehensweisen der Inferenzstatistik – z. B. bayesianische Statistik oder frequentische Inferenz. Interpretation der Ergebnisse Ein wichtiger Schritt in einem Projekt ist die Interpretation der Ergebnisse. An dieser Stelle wird die Frage beantwortet, wie die aktuellen Ergebnisse in den Stand der Forschung eingeordnet werden können. Es wird ggf. diskutiert, ob die Hypothesen bestätigt oder falsifiziert wurden. Im Fall, dass die ursprünglichen Erwartungen nicht bestätigt werden konnten, werden mögliche Ursachen dafür diskutiert. Wichtig bei der Interpretation von Ergebnissen ist es, die Grenzen der eigenen Studie im Auge zu behalten. Außerdem wird diskutiert, welche Bedeutung die neuen Erkenntnisse für die zukünftige Forschung und praktische Arbeit mit Menschen haben. Ergebnispräsentation Schließlich werden die Ergebnisse in Berichten, Zeitschriftenartenartikeln oder Abschlussarbeiten zusammengefasst. Damit die Ergebnisse nachvollziehbar sind, werden dabei der Stand der Forschung und die Methodik detailliert dargelegt. Ergebnispräsentationen in der Psychologie folgen einer ähnlichen Struktur. Tabelle 3: Struktur und Inhalte einer wissenschaftlichen Publikation oder Abschlussarbeit in der Psychologie 36 Abschnitt Inhalt Abstract/Zusammenfassung Ein Abstract (oder Zusammenfassung) beinhaltet einen kurzen Überblick über Hintergrund und Ziele einer Untersuchung, die Methoden, die wichtigsten Ergebnisse sowie die damit verbundenen Schlussfolgerungen. Zu einem deutschsprachigen Manuskript gehören sowohl die deutschsprachige Zusammenfassung als auch ein identischer Abstract auf Englisch. Einleitung/Theorie In der Einleitung oder dem theoretischen Hintergrund (bei Abschlussarbeiten) wird der Stand der Forschung zum Forschungsthema zusammengefasst, sodass der Forschungsbedarf und die Relevanz des Themas unterstrichen werden. Außerdem werden die wichtigsten Konstrukte definiert und erklärt. Dieser Abschnitt bzw. diese Abschnitte beinhalten auch die Darstellung der Fragestellungen und ggf. Hypothesen oder Erwartungen. Methoden Die Methoden beinhalten Informationen über das methodische Vorgehen (etwa wie die Schritte eines Kochrezepts). Bei quantitativen Untersuchungen bspw. werden die Stichprobe und Durchführung, die Erhebungsmethoden sowie die statistische Auswertungsstrategie dargelegt. Ergebnisse Im Ergebnissteil werden die Ergebnisse durch die angewandten Methoden systematisch dargestellt und ggf. anhand von Tabellen und/oder Abbildungen grafisch zusammengefasst. Die Beschreibung von Methoden oder inhaltliche Interpretationen der Ergebnisse gehören nicht in den Ergebnisteil. Abschnitt Inhalt Diskussion Im Diskussionsteil werden die Ergebnisse in den aktuellen Forschungsstand eingeordnet. Es wird diskutiert, ob die ursprünglichen Hypothesen bestätigt wurden und welche Gründe es für unerwartete Ergebnisse gibt. Die Limitationen und Stärken der eigenen Untersuchung werden reflektiert. Außerdem werden die wissenschaftlichen und praktischen Implikationen der Ergebnisse diskutiert. Quelle: erstellt im Auftrag der IU, 2020. 2.2 Stichprobenziehung Ein besonders wichtiger Schritt in jedem psychologischen Forschungsprojekt ist die Auswahl einer Zielgruppe von Personen, Organisationen, Strukturen etc., die untersucht werden. In der quantitativen Forschung nennt man die untersuchten Fälle auch Merkmalsträger. Da in der Psychologie meist Personen untersucht werden, beziehen sich die folgenden Ausführungen auf Personen als Merkmalsträger. In jedem Forschungsprojekt werden Entscheidungen über die konkrete Zielgruppe (wer?), aber auch die Anzahl an Teilnehmenden (wie viele?) getroffen. Wer wird teilnehmen? Bei einer Studie über die Risikofaktoren für die Entwicklung von Angststörungen soll je nach Formulierung der Fragestellung die Wahl getroffen werden, ob Teilnehmende aus der Allgemeinbevölkerung untersucht werden, von denen einige an Angststörungen leiden, oder ob Angstpatienten, bei denen die Störung bereits diagnostiziert wurde, einbezogen werden. Auch wenn das Forschungsthema in beiden Fällen untersucht werden kann, können anhand beider Zielgruppen unterschiedliche Informationen gewonnen werden. Auch der Aufwand unterscheidet sich: Im ersten Fall können Risikofaktoren für Angststörungen im Vergleich zu gesunden Personen erkannt werden. Man benötigt aber viele Teilnehmende, damit auch genug Personen mit Angststörungen untersucht werden. Im zweiten Fall kann man gut darlegen, welche Risikofaktoren die Angstpatienten besonders gut beschreiben. Möglicherweise sind nur wenige Personen notwendig, um eine Aussage treffen zu können. Man wird aber nur Angstpatienten, die eine Behandlung gesucht haben, erreichen. Einige Personen mit einer Angststörung, die sich nicht in der Behandlung befinden, werden ausgeschlossen. Bereits bei der Untersuchungsplanung sollten Forschende sich gut und ganz konkret Einschluss- und Ausschlusskriterien zur Teilnahme überlegen. Dazu gehören demografische Merkmale (Alter, Geschlecht etc.), spezifische Merkmale für die Fragestellung (z. B. weitere psychische Störungen im Fall, dass man Angststörungen untersucht), aber auch ethische Aspekte (besteht für einige Personen Gefahr, wenn sie an der Untersuchung teilnehmen?). Die Entscheidung, wer an einer Untersuchung teilnehmen wird, hängt auch davon ab, ob quantitative oder qualitative Methoden angewandt werden. In der quantitativen Forschung ist es angemessen, dass für die Fragestellungen relevante Merkmale variieren. Die Merkmalsträger dürfen bezüglich dieser Merkmale heterogen sein. Es wird aber angestrebt, dass sich die Merkmalsträger bezüglich anderer Merkmale, die die Ergebnisse 37 beeinflussen können, nicht stark unterscheiden. Ansonsten sollten solche Merkmale miterfasst werden, sodass deren Einfluss statistisch kontrolliert wird. Die Idee ist, dass gefundene Zusammenhänge oder Unterschiede auf die untersuchten Merkmale und nicht auf Störgrößen zurückgeführt werden können (Eid/Gollwitzer/Schmitt 2017, S. 84). In einer Studie über die Emotionalität von Kindern werden etwa Kinder mit einer Autismus-Spektrum-Störung ausgeschlossen. Der Grund dafür ist, dass diese Kinder Besonderheiten in ihrer Emotionalität aufweisen, die die Gesamtergebnisse beeinflussen können. Die qualitative Forschung verfolgt häufig das Ziel, anhand einer kleinen Personengruppe viele relevante Themen zu untersuchen. Daher ist es manchmal sinnvoll, eine heterogene Stichprobe zu untersuchen, um die Meinung unterschiedlicher Personen zu hören (Schreier 2013a, S. 197). Wie viele Personen werden teilnehmen? Grundgesamtheit Die Grundgesamtheit umfasst alle Fälle einer Zielgruppe, die untersucht werden soll. Stichprobe Eine Stichprobe stellt einen Teil der Grundgesamtheit dar, die untersucht wird. 38 Möchte man eine Befragung über die Motivation von Studierenden an der IU durchführen, dann ist es klar, dass die Zielgruppe Studierende an der IU darstellt. An der IU gibt es über 27.000 Studierende in unterschiedlichen Fächern, die die Grundgesamtheit darstellen (IU 2019). Die Grundgesamtheit soll exakt definiert werden (auch bezüglich Ort und Zeit; Hussy 2013b, S. 118). Die Grundgesamtheit der Studierenden ist in jedem Jahr unterschiedlich, da einige ihr Studium abschließen, andere abbrechen und zudem neue Studierende aufgenommen werden. Entscheidet man sich dafür, all diese Studierenden zu befragen, spricht man von einer Totalerhebung. Eine Totalerhebung ist jedoch häufig mit einem sehr großen Zeit-, Arbeitsund Kostenaufwand verbunden. In vielen Fällen ist es schwierig, alle Personen aus der Zielgruppe für eine Teilnahme zu motivieren. Daher wird in psychologischen Untersuchungen i. d. R. eine kleinere Personenanzahl einbezogen. Es wird eine Teilerhebung durchgeführt. Die ausgewählten Personen stellen die Stichprobe dar (Hussy 2013b, S. 118). Abbildung 4: Grundgesamtheit und Stichprobe Quelle: erstellt im Auftrag der IU, 2020. Die Auswahl der Stichprobengröße hängt von unterschiedlichen Faktoren ab. Bei einer größeren Grundgesamtheit ist es angemessen, auch eine größere Teilstichprobe auszuwählen, sodass diese die Verhältnisse in der Grundgesamtheit besser abbilden kann. Bei einer Teilerhebung von 5.000 Studierenden der IU werden nahezu 20 % der Grundgesamtheit befragt. Interessiert man sich für alle Studierenden in Deutschland, werden bei einer Teilerhebung von 5.000 nur einzelne Studierenden von jeder Hochschule untersucht. In der quantitativen Forschung gibt es statistische Methoden, um einen optimalen Stichprobenumfang auszuwählen (im Rahmen der Power-Analyse). Die Stichprobengröße bei qualitativen Untersuchungen ist in der Regel kleiner. Gelegenheitsstichprobe vs. Zufallsstichproben Es gibt unterschiedliche Herangehensweisen, eine Teilerhebung durchzuführen: Eine Möglichkeit der Teilerhebung ist die Ziehung einer Zufallsstichprobe (probabilistische Stichprobe). Anhand eines Zufallsprinzips werden Personen aus der Grundgesamtheit so ausgewählt, dass für jede Person aus der Grundgesamtheit die gleiche Chance besteht, in die Stichprobe einbezogen zu werden (Döring/Bortz 2016, S. 310). Ein unabhängiges Zufallsprinzip stellt etwa das Werfen einer Münze dar. Für jede Person der Grundgesamtheit wird eine Münze geworfen und die Personen, bei denen die Münze Kopf zeigt, werden in die Stichprobe aufgenommen. Auf diese Weise hat jede Person eine 50 %-Chance, für die Stichprobe ausgewählt zu werden. Diese Auswahl ist unabhängig von demografischen Merkmalen wie Geschlecht, Bildungsstand, Migrationshintergrund etc., oder von Ausprä- Zufallsstichprobe Bei einer Zufallsstichprobe werden Personen anhand eines unabhängigen Zufallsprinzips aus der Grundgesamtheit ausgewählt. 39 gungen von Merkmalen, die für die Fragestellungen relevant sind. Heutzutage verwendet man meistens computergestützte zufällige Auswahlverfahren, um Merkmalsträger aus Listen (Geburtsregister, Register des Einwohnermeldeamtes, Krankenkassenregister etc.) für eine Zufallsstichprobe zu ziehen. Eine Zufallsstichprobe wird für eine Reihe von Datenanalysemethoden in der quantitativen Forschung (inferenzstatistische Verfahren) vorausgesetzt. Mit diesen Methoden wird unter Annahme einer gewissen Fehleranfälligkeit eine Schlussfolgerung von den Ergebnissen in der Stichprobe auf die Grundgesamtheit gemacht. Aufgrund von Schwierigkeiten mit der Ziehung einer Zufallsstichprobe wird diese Voraussetzung häufig nicht erfüllt. Eine der größten Schwierigkeiten bei einer Zufallsstichprobe ist es, alle Personen einer Grundgesamtheit zu identifizieren, um sie in der Zufallsauswahl zu berücksichtigen. Außerdem kann es bei einer großen Grundgesamtheit und einer relativ kleinen Stichprobe auch vorkommen, dass das untersuchte Merkmal sehr heterogen verteilt ist, was in statistischer Hinsicht bei der Aufdeckung von kleinen Effekten problematisch sein kann. Um mit der ersten Schwierigkeit umzugehen, kann eine Klumpenstichprobe gezogen werden. Das zweite Problem kann mit einer stratifizierten (= geschichteten) Stichprobe umgangen werden (Albers et al. 2009, S. 83). Bei einer Klumpenstichprobe wird die Grundgesamtheit zunächst in Gruppen aufgeteilt. Anstatt alle Personen in der Grundgesamtheit aufzulisten, werden erst die Gruppen (oder Klumpen) aufgelistet. Es erfolgt eine zufällige Auswahl der Klumpen. Es ist möglich, die Personen in den ausgewählten Klumpen auch in neue Gruppen aufzuteilen und einige davon wieder per Zufall auszuwählen. Am Ende werden die Personen der ausgewählten Klumpen aufgelistet, sodass zufällig eine bestimmte Anzahl davon in die Stichprobe einbezogen wird. Ähnlich wurde in einer nationalen Untersuchung zum Gesundheitszustand von Kindern und Jugendlichen bis zu ihrem 17. Lebensjahr vorgegangen (der Kinder- und Jugendgesundheitssurvey KiGGS, Kamtsiuris/Lange/Rosario 2007, S. 548). Zuerst wurden aus allen politischen Gemeinden Deutschlands 150 anhand eines Zufallsprinzips ausgewählt. Danach wurden Kinder und Jugendliche über Melderegister in den ausgewählten Gemeinden per Zufall ausgewählt und zur Teilnahme eingeladen. 40 Abbildung 5: Klumpenstichprobe am Beispiel der KIGGS-Studie Quelle: erstellt im Auftrag der IU, 2020 in Anlehnung an Kamtsiuris/Lange/Rosario 2007, S. 548. Bei der stratifizierten oder geschichteten Stichprobe werden Personen einer Grundgesamtheit in Schichten (z. B. jeweils nach Bildungsstand, Migrationshintergrund, Herkunft etc.) geordnet. Aus jeder Schicht (auch Strata genannt) werden per Zufall Personen ausgewählt. Das Verhältnis der ausgewählten Anzahl an Personen je Schicht entspricht der Verteilung des Schichtungsmerkmals in der Grundgesamtheit. Sinnvoll ist es, wenn das Schichtungsmerkmal mit dem anhand der Fragestellungen untersuchten Merkmal zusammenhängt. Auf diese Weise wird eine bessere Schätzung der Grundgesamtheit gewährleistet. In der KIGGS-Studie wurde nicht nur eine Klumpenstichprobe gezogen, sondern es wurde auch das Verfahren der stratifizierten Stichprobe angewandt. Um eine für Deutschland repräsentative Stichprobe zu gewährleisten, wurden die politischen Gemeinden sortiert, je nachdem, ob sie sich in Ost- oder Westdeutschland befinden. Dann wurde eine unterschiedliche Anzahl an Gemeinden aus Ost- und Westdeutschland proportional zu der Bevölkerung zufällig ausgewählt (Kamtsiuris/Lange/Rosario 2007, S. 548). Somit handelt es sich bei dieser Studie um eine mehrstufige Auswahl, da Strategien der Klumpenstichprobe und der geschichteten Stichprobe eingesetzt wurden. 41 Abbildung 6: Stratifizierte Stichprobe nach Migrationshintergrund Quelle: erstellt im Auftrag der IU, 2020. Gelegenheitsstichprobe Eine Gelegenheitsstichprobe umfasst Personen, die zur Verfügung stehen. 42 Manchmal ist die Ziehung einer Zufallsstichprobe von der Grundgesamtheit nicht möglich. In diesen Fällen werden Personen einbezogen, die gerade zur Verfügung stehen. Diese Art der Teilerhebung nennt man Gelegenheitsstichprobe (Döring/Bortz 2016, S. 305). Nicht klinische Forschungsprojekte an Universitäten umfassen häufig Studierende. An einigen Hochschulen und Universitäten einschließlich der IU sind Psychologiestudierende sogar verpflichtet, an Studien teilzunehmen, damit sie eine bestimmte Anzahl an Probandenstunden sammeln. Es wird kritisiert, dass wir anhand psychologischer Forschung in gewisser Hinsicht gute Kenntnisse über Psychologiestudierende haben und nicht über die Menschen allgemein. Das ist problematisch, wenn eine Allgemeingültigkeit der Ergebnisse angenommen wird. Beispiele für Gelegenheitsstichproben sind Teilerhebungen von Personen, die über Zeitschriften oder andere Medien über die Studie erfahren. Allerdings ist es ein Problem, dass Personen, die keinen Zugang zu diesen Medien haben, keine Chance bekommen, in die Studie eingeschlossen zu werden. Gelegenheitsstichproben weisen ein höheres Risiko auf, dass Personen aus bestimmten Gruppen über- oder unterrepräsentiert sind und dass es sich um eine homogene Stichprobe handelt, die die Verhältnisse in der Grundgesamtheit nicht widerspiegelt. Um mit dieser Einschränkung umzugehen, kann eine spezielle Art der Gelegenheitsstichprobe erhoben werden – die Quotenstichprobe. Bei der Quotenstichprobe wird sichergestellt, dass ein bestimmtes Merkmal (z. B. Geschlecht, Bildungsstand, Migrationshintergrund etc.), das für die Ergebnisse wichtig ist, wie in der Grundgesamtheit verteilt wird. Untersucht man eine Fragestellung, bei der ein Migrationshintergrund die Ergebnisse beeinflussen könnte, dann ist es sinnvoll, die Verteilung von Geschlecht in der Grundgesamtheit zu berücksichtigen. Gemäß Statistischem Bundesamt (2019) haben etwa 20 % der Menschen in Deutschland einen Migrationshintergrund. Bei einer Quotenstichprobe geht man genauso wie bei einer Gelegenheitsstichprobe vor, mit dem Unterschied, dass, falls die 80 % der vorab bestimmten Stichprobengröße mit Personen ohne Migrationshintergrund erreicht werden, nur noch Personen mit Migrationshintergrund rekrutiert werden. Das Quotenmerkmal ist in der Stichprobe wie in der Grundgesamtheit gleich verteilt. Es besteht dennoch immerhin noch die Gefahr, dass andere relevante Merkmale nicht die Situation in der Grundgesamtheit widerspiegeln. Repräsentativität einer Stichprobe Um verlässliche Aussagen anhand einer Stichprobe über die Grundgesamtheit zu machen, ist es notwendig, dass die Stichprobe möglichst gut die Grundgesamtheit widerspiegelt. Stellt die Stichprobe eine gute Abbildung der Grundgesamtheit dar, dann kann von einer hohen Repräsentativität ausgegangen werden. Obwohl die Repräsentativität der Stichprobe als Qualitätsmerkmal einer Untersuchung angenommen wird, gibt es in der Forschung keine einheitlichen Standards dafür. Forschende gehen unterschiedlich mit Repräsentativitätsproblemen um. Repräsentativität Eine hohe Repräsentativität liegt vor, wenn eine Stichprobe ähnlich zusammengesetzt ist wie die Grundgesamtheit. Häufig wird anhand der Strategie der Stichprobenziehung sichergestellt, dass konkrete Merkmale in der Stichprobe genauso wie in der Grundgesamtheit verteilt sind (z. B. anhand einer Quotenstichprobe oder einer geschichteten Stichprobe). In diesem Fall liegt eine merkmalsspezifisch-repräsentative Stichprobe vor (Döring/Bortz 2016, S. 998). Die Auswahl der Merkmale, mit denen die Repräsentativität bestimmt wird, hängt von der Entscheidung der Forschenden und der Kenntnis über die Verteilung von Merkmalen in der Grundgesamtheit ab. Häufig handelt es sich um demografische Merkmale, die durch das Statistische Bundesamt oder andere Institutionen regelmäßig in der Grundgesamtheit erhoben werden. Eine global-repräsentative Stichprobe setzt voraus, dass alle Merkmale und Merkmalskombinationen in der Stichprobe genauso verteilt sind wie in der Grundgesamtheit (Döring/Bortz 2016, S. 998). Wie kann man aber sicherstellen, dass wirklich alle Merkmale in der Stichprobe genauso wie in der Grundgesamtheit verteilt sind? Die einzige Möglichkeit ist es, eine zufällige Stichprobe mit einer ausreichenden Größe zu ziehen. Eine Zufallsstichprobe kann, muss aber nicht global repräsentativ sein. Es gibt mathematische Formeln, um die Stichprobenfehler zu berechnen, d. h. das Risiko, dass die Stichprobe von der theoretischen Grundgesamtheit abweicht. Der Stichprobenfehler (auch Standardfehler) kann dann durch die Vergrößerung des Stichprobenumfangs verringert werden (Lippe/Kladroba 2002). Obwohl ein großer Stichprobenumfang zu einer höheren Repräsentativität führen kann, ist das nicht immer der Fall. Ein gutes Beispiel dafür stellen zwei unabhängige Schätzungen des Ergebnisses der Wahlen eines US-amerikanischen Präsidenten (Alfred Landon gegen Franklin Roosevelt) im Jahr 1936 dar (Squire 1988). In der Zeitschrift „Literary Digest“ wurden die bevorstehenden Wahlergebnisse anhand einer Stichprobe von 2,3 Millionen Menschen eingeschätzt. Um die Stichprobe zu erheben, wurden ca. zehn Millionen Anfragen an Personen verschickt, die zufällig aus KFZ-Anmelderegistern, Telefonbüchern und Listen mit Abonnenten der Zeitschrift ausgewählt worden waren. In dieser Stichprobe gaben 55 % der Teilnehmenden an, dass sie ihre Stimme für Landon geben werden. In einer weiteren konkurrierenden Untersuchung schätzte George Gallup, dass 54 % Roosevelt wählen würden. Seine Einschätzung basierte auf einer Stichprobe von 3.000 Personen. Gallup konzentrierte sich auf persönliche Merkmale, die zu unterschiedlichem Wahlverhalten führen können (z. B. Bundesstaat, Stadt- oder Land, Geschlecht, Alter, Einkommen). Er setzte Quoten für diese Merkmale fest. Nach den Wahlen im Jahr 1936 stellte sich heraus, dass die viel kleinere Studie von Gallup eine bessere Einschätzung geliefert hatte: Roosevelt hatte mit 61 % die Wahlen gewonnen. Es wurden unterschiedliche Gründe für die nicht gelungene Einschätzung der „Literary Digest“ diskutiert. Dazu 43 Stichprobenbias Die Stichprobenbias beziehen sich auf systematische Verzerrungen, die die Repräsentativität der Stichprobe gefährden. gehören Stichprobenverzerrungen (auch Stichprobenbias genannt), wie z. B. die Vermutung, dass arme Menschen, die eher Roosevelt gewählt hätten, gar nicht zur Teilnahme eingeladen wurden, da sie kein Auto oder Telefon besaßen. Darüber hinaus war die Rücklaufquote relativ gering – von den zehn Millionen Menschen, die zur Teilnahme eingeladen wurden, nahmen nur 23 % tatsächlich teil (Squire 1988). Da die Auswahl der Grundgesamtheit verzerrt war, war auch die zufällige Auswahl verzerrt. Wenn nicht alle Personen aus der Grundgesamtheit identifiziert oder erreicht werden können, kann man auch eine zufällige Auswahl nicht als Zufallsstichprobe bezeichnen. Bei der Auswahl einer Stichprobe sollte man versuchen, Stichprobenbias, zu denen die folgenden gehören, zu vermeiden: Unterabdeckungs-Fehler (engl. „undercoverage bias“): Es werden nicht alle Personen aus der Grundgesamtheit eingeladen. Beispielsweise werden bei einer Auswahl aus Telefonregistern Personen, die kein Telefon haben, nicht eingeladen. Non-Response-Fehler (engl. „non-response bias“): Nicht alle Personen, die für eine Untersuchung ausgewählt wurden, nehmen an einer Untersuchung teil. Zum einen kann es sein, dass diese Personen nicht erreicht wurden, zum anderen können sie die Teilnahme aufgrund mangelnder Motivation, Fehlen an Vertrauen oder Zeit verweigern. Bei der Beschreibung jeder Stichprobe sollte daher immer die Ausschöpfungsrate (engl. „response rate“) angegeben werden. Diese stellt das Verhältnis der tatsächlich Teilnehmenden zu den für die Teilnahme eingeladenen Personen dar. Die folgende Abbildung zeigt Gründe für die Nichtteilnahme an der repräsentativen Datenerhebung zur Einschätzung des Gesundheitszustandes von Kindern und Jugendlichen in Deutschland (KIGGS, Kamtsiuris/Lange/Rosario 2007, S. 551). 44 Abbildung 7: Gründe für die Nichtteilnahme an der KIGGS-Studie Quelle: Kamtsiuris/Lange/Rosario 2007, S. 551. Selektionseffekte (engl. „selection bias“): Selektionseffekte umfassen systematische Verzerrungen bei der Auswahl einer Stichprobe sowie bei der Selbstselektion der Teilnehmenden. Beispielsweise wird in der Forschung über Kinder, die nicht über sich selbst berichten können, häufig ein Elternteil befragt. Aus unterschiedlichen Gründen nimmt meist die Mutter teil. Dies kann einen Einfluss auf die Beurteilung von Merkmalen des Kindes haben. fehlende Werte (engl. „missing values“): Im Laufe einer Untersuchung kann es passieren, dass Informationen von Personen, die einer Teilnahme zugestimmt haben, fehlen. So ist es möglich, dass einige die Studie abbrechen. Solche Abbrüche sollten auf systematische Fehler geprüft werden. Außerdem rechnet man in der psychologischen Forschung häufig mit fehlenden Werten einzelner Personen. Zum Beispiel haben eine oder mehrere Personen eine Frage nicht beantwortet. Der Grund dafür können wieder systematische Fehler sein. Die Frage war nicht klar, zu schwierig oder zu persönlich. Wenn die fehlenden Werte nicht systematisch sind, gibt es unterschiedliche statistische Techniken in der quantitativen Forschung, um die fehlenden Werte zu schätzen. Damit die Repräsentativität einer Stichprobe nicht durch Stichprobenbias gefährdet wird, sollten diese bereits bei der Planung der Studien berücksichtigt werden. Wichtig ist es dabei, einen angemessenen Plan zu haben, wie und welche Personen rekrutiert werden und wie sie zur Teilnahme motiviert werden sollen. Auf den ersten Blick einfache Entscheidungen (z. B. Titel der Studie und Darstellung der Ziele) haben einen großen Einfluss auf 45 die Rekrutierung und Motivierung von Teilnehmenden. Die Repräsentativität einer Stichprobe sollte bei der Interpretation der Ergebnisse berücksichtigt werden. Wenn z. B. auf der Packung eines Shampoos steht, dass es dermatologisch getestet wurde, sollte berücksichtigt werden, wie gut die Stichprobe die Grundgesamtheit widerspiegelt, um die Allgemeingültigkeit dieser Aussage zu überprüfen. 2.3 Techniken der Datensammlung Die Auswahl der Techniken zur Datensammlung hängt davon ab, ob eine quantitative oder qualitative Datenerhebung durchgeführt wird. Grundsätzlich unterscheidet sich die Datensammlung dadurch, ob Primärdaten neu erhoben werden oder ob Sekundärdaten analysiert werden (Albers et al. 2009, S. 51). Sekundärdaten umfassen die interne oder externe Dokumentation, Unterlagen, Berichte und Akten oder bereits erhobene Daten einer früheren Untersuchung. Mit der Tendenz zur Open Science ist der Zugang zu externen Daten früherer Untersuchungen immer leichter. Die Analyse von Sekundärdaten hat den Vorteil, dass der Schritt der Datenerhebung übersprungen wird und direkt mit der Datenauswertung angefangen werden kann. Ein Nachteil ist jedoch, dass Sekundärdaten die Information, die für die neu formulierten Fragestellungen notwendig ist, manchmal nicht beinhalten. Die Erhebung von Primärdaten kann hauptsächlich in Befragungen, psychologische Tests von Fähigkeiten sowie Beobachtungen und Messungen von biophysiologischen Maßen unterteilt werden. Abbildung 8: Methoden zur Datensammlung Quelle: Albers et al. 2009, S. 50. 46 Befragung Eine Befragung kann schriftlich oder in Form eines Interviews durchgeführt werden. Schriftliche Befragungen sind eher in der quantitativen Forschung üblich. Die Probanden beantworten Fragen oder lösen Aufgaben auf dem Papier oder am Computer (off- oder online). Mit dem Fortschritt der Technik und der internetbasierten Kommunikationsmöglichkeiten werden Online-Befragungen immer verbreiteter. Online-Befragungen sind besonders für sensible Themen und Online-Panelstudien, bei denen Informationen mehrmals erhoben werden, geeignet. Befragungen haben den großen Vorteil, dass sie ökonomisch durchgeführt werden können. Die Rekrutierung läuft vergleichsweise schnell ab, indem der Link zur Befragung übermittelt wird. Die Teilnehmenden füllen die Bef