Experiment

Aus Meinungsklima

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Experimente: Begriff und Forschungslogik

Der Begriff "Experiment" kommt vom lateinischen Verb experiri = erfahren. Ein Experiment ist ein wissenschaftliches Forschungsdesign, das eingesetzt wird, um etwas über die Wirklichkeit in Erfahrung zu bringen.

Was ist ein "Experiment"?

Leider wird in Umgangssprache und Wissenschaft Unterschiedliches unter dem Begriff des Experimentes verstanden und auch die Bezeichung wissenschaftlicher Forschungsmethoden als Experiment ist nicht immer eindeutig.

In der Umgangssprache wird oft das reine Ausprobieren, ein (manchmal planloser) Versuch als Experiment bezeichnet. Der Wahlslogan der CDU unter Adenauer "Keine Experimente!" zeugt davon ebenso, wie die Formulierung "Ich experimentiere gerade mit einer neuen Software". Wegen der Konnotation von planlosem Herumprobieren beim umgangssprachlichen Gebrauch des Begriffes "Experiment" ist es für Wissenschaftler oft schwierig, Laien die große Bedeutung verständlich zu machen, die Experimente in den Natur- und Sozialwissenschaften haben.

Grundprinzip des Experimentes

In der Wissenschaft bezeichnet man als Experiment eine Forschungsanlage, die möglichst eindeutig Auskunft über Strukturen, Zusammenhänge und Funktionen der Wirklichkeit gibt. Man sagt sprichwörtlich: "Das Experiment veranlaßt die Wirklichkeit hervorzutreten."

Eine klassische Form des Experimentes - die vor allem die Psychologie und die Sozialwissenschaften bis heute prägt - ist folgende: Zwei identische Gegenstände (z.B. gleich zusammengesetzte Personengruppen) werden genau gleich behandelt - mit einer Ausnahme: In einem bestimmten Punkt unterscheidet sich die Behandlung der einen Gruppe (Experimentalgruppe) von der der anderen Gruppe (Kontrollgruppe). Diese Behandlung wird experimenteller Faktor (auch: Stimulus) genannt und kann. z.B. im Zeigen eines gewalttätigen Films, im Vorlegen eines FAZ-Artikels oder im Betrachten einer speziellen Internetseite bestehen. Mißt man später (z.B. durch einen Fragebogen oder physiologische Meßverfahren) einen Unterschied zwischen den beiden Gruppen, kann man diesen Unterschied logisch eindeutig auf den experimentellen Faktor zurückführen ("Nachweischarakter" des Experimentes, Petersen 2002: 17).

Grundprinzip des (sozialwissenschaftlichen) Experiments

Experimente in den Naturwissenschaften

Diese Form des Experimentes findet man auch in den Naturwissenschaften. Wenn man in zwei identischen Gewächshäusern die gleiche Sorte Tomaten heranzieht und eines der Gewächshäuser mit Kohlenstoffdioxid begast, kann man den besseren Wuchs der Tomaten im Experimental-Gewächshaus eindeutig auf die erhöhte Kohlendioxid-Konzentration zurückführen. Fügt man zwei Bechergläsern mit Kaliumhexacyanoferrat jeweils Lösungen hinzu, die sich nur dadurch unterscheiden, daß die eine Eisen(III)-Chlorid enthält und die andere nicht, so kann man das ausfallende Berliner Blau eindeutig auf eine Reaktion zwischen dem Kaliumhexacyanoferrat und dem dreiwertigen Eisenchlorid zurückführen.

In der Naturwissenschaft findet man oft jedoch auch Experimente, die nicht mit der oben beschriebenen Logik von Experimental- und Kontrollgruppe arbeiten. Diese Experimente sollen meist klären, ob eine aus einer Theorie abgeleitete Prognose eintritt oder nicht eintritt. Beispielsweise zeigt das Meselson-Stahl-Experiment eindeutig, daß DNA semikonservativ repliziert wird (die DNA-Doppelhelix teilt sich auf und wird um den jeweils fehlenden Strang ergänzt). Die alternative Vermutung, die DNA-Doppelhelix werde komplett kopiert, wurde durch das Experiment zurückgewiesen (ein Experiment, das eindeutig zwischen zwei Theorien entscheidet, nennt man auch experimentum crucis).

Beim Michelson-Morley-Experiment wird die Geschwindigkeit des Lichtes gemessen, das die Erde von einem entfernten Stern erreicht. Und zwar zwei mal: Einmal während sich die Erde bei ihrer Bewegung um die Sonne auf den Stern zubewegt (hier wäre eigentlich eine höhere Lichtgeschwindigkeit zu erwarten, so wie im Gegenwind die relative Windgeschwindigkeit steigt) und einmal während sich die Sonne von dem Stern wegbewegt (also parallel zum Licht der Lichtquelle fliegt - hier wäre ein geringeres Ergebnis der Geschwindigkeitsmessung zu erwarten, wie wenn man mit dem Wind fährt). Bei beiden Messungen ist die Lichtgeschwindigkeit jedoch gleich. Das Experiment hat die Äthertheorie der Lichtausbreitung widerlegt und gilt als Bestätigung ("Corroboration") der Einsteinschen Relativitätstheorie. Die folgende Abbildung beschreibt schematisch den weiteren Forschungsprozeß nach Abschluß eines Experimentes.

Forschungsprozeß im Anschluß an die Schlußfolgerung aus einem Experiment

Quasi-Experiment

Auch in den Sozialwissenschaften gibt es Forschungsanordnungen, die versuchen natürlich vorgefundene Unterschiede zur Unterstützung oder Schwächung von Hypothesen zu nutzen (z.B. wenn einer Gruppe Männer und einer Gruppe Frauen ein Gewalt-Film gezeigt wird um die Hypothese zu testen, daß Männer emotional eher aggressiv darauf reagieren als Frauen). Allerdings nennt man diese Versuchsanordnungen dann Quasi-Experimente (vgl. Huber 2000: 174 ff) – was die Kollegen von der Naturwissenschaft für ihre Experimente sicher nicht gern hören würden.

Definition: Sozialwissenschaftliches Experiment

Jener Typ von Experiment, der in den Sozialwissenschaften meistens verwendet wird (also mit Experimental- und Kontrollgruppen) kann folgendermaßen definiert werden:

Ein Experiment ist eine „wiederholbare Beobachtung unter kontrollierten Bedingungen, wobei eine (oder mehrere) unabhängige Variable(n) derartig manipuliert wird (werden), daß eine Überprüfungsmöglichkeit der zugrundeliegenden Hypothese (Behauptung eines Kausalzusammenhangs) in unterschiedlichen Situationen gegeben ist.“ (Zimmermann 1972: 37)

Für die Auswertung experimentell gewonnener Daten werden t-Tests und Varianzanalysen (SPSS: ANOVA und andere Verfahren) verwendet.

Verschiedene Typen experimenteller Designs

Welche Möglichkeiten gibt es, sozialwissenschaftliche Experimente anzulegen?

Zu einem Experiment gehören mindestens zwei Personengruppen, mindestens ein experimenteller Faktor und mindestens eine Messung pro Personengruppe. Aus diesen Ausgangsbedingungen kann man nun verschiedene Typen von Experimenten bilden.

Zweigruppenexperiment mit Einfachmessung

Das ist die einfachste experimentelle Anordnung. Es werden zwei möglichst ähnliche Personengruppen gebildet, von denen eine, die Experimentalgruppe, ein sog. Treatment mit einem experimentellen Faktor erhält, die andere (Kontrollgruppe) nicht. Im Anschluß an das Treatment führt man eine Messung durch. Meistens werden für die Messung Fragebögen verwendet, Techniken der Umfrageforschung werden als Hilfs-Instrumente für das Experiment eingesetzt. Manchmal (vor allem in der Psychologie) kommen jedoch auch apparative Messungen in Frage, z.B. die technische Messung von Pulsfrequenz, Blutdruck und Hautleitfähigkeit.

Praktisch könnte ein solches Experiment beispielsweise so aussehen, daß die Forscher der Experimentalgruppe einen blutrünstigen Horrorfilm über Monster zeigen und der Kontrollgruppe einen deutschen Heimatfilm aus den 50er Jahren vorführen. Durch das Zeigen eines möglichst neutralen Films in der Kontrollgruppe soll verhindert werden, daß sich die Teilnehmer der Kontrollgruppe während des Experimentes langweilen, was die Ergebnisse verzerren könnte. Im Anschluß an die Vorführungen müssen alle Probanden Fragebögen ausfüllen (z.B. zu ihrer Einstellung zu Monstern), ggf. werden auch Pulsfrequenz, Blutdruck und Hautleitfähigkeit (Angst!) gemessen.

Zur Veranschaulichung kann man ein Buchstabenmodell heranziehen; traditionell bedeuten dabei O := Messung ("Observation") und X := Experimenteller Faktor:

Einfachmessung

Zweigruppenexperimente mit Vorher-Nachher-Messung

Wenn man nur im Anschluß an das Treatment eine Messung durchführt, kann es passieren, daß man beobachtete Veränderungen nur schwer interpretieren kann, weil man nicht weiß, von welchem Ausgangswert sich die Einstellung zu Monstern, der Blutdruck und der Hautwiderstand verändert haben. Vielleicht waren beide Gruppen schon vor den Filmvorführungen negativ gestimmt, weil es regnete, hatten erhöhten Blutdruck, weil der Aufzug zum Labor im fünften Stock nicht funktionierte und schweißnasse Haut (Leitfähigkeit!) wegen sommerlicher Hitze. Um einschätzen zu können, welche Veränderungen sowohl der Heimatfilm, als auch der Monster-Film bei beiden Gruppen hervorgerufen haben, muß man mehrfach messen (Schnell/Hill/Esser 1999: 205):

Zweifachmessung

Die Erhebungen, die vor dem Treatment stattfinden (Vortests) nennt man auch "Pretests"; dieser Begriff kann jedoch für Verwirrung sorgen, weil im Bereich von Umfrageforschung und Inhaltsanalyse damit das Ausprobieren von Fragebögen und Codebüchern vor dem eigentlichen Einsatz gemeint ist.


Solomon-Viergruppen-Experimente

Leider haben auch sorgfältige Messungen Auswirkungen auf die Probanden. Fragen nach Monstern können die Probanden irritieren, Apparative Messungen Angst einflößen. Um Meßeffekte aus den Ergebnissen herausrechnen zu können, wurde der Solomon-Viergruppen-Versuchsplan entwickelt (Schnell/Hill/Esser 1999: 215):

Solomon-4-Design

Bei dieser Anordnung kann man durch Vergleich von Experimentalgruppe 1 (mit Vortest) und Experimentalgruppe 2 (ohne Vortest) sowie Kontrollgruppe 1 und Kontrollgruppe 2 (und anderer Kombinationen von Gruppen untereinander) sowohl den Effekt des Vortests, als auch die Interaktion des Vortests mit dem experimentellen Faktor und die Auswirkungen dieses Faktors selbst berechnen. Für diese Berechnungen wird ein mathematisches Verfahren namens Multivarianzanalyse verwendet, das in seiner Logik eigentlich recht einfach ist, dessen praktische Umsetzung der Forscher jedoch gern einem Statistikprogramm überläßt.

Mehrfaktorielle Designs

Manchmal interessieren sich Wissenschaftler dafür, wie mehrere verschiedene experimentelle Faktoren sowohl einzeln als auch gemeinsam auf die Menschen wirken. Wenn mehrere experimentelle Faktoren untersucht werden, spricht man von mehrfaktoriellen Designs. Man braucht dann für jede Ausprägung jeder unabhängigen Variable eine eigene Versuchsgruppe (von speziellen Vereinfachungsmöglichkeiten einmal abgesehen). Ein Experiment mit drei unabhängigen Variablen, von denen die erste und die zweite zwei Ausprägungen haben und die dritte drei, wäre ein 2 x 2 x 3 -Design. Für ein vollständiges Experiment zu einem solchen Design würde man zwölf Experimental- und Kontrollgruppen benötigen.

Bei zwei- bis dreifaktoriellen Designs kann man die benötigten Gruppen und die Kombinationen der Ausprägungen der unabhängigen Variablen übersichtlich in einer Matrix darstellen (Matrixdarstellung mehrfaktorieller Experimente). Die untenstehende Abbildung verdeutlicht das Prinzip anhand eines 2 x 2 -Designs.

Matrixdarstellung

Einige bekannte Beispiele für Experimente in der Kommunikationswissenschaft

Yale Studies

Die bekannten Yale-Studies von Carl I. Hovland und seinen Kollegen aus den 1940er bis 1960er Jahren bedienten sich hauptsächlich des Laborexperimentes. Sie wollten wissen, wie sich eine ganze Palette von Kommunikationsstimuli auf Meinungen und Einstellungen der Rezipienten auswirkt. Das Prinzip ihrer Studien beruhte darauf, daß mindestens eine Experimentalgruppe einem bestimmten Kommunikationsinhalt ausgesetzt wurde, mindestens eine Kontrollgruppe nicht.

Die Yale-Forscher untersuchten die Wirkung der Merkmale von Inhalt (z.B. Reihenfolge von Argumenten) Kommunikator (z.B. Glaubwürdigkeit, Sleeper-Effekt), Medium, und Rezipienten auf die Rezeption von Inhalten.

Ein bekanntes Experiment von Carl I. Hovland und Walter Weiss beschäftigt sich mit der Wirkung der Kommunikatorglaubwürdigkeit auf die Akzeptanz von Informationen durch die Rezipienten (Hovland/Weiss1951). Dabei legten die Forscher besonderes Augenmerk auf den Faktor Zeit.

Das Experiment wurde mit folgendem Design durchgeführt: Zu vier Themen (Antihistaminika, Atom-U-Boote, Stahlknappheit und die Zukunft des Kinos) wurde jeweils eine Argumentation von einem glaubwürdigen Kommunikator und einem unglaubwürdigen Kommunikator vorgetragen (eigentlich: geschrieben, es handelte sich um ein schriftliches Experiment). Beispielsweise wurden als Kommunikatoren für das Thema 'Atom-U-Boote' Robert J. Oppenheimer (glaubwürdig) und die Prawda (unglaubwürdig) angegeben. Zusätzlich wurde noch der Inhalt der Argumentationen variiert: Eine Version war 'affirmative' für den jeweiligen Gegenstand formuliert, die andere 'negative'. Jedem Probanden wurden die Beiträge zu den vier Themen in einer festen Reihenfolge in einem Heftchen vorgelegt, vorgetragen jeweils von zwei vertrauenswürdigen und zwei nicht vertrauenswürdigen Quellen. 24 Heftchen deckten alle möglichen Kombinationen der vier Themen, der Versionen und der Kommunikatoren ab.

Fünf Tage vor dem Experiment mußten die Probanden einen Vor-Fragebogen ausfüllen. Direkt nach dem Experiment einen zweiten Fragebogen und einen dritten vier Wochen nach dem Experiment. Die Fragebogen erfaßten Informationen und Meinungen zu den Themen, den Argumentationen und den Kommunikatoren. 223 Teilnehmer einer Geschichts-Lehrveranstaltung nahmen an dem Experiment teil, allerdings nicht alle bei allen Erhebungen.

Die Messungs-Übersicht für dieses Experiment sieht folglich so aus:

O - 5d - XO - 28d - O

Als Gesamtergebnis wurde festgestellt, daß die Glaubwürdigkeit der glaubwürdigen Quelle mit dem Abstand vom Lesen des Heftchens abnimmt und die Glaubwürdigkeit der unglaubwürdigen Quelle entsprechend zunimmt. D.h., die abschreckende Wirkung der Prawda als Quelle ist nach vier Wochen ebenso verblaßt, wie der Vertrauensbonus von Robert Oppenheimer.

Fallbeispiele

Hans-Bernd Brosius und Gregor Daschmann untersuchten ausführlich die Wirkung von Fallbeispielen auf die Wahrnehmung des Meinungsklimas sowie Meinungen und Einstellungen. Daschmann (2000) ging speziell der Frage nach, wie Zahlen und Statistiken auf die Wahrnehmung des Meinungsklimas ('Was denken die meisten?') wirken, verglichen mit der Wirkung von Fallbeispielen ('Peter H. aus M.: Ich finde...').

Er führte ein Experiment mit Studenten durch, bei dem die Probanden einen Zeitungsartikel über eine bevorstehende Wahl zu lesen bekamen. Der einen Hälfte der Probanden wurden Fallbeispiele präsentiert, der anderen angebliche Umfrageergebnisse. In beiden Hälften wurde der Inhalt dreifach variiert: Für die Regierung, gegen die Regierung und 'No Information', als Kontrollgruppe. So ergibt sich ein 3 x 3 Design mit 9 Gruppen.

Als Stimulusmaterial wurden Zeitungsartikel im Design und Layout der Mainzer AZ zum Thema Koalitionsaussage der FDP vorbereitet und zusammen mit Fragebögen am 05. Februar 1996 in den Cafeterien der Universität Mainz in einem Doppelblind-Versuch verteilt. 'Doppelblind' bedeutet, daß die Leute, die die Fragebögen zum Ausfüllen verteilt und auch wieder eingesammelt haben ('Assistenten des Versuchsleiters'), nicht wußten, was Gregor Daschmann eigentlich erforschen wollte.

Als Ergebnis zeigten sich sowohl Effekte der Fallbeispiele auf die Meinungsklimawahrnemung, als auch der Umfrageinformationen. Beispielsweise glaubten 6 Prozent derer, die die Fallbeispielversion *gegen* die Regierung gelesen hatten, die Regierung werde bei der Wahl gewinnen; bei der Fallbeispielversion *für* die Regierung glaubten das 29 Prozent. Bei den Umfragedaten zeigt sich der Effekt auch, aber schwächer. Insgesamt haben (das läßt sich bei denjenigen Experimentalgruppen ablesen, die widersprüchliche Informationen aus Fallbeispielen und Umfragedaten bekamen) Fallbeispiele einen viel stärkeren Effekt auf die Wahrnehmung des Meinungsklimas, als die Präsentation von Umfragedaten in der Presse.

Feldexperimente in der Umfrageforschung

Die meisten sozialwissenschaftlichen Experimente sind Laborexperimente, d.h. sie finden meist in geschlossenen Räumen mit möglichst wenig Störbedingungen und mit relativ wenigen, nicht repräsentativen Personen statt. Die geringe Zahl von Probanden und die Tatsache, daß sie meist nicht repräsentativ ausgewählt sind, ist für experimentelle Zwecke nicht weiter störend. Es geht ja nicht darum, wie bei der Umfrageforschung mit 1000 oder 2000 Befragten Rückschlüsse auf die ganze Bevölkerung zu ziehen. Meist geht es nur darum, Gruppen von 20-40 Personen zu bilden, die sich möglichst nicht schon vor dem Experiment deutlich unterscheiden. Wenn sie sich nach dem Experiment unterscheiden, ist die Wirksamkeit des experimentellen Faktors erwiesen, jedenfalls dann, wenn man sonst nichts falsch gemacht hat (interne Validität). Ob das Ergebnis nur für Teilnehmer eines Geschichts-Kurses oder Studenten in Mainzer Cafeterien gilt, ist eine andere Frage (externe Validität).

Bei Feldexperimenten, werden die Probanden in ihrem natürlichen Umfeld belassen. Es ist also nicht möglich, die Bedingungen so zu kontrollieren, wie in einem weiß gestrichenen, schalldichten Labor. Trotzdem können Gruppen gebildet werden, die sich nicht überzufällig unterscheiden, indem man z.B. die 2000er-Stichprobe einer Umfrage zufällig in 2 oder vier Teile Teilt, die ihrerseits wieder gültige Stichproben aus der ersten Stichprobe *und* der Grundgesamtheit sind. Diesen stellt man dann leicht unterschiedliche Fragen oder zeigt der einen Gruppe vor der Befragung ein Produkt, der anderen nicht, oder, oder, oder... (Petersen 2002).

Mit Hilfe von Feldexperimenten kann man z.B. die Auswirkungen unterschiedlicher Frageformulierungen überprüfen. „Glauben Sie an die große Liebe?“ wurde die eine Hälfte der Befragten in einer repräsentativen Umfrage gefragt. „Ja“ sagten 52 Prozent der Befragten. „Glauben Sie eigentlich an die große Liebe?“ war die Frageformulierung in der anderen Hälfte der Interviews. Hier sagen 57 Prozent „Ja“. Wie das Beispiel zeigt, kann ein einziges Wort die Ergebnisse erheblich beeinflussen; je nach Art und Thema der Frage führen Veränderungen an der Formulierung zu noch weit drastischeren Sprüngen in den Antworten der Befragten. Dabei kann nicht nur das Hinzufügen oder Weglassen einzelner Wörter gravierende Konsequenzen haben. Ganz wichtig für die Ergebnisse ist beispielsweise, ob eine Frage positiv oder negativ formuliert ist: „Glauben Sie, daß man den meisten Menschen vertrauen kann?“. „Ja, man kann vertrauen“ meinen 36 Prozent. „Glauben Sie, daß man den meisten Menschen mißtrauen muß?“ „Man muß nicht mißtrauen“ (das logische äquivalent zu „Ja, man kann vertrauen“) sagen jetzt plötzlich 55 Prozent. Je nach Frageformulierung erscheint das deutsche Volk in einem Fall erheblich weniger vertrauenswürdig als im anderen. (Noelle-Neumann/Petersen 1996; Roessing 2004).

Störvariablen und Randbedingungen

Störvariablen

Die Logik des Experimentes beruht darauf, daß sich die Experimentalgruppen nur im experimentellen Faktor unterscheiden. Deshalb ist es wichtig dafür zu sorgen, daß andere Unterschiede ausgeschaltet oder kontrolliert werden und daß der experimentelle Faktor "ungestört" wirken kann, also in seiner Wirkung nicht verzerrt wird.

Verzerrung der Experimentalgruppen

Eine gleiche Zusammensetzung von Experimental- und Kontrollgruppen wird normalerweise dadurch erreicht, daß die Gruppen randomisiert oder parallelisiert werden. Bei einer Randomisierung erfolgt die Verteilung der Versuchspersonen auf die Gruppen zufällig (vgl. Huber 2000: 95 f). So sollen überzufällige Unterschiede zwischen den Gruppen verhindert werden. Allerdings kann es angesichts der geringen Größe von Experimentalgruppen von 20 bis 40 Personen leicht passieren, daß "zufällig" doch in der einen Gruppe mehr Männer als Frauen, mehr Dicke als Dünne oder mehr Gebildete als Ungebildete sind. Beim Parallelisieren kann das nicht passieren. Dabei werden sogenannte "statistische Zwillinge" auf die Gruppen verteilt: Für jeden gebildeten, dünnen Mann in der Experimentalgruppe schickt man einen gebildeten dünnen Mann in die Kontrollgruppe - und setzt dieses Verfahren für alle relevanten Merkmale und alle Experimentalgruppen fort. Auf diese Weise unterscheiden sich die Gruppen nicht in der Zusammensetzung hinsichtlich der Merkmale, die für das Parallelisieren (auch als Matching bzw. Matched-Pairs-Methode bezeichnet) verwendet wurden (vgl. Huber 2000: 93 ff).

Zeiteinflüsse

Zeiteinflüsse spielen eine Rolle, wenn zwischen zwei Beobachtungen im Experiment (Messungen) viel Zeit vergeht, oder wenn ein Experiment insgesamt lange dauert. Die Versuchspersonen lernen dann vielleicht dazu oder stumpfen ab, ihre Aufmerksamkeit für den Gegenstand des Experiments verstärkt sich oder sie werden einfach älter. Bei sehr langwierigen experimentellen Designs ermüden sie vielleicht oder werden unaufmerksam (vgl. Schnell/Hill/Esser 1999: 207 f).

Versuchsleitereffekte

Die Erwartungen, die der Forscher als Versuchsleiter an ein Experiment hat, können sich auf den Verlauf des Experiments und seine Ergebnisse auswirken. Auch wenn der Versuchsleiter sich einer Erwartung oder der aus ihr resultierenden Einflüsse nicht bewußt ist, können solche Effekte auftreten (vgl. Huber 2000: 162 ff.). Man kann versuchen Versuchsleitereffekte zu minimieren, indem man

  • den Versuchsleiter möglichst wenig an den eigentlichen Erhebungen beteiligt
  • anstelle des Versuchsleiters Assistenten des Versuchsleiters einsetzt, die über den Zweck des Experimentes und die Verteilung der Versuchspersonen auf die Experimentalgruppen nicht bescheid wissen (Doppelblindversuch).
  • den Versuchsleiter schult, bzw. ihn nur unter sehr kontrollierten Bedingungen tätig werden läßt.

Versuchspersonen-Effekte Auch Einstellungen und Verhaltensweisen von Versuchspersonen können zu Störungen führen, wenn solche Abweichungen im Experiment nicht erwünscht sind (vgl. Huber 2000: 169 ff). Beispielsweise kann sich die Erwartung, wie ein experimenteller Stimulus möglicherweise wirkt, in der tatsächlichen Wirkung niederschlagen. Anweisungen und Hinweise des Versuchsleiters oder seiner Assistenten können unerwünschte Wirkungen zeitigen. Wie in der Umfrageforschung auch, kann soziale Erwünschtheit beim Beantworten von Fragen nicht wahrheitsgemäße Antworten zur Folge haben. Auch die Frage, ob ein Proband wegen eines möglichen Incentives (Belohnung) teilnimmt oder weil es einen "Schein" (Leistungsnachweis) dafür gibt (in psychologischen Studiengängen ist das häufig so geregelt), oder weil er der Wissenschaft helfen will oder weil er den Versuchsleiter gut kennt, kann zum Problem für die Gültigkeit der Ergebnisse werden.

Randbedingungen

Die Bedingungen, unter denen ein Experiment durchgeführt wird, sollten möglichst wenig Störpotential haben, also mit dem experimentellen Stimulus möglichst wenig interagieren. Möglichen Störungen wird in der Regel begegnet, indem die Störquelle eliminiert oder konstantgehalten wird (vgl. Schnell/Hill/Esser 1999: 211 f; Huber 2000: 97).

Eliminieren von Störungen

Bekannte Störquellen, die möglicherweise mit dem experimentellen Faktor interagieren, sollten nach Möglichkeit ausgeschaltet werden. Das wäre z.B. bei Lärm der Fall, der ein Experiment zur Konzentrationsfähigkeit stört. Auch störender Lichteinfall bei der Betrachtung von Filmmaterial oder ablenkende Einrichtungsgegenstände (laut tickende Uhren z.B.) bei Wahrnehmungsexperimenten lassen sich relativ leicht ausschalten. Der Vorteil von Laborexperimenten liegt gerade in der relativ weitgehenden Möglichkeit, die Bedingungen zu kontrollieren.

Konstanthalten von Störungen

Störvariablen, die sich nicht eliminieren lassen (z.B. durch die Messung oder den experimentellen Faktor selbst verursachte Störungen oder solche, die in der Versuchssituation selbst begründet sind) müssen für alle Experimental- und Kontrollgruppen konstant gehalten werden. Neben den oben genannten Möglichkeiten der Randomisierung oder des Matchings bei der Bildung der Versuchsgruppen kommt hierfür wieder die Kontrolle der Umgebungsbedingungen im Labor in Frage. Dort lassen sich z.B. die Lichtbedingungen beim Vorführen eines Films für alle Versuchsgruppen gleich einstellen. Beim Feldexperiment, bei dem die Versuchspersonen in ihrer natürlichen Umgebung belassen werden, kommt andererseits die Tatsache zum Tragen, daß sich die Randbedingungseffekte bei der Vielzahl der Probanden gegenseitig aufheben (vgl. Petersen 2002).

Ceteris Paribus

Eliminieren und Konstanthalten von Störvariablen täuscht manchmal darüber hinweg, daß auch ein perfekt geplantes Experiment immer noch unter bestimmten Bedingungen stattfindet. Diese Bedingungen werden jedoch im Ergebnis nicht mehr sichtbar, weil sie für Experimental- und Kontrollgruppe gleichermaßen wirksam sind. Ein Experiment findet z.B. in der Regel im Sommer oder im Winter, während der Vorlesungszeit oder während der Semesterferien, während eines Wahlkampfs oder in der Vorweihnachtszeit, in einem weiß gestrichenen Labor oder in einem dunklen Raum statt. Alle diese Randbedingunen können natürlich mit dem experimentellen Faktor interagieren und sollten dokumentiert und bei der Interpretation berücksichtigt werden. Strenggenommen gelten die Ergebnisse von Experimenten nur unter der Annahme, daß alle Randbedingungen ("ceteris paribus") gleich bleiben (vgl. Roessing/Esser 2004).

Literatur zum Text

  • Daschmann, Gregor (2000): Vox Pop & Polls: The Impact of Poll Results and Voter Statements in the Media on the Perception of a Climate of Opinion. In: IJPOR 12, S. 160-181.
  • Hovland, Carl I. / Weiss, Walter (1951): The Influence of Source Credibility on Communication Effectiveness. In: Public Opinion Quarterly 15, S. 635-350.
  • Huber, Oswald (2000): Das psychologische Experiment. Bern u.a.
  • Noelle-Neumann, Elisabeth / Petersen, Thomas (1996): Alle, nicht jeder. München.
  • Petersen, Thomas (2002): Das Feldexperiment in der Umfrageforschung. Frankfurt.
  • Roessing, Thomas (2004): Berichten über Umfragen. In: Deutscher Fachjournalisten-Verband (Hrsg.): Fachjournalismus. Expertenwissen pofessionell vermitteln. Konstanz. S. 119-128.
  • Roessing, Thomas/Esser, Frank (2004): Auswirkung von Rand- und Nebenbedingungen auf Messungen und Kausalitätsannahmen im Experiment. In: Werner Wirth / Edmund Lauf / Andreas Fahr (Hrsg.): Forschungslogik und -design in der Kommunikationswissenschaft. Bd. 1. Köln. S. 115-127.
  • Schnell, Rainer/Hill, Paul B./Esser, Elke (1999): Methoden der empirischen Sozialforschung. München, Wien.
  • Zimmermann, Ekkart (1972): Das Experiment in den Sozialwissenschaften. Stuttgart.
Persönliche Werkzeuge