Вы находитесь на странице: 1из 28

Do pracy zbiorowej pod redakcj Jerzego Brzeziskiego (2002)

W druku

Systematycznie Modyfikowane Autoreplikacje:

logika programu bada empirycznych w psychologii

Bogdan Wojciszke
Szkoa Wysza Psychologii Spoecznej
Warszawa

Dedykuj ten tekst moim doktorantom,


a take doktorantom moich koleanek i kolegw.
2

Bogdan Wojciszke
Warsaw School of Social Psychology

Systematically Modified Self-Replications:


A strategy for programmatic research in psychology

A strategy of Systematicaly Modified Self-Replications (SMSR) is identified as a basic


way of planning and performing programmatic empirical research in contemporary
psychology. The SMSR strategy consists of replication studies on the same effect
performed by the same team of researchers, with a systematic modification and
diversification of the studied samples, variables and methods of their measurements.
The SMSR strategy is based on the recognition of an inescapable unreliability of a
single empirical study and a probabilistic nature of relationships among psychological
variables. The strategy enables researchers to achieve at least the following goals:
(1) showing reliability of a basic relationship of interest, (2) checking efficiency of
manipulations and construct validity of measures employed, (3) increasing internal
validity, (4) increasing external validity, (5) elimination of alternative explanations, (6)
identification of moderators of the basic relationship, and (7) identification of
mediators of the basic relationship. The chapter describes how the SMSR strategy
helps to achieve these goals both in general terms and in terms of examples drawn
from two research programs. It is concluded that SMSR is necessary to obtain
reliable and valid data (and to get published the data in a leading journal).
3

Psychologia jest jak wiadomo nauk empiryczn, a podstawowy rodzaj publikacji w tego rodzaju
nauce to doniesienie z wasnych oryginalnych bada autora. Naukowcy z prawdziwego zdarzenia
ledz te publikacje na bieco (ci ze zdarzenia mniej prawdziwego poprzestaj na ich omwieniu z
drugiej rki w monografiach, lub, co gorsza, podrcznikach), rzadko jednak zdarza si by zajrzeli do
rocznikw publikowanych wczeniej ni w cigu ostatnich 10-20 lat. Uprawianie nauki empirycznej,
niczym ycie motyla, rozgrywa si w czasie teraniejszym i jak si wyrazi Robert Sternberg
Nobody cites dead psychologists. Jednak zajrzenie do starszych rocznikw takich czoowych
czasopism psychologicznych, jak Journal of Personality and Social Psychology (JPSP) moe by
cakiem pouczajce, choby przez porwnanie ich zawartoci z tym, co publikowane jest
wspczenie. Jedn z uderzajcych zmian widocznych w ostatnich kilku dekadach jest wzrost liczby
oddzielnych bada skadajcych si na pojedyncze doniesienie empiryczne (obok wzrostu liczby
badanych osb i uytych metod pomiarowych). Np. w roku 1965 tylko 10% doniesie opublikowanych
w JPSP zawierao wicej ni jedno badanie, w roku 1975 byo to 20%, za w roku 1995 ju 48%.
Tak wic o ile w latach szedziesitych znaczna wikszo prac empirycznych z zakresu psychologii
spoecznej i osobowoci poprzestawaa na doniesieniu z jednego tylko badania, w latach
dziewidziesitych ju niemale poowa artykuw zawieraa doniesienia z dwch lub wicej bada
(dotyczy to w szczeglnoci psychologii spoecznej).
Przed kilkudziesiciu laty jedno badanie wystarczao do przekonania spoecznoci naukowej o
istnieniu jakiej prawidowoci, wspczenie potrzeba do tego dwukrotnie wicej bada, a wic caego
programu badawczego. Jednokrotne uzyskanie jakiego wyniku nie wystarcza ju do uznania go za
wiarygodny, co jest konsekwencj rozprzestrzenienia si wrd badaczy wiedzy o uomnoci
pojedynczego badania empirycznego, a take wiedzy o charakterze prawidowoci rzdzcych ludzk
psychik. Wiarygodny jest wynik powtrzony kilkakrotnie, w ramach programu badawczego
skonstruowanego na zasadzie systematycznie modyfikowanych autoreplikacji, ktra to zasada coraz
wyraniej staje si regu obowizujc wspczesnego psychologa-empiryka.
Systematycznie Modyfikowane Auto-Replikacje (SMAR) to strategia polegajca na
wielokrotnym powtarzaniu przez ten sam zesp autorw badania wykazujcego jak prawidowo
przy celowym wprowadzaniu modyfikacji prby, metod pomiaru i zmiennych stanowicych przedmiot
badania. SMAR suy co najmniej siedmiu celom: (1) wykazaniu rzetelnoci (powtarzalnoci)
podstawowego efektu, (2) sprawdzeniu skutecznoci manipulacji i teoretycznej trafnoci
zastosowanych miar, (3) maksymalizacji trafnoci wewntrznej, (4) maksymalizacji trafnoci
zewntrznej i teoretycznej, (5) eliminacji alternatywnych wyjanie, (6) poszukiwaniu moderatorw
efektu oraz (7) poszukiwaniu mediatorw efektu. Osignicie wartociowych poznawczo wynikw
empirycznych jest niemoliwe bez realizacji wikszoci tych celw, za w tym rozdziale pragn
przekona czytelnika do tezy, i realizacja wikszoci owych celw jest niemoliwa bez powtarzania
wasnych bada. Omwi strategi SMAR zarwno w kategoriach oglnych, jak i odwoujc si do
przykadw zaczerpnitych z dwch do rnych programw badawczych, z ktrych jeden dotyczy
hutawki emocjonalnej jako techniki wpywu spoecznego (a zrealizowany zosta przez Dariusza
Doliskiego i wsppracownikw), drugi za dotyczy dominacji kategorii moralnych w formuowaniu
ocen innego czowieka (zrealizowany przeze mnie wraz ze wsppracownikami).

1. Rzetelno podstawowego efektu


Znakomity fizyk francuski Rene Blondlot (1849-1930) ogosi odkrycie promieni N
wkrtce po tym, jak Roentgen odkry promieniowanie X. Promienie N miay by
emitowane przez niemale wszystkie substancje, cho zaobserwowa je mona byo
tylko w bardzo szczeglnych warunkach (w ciemnociach i po refrakcji przez pryzmat
aluminiowy). W wielu innych laboratoriach francuskich potwierdzono wystpowanie
promieniowania N. Jednake promieniowanie to miay cechowa pewne niezwyke
wasnoci fizyczne, a w dodatku nie udao si go zaobserwowa w adnym z
laboratoriw angielskich i niemieckich. Skonio to pismo Nature do wysania
amerykaskiego fizyka Roberta W. Wooda do laboratorium Blondlota w Nancy (na
cze ktrego to miasta promienie otrzymay swoj nazw). Wood podejrzewa, e
cae promieniowanie N jest po prostu zudzeniem jego odkrywcw. Aby to sprawdzi,
wzi udzia w demonstracji promieniowania wykonanej przez jednego z asystentw
Blondlota i podczas jej trwania (w ciemnociach) niepostrzeenie usun aluminiowy
pryzmat zaamujcy promieniowanie i czynicy je widzialnym. Nie przeszkodzio to
4

Blondlotowi i wsppracownikiem nadal dostrzega ledwo widzialnego


promieniowania. Dopiero po zapaleniu wiata prawda wysza na jaw (podobno
zreszt prawda ta przyprawia Blondlota o chorob umysow, jak twierdzi Gardner,
1957).
Zapominana i przypominana na nowo historia niefortunnych promieni N
ilustruje, jak
wan rol odgrywaj replikacje wynikw bada, szczeglne replikacje nieskorelowane
wykonywane przez niezwizanych ze sob badaczy. Dotyczy to nawet tak twardej nauki, jak fizyka a
c dopiero powiedzie o tak mikkiej nauce, jak jest psychologia. Przesad byoby twierdzi, e ta
ostatnia roi si od niezreplikowanych efektw, jednak mona je napotka bez trudu. Np. i w myleniu
potocznym, i w wielu podrcznikach psychologii utrzymuje si przekonanie, e dzieci o rnej
kolejnoci urodzenia systematycznie rni si osobowoci (np. starsze s bardziej konformistyczne,
zalene i konserwatywne, za modsze bardziej niezalene, buntownicze, oryginalne i liberalne w
pogldach). Tego rodzaju wyniki bada okazay si jednak niereplikowalne (Ernst i Angst, 1983;
Harris, 2000; Schooler, 1972), a w duym stopniu dotyczy to take wikszoci oddziaywa
wychowawczych podejmowanych przez rodzicw (Harris, 1995, 2000). Nie udao si te zreplikowa
wpywu powikszonych renic na wzrost atrakcyjnoci fizycznej (Hensley, 1991), skutecznoci
podwiadomych (podprogowych) oddziaywa propagandowych i marketingowych na zachowanie
(Pratkanis, Eskenazi i Greenwald, 1994), czy sporej liczby bardziej szczegowych prawidowoci
psychologicznych - np. postulowanego przez Aronsona wzrostu atrakcyjnoci osoby doskonaej pod
prawie kadym wzgldem wskutek umiarkowanie negatywnej informacji na jej temat (co miaoby z tej
osoby czyni fajnego chopa, takiego jak ja por. Fishbein i Ajzen, 1975).
Nie ulega wtpliwoci, e sceptycyzm w stosunku do jednorazowo uzyskanych zalenoci
empirycznych jest wicej ni uzasadniony. Nawet gdy nie mamy do czynienia z mistyfikacj czy
samookamywaniem, nierzadko okazuje si, e jednorazowe zalenoci po prostu nie istniej.
Prawidowoci psychologiczne maj charakter jedynie probabilistyczny - nie ma pewnoci ich
pojawienia si, lecz jedynie jaka na to szansa. Np. cho to prawda, e im bardziej kto jest do nas
podobny, tym bardziej go lubimy, rwnie prawdziwy jest fakt, e nie w przypadku kadej znanej nam
osoby tak si dzieje. Po pierwsze dlatego, e kada prawidowo obowizuje jedynie w pewnych
granicach - np. zwizek lubienia z podobiestwem zaamuje si przy bardzo duym nateniu
podobiestwa (pewna Zosia ma pogldy tak bardzo podobne do naszych, e po prostu nas nudzi) i
nie dotyczy partnerw nalecych do jakiej nieporwnywalnej kategorii (np. pacjentw
psychiatrycznych). Po drugie dlatego, e ludzkie funkcjonowanie jest podporzdkowane wielu
prawidowociom rwnoczenie i zwykle trudno orzec z gry, ktra z nich okae si waniejsza np.
lubienie zaley od podobiestwa partnera, ale jeszcze silniej zaley od tego, jak partner nas traktuje
(Zosia wielokrotnie prbowaa nam zaszkodzi i le o nas si wyraaa, wobec czego jej nie lubimy
pomimo podobiestwa).
Empirycznemu badaniu poddajemy zawsze jakie konkretne osoby, w konkretnych
warunkach, a specyfika tych osb i warunkw moe zamci obraz oglnych prawidowoci. Nawet
oczywista zaleno midzy podobiestwem a lubieniem moe zupenie zanikn, jeeli w badanej
przez nas prbie znajdzie si wiele skconych osb, np. dlatego e pochodz z klasy szkolnej, w
ktrej pojawio si kilka skonfliktowanych grup. Pojedyncze badanie jest wic zawodn podstaw
wnioskowania o prawidowociach oglnych take z powodu bdu prby. Wyniki mierzone w kadej
prbie rni si od wynikw prawdziwych i nie ma nic dziwnego w zdarzeniu polegajcym na
rwnoczesnym odbieganiu wynikw jednej prby in minus, a drugiej in plus od wyniku prawdziwego,
co doskonale wystarcza do uzyskania jednorazowego wiadectwa rzekomej rnicy midzy tymi
dwoma prbami (ktrej to rnicy nie udaje si wykaza w innych badaniach).
Kade badanie jest te obcione jakimi bdami wynikajcymi z zastosowanych metod czy
doboru jego uczestnikw. Poniewa rne badania s obcione rnymi bdami, dopiero
wielokrotne powtrzenie studiw nad t sam prawidowoci przy uyciu rnych metod pozwala
prawidowoci przedrze si przez zakcenia, jakimi obarczone s poszczeglne badania
(eliminacja bdu losowego). Szczeglnie cenne s przy tym replikacje dokonane przez badaczy
innych ni autor pierwszego badania ujawniajcego jak prawidowo, co dobrze ilustruje historia z
promieniami N. Ci pierwsi s bowiem mniej przywizani do (nie swojej) hipotezy i nie powtarzaj w
mniej lub bardziej niewiadomy sposb bdw metody, ktre bywaj odpowiedzialne za
wykazywanie nieistniejcych prawidowoci. Tym bardziej dotkliwa jest dla psychologii niech do
wykonywania bada replikacyjnych (cho trudno obiektywnie oszacowa natenie tej niechci), a w
kadym razie brak publikacji tego rodzaju bada w czoowych pismach psychologicznych. To ostatnie
mona ju oceni atwo nie sposb w czoowym pimie znale replikacj, za ankieta
5

przeprowadzona wrd redaktorw czasopism psychologicznych wykazaa, e w znacznej wikszoci


replikacji ani nie ceni, ani nie zamierzaj drukowa (Neuliep i Crandall, 1991). Redaktorzy nie rni
si od innych badaczy, spord ktrych oczywicie si rekrutuj (John Garcia, odkrywca roli
odgrywanej w procesach warunkowania przez biologiczne przygotowanie organizmu, wyrazi to
sowami: Editors are just like other people, only more so). Badacze po prostu nie wysyaj doniesie o
replikacji do cenionych periodykw w przekonaniu, e i tak nie zostayby opublikowane.
Dodatkowy problem to kwestia, jaki wynik replikacji czyni j udan. Psychologowie nagminnie
przyjmuj za kryterium udanej replikacji istotno statystyczn zwizku - udane replikacje to takie,
ktre przynosz zalenoci istotne statystycznie (podobnie jak badanie oryginalne), za replikacje
nieudane, to takie, w ktrych dany zwizek nie okazuje si istotny. Jest to zapewne jeszcze jeden
przejaw znanego skdind, bawochwalczego stosunku psychologw do istotnoci statystycznej
mniej lub bardziej uwiadamianego przekonania, e jeeli co jest istotne statystycznie, to tym samym
staje si istotne merytorycznie. W rzeczywistoci kryterium to jest cakowicie bdne, co mona
zilustrowa hipotetycznym przykadem dwch badaczy pracujcych nad t sam zalenoci
(przykad przytaczam po spolszczeniu za Rosenthalem, 1991a). Jak wida w tabeli 1, Kowalski
uzyska istotn rnic midzy grup eksperymentaln i kontroln, Nowak za rnic nieistotn
statystycznie. Zwykle jest to podstaw do twierdzenia, e Nowakowi nie udao si zreplikowa
wynikw Kowalskiego. Dobrze jednak wiadomo, e poziom statystycznej istotnoci rnicy zaley nie
tylko od jej wielkoci, ale i od liczebnoci prby (oraz wielkoci wariancji wynikw), za nasz
przykadowy Nowak posugiwa si czterokrotnie mniejsz prb ni Kowalski. Std te miernikiem
podobiestwa wynikw bada Kowalskiego i Nowaka powinien by nie poziom istotnoci, ale raczej
jaki wskanik siy efektu, taki jak statystyka d Cohena (rnica midzy rednimi podzielona przez
wsplne odchylenie standardowe obu grup) albo wspczynnik korelacji r Pearsona. Z tego punktu
widzenia wyniki uzyskane przez Nowaka i Kowalskiego s identyczne w jednym i drugim przypadku
d wynioso 0,50, co oznacza zaleno umiarkowan. Co wicej, ostatnia kolumna tabeli 1 pokazuje,
e oba badania potraktowane cznie, rwnie silnie przemawiaj za istnieniem zalenoci, jak samo
pierwsze badanie Kowalskiego. Nawet rnica poziomw istotnoci midzy nimi okazuje si
nieistotna:
zrnicy = (zKowalski zNowak)/2 = (2,17 1,03)/2 = 0,81; p = 0,42.
----- tutaj tabela 1 ----
Tak wic przy decyzji, czy replikacja jest udana czy te nie, naley stosowa kryteria
ilociowe, a najlepiej uwzgldniajce wskaniki siy efektu, nie za na oko i bdnie stosowane
wskaniki istotnoci statystycznej. Nawet przyjcie adekwatnych kryteriw udanej replikacji, nie
rozwizuje jednak problemu jej wartoci poznawczej. A problem jest dosy oczywisty jeeli
replikacja si powiedzie, badanie nie wnosi nic oryginalnego do istniejcej ju wiedzy. Jeeli za
replikacja si nie uda, nie wiadomo, co to znaczy czy jest to wiadectwem braku umiejtnoci
drugiego autora, skutkiem modyfikacji metody (ta przecie si rzeczy musi si mniej lub bardziej
rni od oryginau), wyrazem zmian historycznych (co moe dotyczy wielu zagadnie psychologii
wychowawczej, rozwojowej i spoecznej), czy te wreszcie wyrazem nieistnienia oryginalnej
zalenoci.
Publikowanie replikacji zarwno udanych, jak i nieudanych zdaje si wic mie niewiele
sensu. Jednake brak publikacji tego rodzaju jest jeszcze mniej sensowny, poniewa prowadzi do
znieksztaconego obrazu wiata, szczeglnie w poczeniu z inn dobrze znan tendencyjnoci
psychologii polegajc na niechci do publikowania bada, ktrych wyniki okazay si nieistotne w
sensie statystycznym (por. Brzeziski, 1996). Statystyczna istotno (na poziomie p<0,05) jest jednym
z najsilniejszych predyktorw kwalifikowania artykuu do druku przez recenzentw i redaktorw. W
konsekwencji, psychologia jako dziedzina wiedzy staje si podatna na bd I rodzaju wiksza jest
szansa, e ujrz wiato dzienne dane przemawiajce za jak nieistniejc prawidowoci, ni dane
sugerujce pominicie prawidowoci faktycznie istniejcych. Jest to o tyle paradoksalne, i
obowizujce we wspczesnej psychologii reguy wnioskowania statystycznego jednoznacznie ka
unika wanie tego bdu na poziomie pojedynczego badania. Niebezpieczestwo jest tym wiksze,
e w psychologii nastpuje dosy szybki wzrost przynajmniej niektrych standardw
metodologicznych, co sprawia, e wiele wczeniejszych w czasie bada oryginalnych jest
nieporwnanie gorszych od pniejszych bada replikacyjnych, cho te ostatnie maj znacznie
mniejsz szans publikacji. Dobr ilustracj s tu dzieje bada nad wpywem rozszerzenia renic na
wzrost atrakcyjnoci fizycznej. Eckhard Hess (1975), odkrywca tego zjawiska, z reguy posugiwa si
prbami liczcymi sobie od kilku do trzydziestu kilku osb badanych. Kiedy Hensley (1991) powtrzy
badania Hessa na 501 osobach, wszelkie rnice w spostrzeganiu osb z poszerzonymi i normalnymi
renicami zaniky. Sam wzrost liczebnoci prby (i liczby metod pomiaru zmiennej zalenej w tym
6

przypadku pozytywnoci sdw o osobie spostrzeganej) wystarczy wic do zaniknicia


podstawowego efektu.
Publikowanie replikacji rodzi wic dylemat rzetelno czy oryginalno. Rzetelno kae
replikacje publikowa jako wiadectwo powtarzalnoci (lub jej braku), oryginalno kae replikacje
odkada do szuflady, jako nie wnoszce nic nowego do dziedziny, niezalenie od wyniku.
Wspczesna psychologia wybiera w tym dylemacie bez wtpienia oryginalno, z jednym wszake
powanym ukonem w stron rzetelnoci nakada bowiem na autorw obowizek autoreplikacji (a
take dopuszcza pojciowo zmodyfikowane replikacje bada cudzych, ale ten wtek zmuszony tu
jestem pomin). Autoreplikacja, czyli powtarzanie wasnego wyniku w kolejnych badaniach, nie jest w
stanie cakowicie zastpi poytkw replikacji zewntrznej i niezalenej od badania oryginalnego.
Jednak eliminuje przynajmniej bd prby i spenia szereg innych poytecznych zada, czego
ilustracj moe by fascynujcy cig bada Dariusza Doliskiego i Ryszarda Nawrata (1994, 1998)
nad wykryt przez nich technik wpywu spoecznego, ktr nazwali hutawk emocjonaln.
Analizujc wspomnienia osb przesuchiwanych w wizieniach nazistowskich
czy stalinowskich autorzy ci zauwayli, e dosy czsto pojawiaj si w nich
opowieci o pewnym szczeglnym rodzaju przesucha. Zwykle przesuchujcy
oprawca prbuje zmusi winia do zezna za pomoc krzykw, grb czy tortur.
Chwilami jednak agodnieje i zaczyna traktowa winia niczym starego przyjaciela.
Zaamanie przesuchiwanego i zoenie obciajcych zezna czsto nastpuje w
tym wanie momencie ulgi, a nie najwikszego natenia strachu. Nawizujc do
pewnych oglniejszych prawidowoci funkcjonowania emocji, Doliski i Nawrat
zaoyli, e cho strach wpywa na czowieka mobilizujco, nastpstwem nagego
zaniknicia rda strachu jest demobilizacja. W stanie takiej ulgi po uprzednim
strachu (hutawki emocjonalnej) czowiek powinien stawa si bardziej podatny na
wpywy wywierane przez innych.
Uzbrojeni w t hipotez badacze wyruszyli na ulice Opola, gdzie cz
przechodniw przekraczajcych ruchliw ulic w nieoznakowanym miejscu stawiali w
sytuacji hutawki emocjonalnej. Gdy ju taka osoba zbliaa si do chodnika, syszaa
gwizdek policyjny (w rzeczywistoci gwizdali Doliski z Nawratem), co zwykle
powodowao nerwowe rozgldanie si za policjantem, ktry zaraz miaby wlepi
mandat. Jednak zamiast policjanta pojawiaa si co za ulga moda dziewczyna,
przedstawiajc si jako studentka i proszc w wypenienie pewnego kwestionariusza.
Cho byo zimno i wietrzno, a wypenianie kwestionariusza na ulicy byo niewygodne,
a 59% przechodniw w stanie ulgi godzio si wyrzdzi studentce t przysug. Jak
wskazuj dane z tabeli 2, by to wikszy odsetek ni w innej grupie przechodniw,
ktrzy nie przeywali akurat ulgi (take przeszli ulic w nieoznakowanym miejscu, ale
nie potraktowano ich gwizdkiem, bd te w ogle nie przechodzili ulicy).
Wynik eksperymentu potwierdzi wic hipotez hutawki emocjonalnej. Jednak
autorzy postanowili dokona autoreplikacji tego efektu w kilku innych badaniach,
ktre rwnie ilustruje tabela 2.
---tutaj tabela 2---

2. Maksymalizacja trafnoci wewntrznej


Celem powtarzania wasnych bada jest z reguy nie tylko wykazanie rzetelnoci
(powtarzalnoci) podstawowego efektu, ale i realizacja szeregu innych zamierze.
Pierwszym takim zamierzeniem Doliskiego i Nawrata bya maksymalizacja
trafnoci wewntrznej ich badania, tzn. doprowadzenie do powikszenia siy efektu,
co zwykle uzyskuje si albo zwikszajc natenie manipulacji eksperymentalnej (tak
aby wzrosa rnica midzy grup eksperymentaln i kontroln), albo oczyszczajc
j z jakich niepodanych elementw (ktre mog hamowa jej skuteczno). W
pierwszym badaniu rnice w ulegoci osb w stanie ulgi i w stanie neutralnym byy
niewielkie (13% lub 18% w zalenoci od porwnywanych grup), co autorzy
7

przypisali brakowi jasnego sygnau przeminicia zagroenia. Niektrzy badani mogli


doj do wniosku o nieobecnoci policjanta dopiero w trakcie rozmowy ze studentk,
inni zanim jeszcze do nich podesza, itd. Std te nastpne badanie zaaranowali
w taki sposb, by sygna ustpienia zagroenia by jednoznaczny i pojawia si dla
wszystkich w tym samym momencie. Tym razem badani byli kierowcy parkujcy w
niewaciwym miejscu samochd dochodzc do swego pojazdu ju z daleka
widzieli za wycieraczk kartk o rozmiarach mandatu. Kiedy jednak odwracali kartk
okazywao si, e to nie mandat co za ulga! lecz reklama Vitapanu, (nie
istniejcego) rodka na porost wosw. I tutaj pojawiaa si studentka z prob o
wypenienie kwestionariusza potrzebnego jej do pracy magisterskiej. Tym razem
zgodzio si a 62% nagabnitych, znacznie wicej ni w grupie, gdzie kartka bya
przyklejona na bocznej szybie (a wic ju z daleka wygldaa na reklam, a nie
mandat), bd wcale nie byo kartki, jak przekonuj dane z tabeli 2. Ulepszenie
metody manipulowania stanem ulgi doprowadzio wic do wzrostu trafnoci
wewntrznej badania.
Maksymalizacja trafnoci wewntrznej polegajca na rnych zabiegach
majcych na celu doprowadzenie do tego by badanie wyszo (by wystpia istotna
rnica midzy grupami, bd istotna korelacja midzy zmiennymi) jest zapewne
powszechnym elementem procesu badawczego w psychologii. Jednak informacja o
tych zabiegach rzadko pojawia si w publikacjach, w tych bowiem preferowany jest
opis zabiegw udanych, nie za nieudanych. Nietrudno to zrozumie publikacje
naukowe nie s biograficznym zapisem zmaga autorw ze sw hipotez, opisem
dziejw ich kolejnych klsk i zwycistw, lecz jedynie informacj o sposobie
przeprowadzenia badania, sporzdzon w taki sposb, by kady inny badacz mg je
powtrzy. Problem jednak w tym, i pominicie klsk na drodze do sukcesu (a klsk
jest z reguy wicej ni zwycistw) czyni t informacj niepen, szczeglnie gdy nie
wiemy, co tak naprawd zadecydowao o sukcesie badania, to za zdarza si wcale
czsto. Kady inny badacz pragncy zreplikowa dane badanie bywa wic
niepotrzebnie naraony na puapki, w ktre wpad ju uprzednio autor oryginalnego
badania. Np. w psychologii spoecznej tajemnic poliszynela jest, i niektre badania
wychodz tylko pod warunkiem, e przeprowadzane s indywidualnie, inne tylko
pod warunkiem, e prowadzone s w grupach; niektre wychodz tylko na
komputerze, ale nie przy metodzie papier-owek, inne za na odwrt (Stapel,
2000). Jednak dopki badacz nie wie (nie potrafi wyjani) dlaczego konieczne s
takie, a nie inne warunki, po prostu pomija tak kwesti milczeniem i puapka dla
nastpnego badacza gotowa.

3. Eliminacja alternatywnych wyjanie


Innym celem powtarzania wasnych bada jest eliminacja alternatywnych
wyjanie zasadniczego efektu. W dotychczas opisanych dwch badaniach nad
hutawk emocjonaln ich uczestnicy z warunkw eksperymentalnych nie tylko byli
w stanie ulgi, ale take przeywali strach, natomiast osoby z warunkw kontrolnych
nie przeyway ani ulgi, ani strachu. Nie wiadomo wic, czy rnice midzy tymi
osobami wynikay z samej ulgi, czy te ze strachu cakiem rozsdne jest przecie
przypuszczenie, e osoby zastraszone atwiej ulegaj presji spoecznej ni
niezastraszone. Aby to rozstrzygn, Doliski i Nawrat przeprowadzili kolejne
badanie z kierowcami niewaciwie parkujcymi swoje samochody i stworzyli tym
razem jeszcze jeden rodzaj warunkw, w ktrych kierowcy owi znajdowali za
wycieraczk wezwanie na policj, celem wyjanienia niewaciwego parkowania.
Bezporednio po przeczytaniu kartki podchodzia do nich studentka z prob o
8

wypenienie ankiety. Jak przekonuj wyniki zamieszczone w tabeli 2 (Eksperyment


3), kierowcy z tej grupy zapewne nadal jeszcze przeywajcy strach zgadzali si
speni prob nieporwnanie rzadziej ni kierowcy przeywajcy ulg (z grupy
reklama za wycieraczk), a take kierowcy w stanie neutralnym (z grup reklama na
drzwiach i brak kartki). W ten sposb autorzy udowodnili, e za wzrost podatnoci
na wpyw spoeczny odpowiedzialne jest nage wycofanie rda strachu, a nie sam
strach.
W tym samym badaniu podjto take prb eliminacji innych alternatywnych
wyjanie wypeniana przez kierowcw ankieta zawieraa m. in. pomiar aktualnie
przeywanego poczucia winy i wstydu. Okazao si, e natenie tych dwch emocji
nie rnio si u badanych z warunkw ulgi i badanych z warunkw neutralnych, cho
emocje te byy istotnie nasilone w grupie wezwanej na policj. Eliminuje to
wyjanienie zwikszonej ulegoci na nacisk spoeczny w kategoriach
domniemanego wzrostu poczucia winy i wstydu.
Eliminacja alternatywnych wyjanie jest niezbdnym elementem wikszoci
programw badawczych, poniewa bardzo wiele zjawisk stanowicych przedmiot
zainteresowania psychologii, to zjawiska uwarunkowane wieloczynnikowo. Jeeli za
zjawisko ma wiele przyczyn, ktre mog dziaa rwnoczenie, to eliminacja
alternatywnych wyjanie jest niezbdna do ustalenia, ktra z moliwych przyczyn
faktycznie wywouje dane zjawisko. Do czsto zdarza si przy tym, e rne
czynniki s postulowane przez rne teorie psychologiczne, w zwizku z czym
rozstrzyganie midzy alternatywnymi wyjanieniami staje si fascynujcym
rozstrzyganiem o prawdziwoci rywalizujcych teorii (experimentum crucis). Zadanie
to ma w istocie niemale nieskoczenie wiele odmian, a jedn z najtrwalszych w
psychologii i innych naukach spoecznych jest problem kultura czy natura, a wic
pytanie o wzgldn rol czynnikw dziedzicznych i rodowiskowych w wyznaczaniu
ludzkich cech (jak inteligencja) i zachowa (jak agresja). Np. z licznych bada dobrze
wiadomo, e mczyni i kobiety mocno si rni preferencjami co do wasnoci
partnera heteroseksualnego (Buss, 1996). Mczyni poszukuj partnerek modych i
urodziwych, cho dla kobiet zalety te s mao wane u partnerw. Kobiety poszukuj
partnerw ambitnych, majtnych i zajmujcych wysok pozycj spoeczn, cho
odniesione do kobiet, zalety te mao znacz w oczach mczyzn. Buss i inni
psychologowie nawizujcy do teorii ewolucji skonni s te rnice preferencji
heteroseksualnych wyjania jako rezultat przystosowania si kobiet i mczyzn do
nieco odmiennych naciskw selekcyjnych oddziaywujcych na kad z pci w
kontekcie wyborw heteroseksualnych (poniewa kobiety dokonuj wikszych
nakadw rodzicielskich, bardziej s zainteresowane mskimi zasobami, ktre
zrekompensowayby te nakady; za mczyni podaj za urod, gdy jest ona
wskanikiem wartoci reprodukcyjnej kobiety i gwarantuje wysz szans sukcesu
reprodukcyjnego w zamian za zasoby oferowane partnerce). Jednake inni badacze
wskazuj, i te rnice pci mog by rezultatem czynnikw nie biologicznych, lecz
kulturowych, takich jak utosamianie si zarwno mczyzn jak i kobiet z
obowizujcym w ich kulturze stereotypem pci. Skonio to Bussa i in. (1990) do
przeprowadzenia na szerok skal zakrojonych bada, w ktrych porwnywano
preferencje ponad 10 tys. modych kobiet i mczyzn z 37 rnych krajw. Cho
badani pochodzili z kultur tak zrnicowanych, jak Ameryka, Chiny, Polska i Zambia,
wymienione rnice midzy pciami okazay si rzetelne i wystpoway niemale w
kadej z badanych kultur co silnie przemawia za pozakulturowym wyjanieniem
tych rnic.
9

Eliminacja alternatywnych wyjanie jest rwnie konieczna do wywikania si


z bdu qui pro quo, jaki nierzadko nka psychologi i inne nauki empiryczne.
Badacze ulegaj zudzeniu, e zastosowana przez nich manipulacja wywouje efekty
jedynie zamierzone i mierzone w badaniu, ale ju nie adne inne. W przypadku
bada korelacyjnych jest to bliniacze zudzenie, e zastosowana metoda (np.
kwestionariusz) mierzy jedynie t zmienn, do mierzenia ktrej badacz j
przeznaczy.
W istocie przekonania te s wanie zudzeniami, bowiem wikszo
kwestionariuszy mierzy wicej ni jedn zmienn. Kady kwestionariusz mierzy nie
tylko cech, do mierzenia ktrej jest przeznaczony, ale take i wiele pokrewnych
zmiennych, a prawie wszystkie mierz w jakim stopniu skonno do ukazywania si
w dobrym wietle. Podobnie wiele manipulacji eksperymentalnych wywouje oprcz
efektw zamierzonych przez badacza, take i efekty niezamierzone, czsto w postaci
rnych przekona osoby badanej. Klasycznym i dobrze znanym przykadem jest
wpyw alkoholu na agresj zarwno obserwacja potoczna, statystyki policyjne, jak i
badania laboratoryjne wskazuj, e spoycie alkoholu nasila agresj (Ito, Miller i
Pollock, 1996). Jednake osoby trzewe i nietrzewe rni si zwykle nie tylko
zawartoci alkoholu we krwi, ale take przekonaniem, e s trzewe lub nie, za
przekonanie o wasnej nietrzewoci moe znosi zwykle dziaajce zahamowania
reakcji agresywnych. Jeli eksperymentalnie rozdzieli takie przekonanie od
faktycznej intoksykacji (np. podajc badanym tonic z alkoholem lub bez niego oraz
informujc, e napj zawiera alkohol lub go nie zawiera), to nierzadko okazuje si,
e agresj nasila samo przekonanie o nietrzewoci, a faktycznie wypijany alkohol
jest bez znaczenia (Lang i in., 1975).
Jednorazowe badanie, w szczeglnoci nad nowym problemem naukowym,
bardzo rzadko, jeeli w ogle kiedykolwiek, jest w stanie rozstrzygn pomidzy
rnymi wyjanieniami tego samego zjawiska. Take dlatego, e badacz czsto nie
zdaje sobie w peni sprawy z tego, co w swoim badaniu faktycznie zrobi, dopki tego
nie zrobi, tj. nie przeprowadzi badania. Jeeli za po badaniu jest w 100% pewien,
e zrobi w nim tylko to, co zrobi zamierza, to skonny jestem podejrzewa, e po
prostu brak takiemu badaczowi samokrytycyzmu. Przejawem braku krytycyzmu jest
take niech do uwzgldniania, a nawet samodzielnego wymylania alternatywnych
wyjanie wasnych wynikw (a nastpnie ich eliminacji na drodze empirycznej).
Jeeli badacz nie widzi adnych wyjanie alternatywnych w stosunku do
ulubionego, oznacza to albo niedojrzao problemu, albo samego badacza.
4. Maksymalizacja trafnoci zewntrznej i teoretycznej
Wrmy jednak do programu Doliskiego i Nawrata, ktrzy kolejne badanie
przeprowadzili w laboratorium, a nie na ulicy. Nie dlatego, e opolscy kierowcy w
kocu zaprzestali procederu niewaciwego parkowania swoich samochodw, ale
dlatego, e autorzy chcieli w ten sposb powikszy trafno zewntrzn swoich
bada. Badanie jest trafne zewntrznie wwczas, gdy jego wyniki mona uoglnia
na inne osoby i sytuacje ni faktycznie zbadane. Wzrost trafnoci zewntrznej osiga
si poprzez powtarzanie bada na odmiennych rodzajach osb badanych i z
uyciem odmiennych manipulacji zmiennymi niezalenymi i rnorodnych
operacjonalizacji zmiennych zalenych. Dziki takiemu poszerzaniu zrnicowania
manipulacji i/lub pomiarw w oczywisty sposb ronie moliwo uoglniania
uzyskanej zalenoci na inne, niebadane sytuacje. Maa trafno zewntrzna jest
czstym problemem bada laboratoryjnych z uwagi na to, e warunki laboratoryjne
do mocno odbiegaj od tego, co dzieje si w przebiegu naturalnych interakcji
spoecznych.
10

Dotychczas przedstawione badania nad hutawk emocjonaln nie stwarzaj


takich kopotw, poniewa rozgryway si dosownie na ulicy. Jednak samo w sobie
nie zapewnia to jeszcze zadowalajcej trafnoci zewntrznej bada. Na przykad
dlatego, e we wszystkich trzech identycznie wyglda pomiar zmiennej zalenej
zawsze byo to spenianie proby o wypenienie studentce kwestionariusza. Std te
w Eksperymencie 4 zastosowano zupenie inn operacjonalizacj zmiennej zalenej
osoby badane (ktrymi byli dla odmiany licealici) proszono o udzia w zbieraniu
pienidzy na ulicach Opola na rzecz dzieci z sierocica. Uczestnikom zapowiedziano
udzia w badaniach nad rnymi umiejtnociami i zdolnociami i podzielono
losowo na trzy grupy. Jednej zapowiedziano udzia w badaniu nad uczeniem si,
gdzie za kady bd mieli otrzyma bolesne kopnicie prdem elektrycznym.
Drugiej zapowiedziano to samo, ale po pewnym czasie odwoano grob informujc,
e prowadzcy badania profesor zmieni zdanie i e wezm udzia w innym badaniu
nad koordynacj wzrokowo-ruchow, gdzie z pewnoci nie czekaj ich adne szoki
elektryczne. Osoby z tej grupy zostay wic wprowadzane w stan ulgi. Wreszcie
trzeciej grupie od pocztku zapowiadano badania nad koordynacj wzrokowo-
ruchow. Jak przekonuj dane z tabeli 2, eksperyment 4, badani w stanie ulgi
znacznie czciej ulegali probie, ni badani w stanie strachu (oczekujcy na
wstrzsy elektryczne), lub w stanie neutralnym (oczekujcy na badanie koordynacji).
Hutawka emocjonalna okazaa si raz jeszcze skuteczna pomimo zmiany rodzaju
osb badanych, zmiany manipulacji eksperymentalnej i zmiany rodzaju
operacjonalizacji zmiennej zalenej.
Rnicowanie operacjonalizacji tej samej zmiennej zalenej lub niezalenej
jest wanym elementem strategii SMAR. Podobnym i jeszcze waniejszym
elementem tej strategii jest rnicowanie (dywergencja) zmiennych poddanych
badaniu. Weryfikacja hipotez formuowanych na duym poziomie oglnoci wymaga
zwykle zbadania nie jednej, lecz wielu rnych zmiennych zalenych, ktrych czsto
nie mona zmierzy w tym samym badaniu, poniewa pomiar jednej obniyby
wiarygodno pomiaru innych (interferencja pomiarw), albo dlatego, e pomiar
kadej z nich wymaga odmiennego scenariusza badawczego. Do weryfikacji takich
hipotez konieczna jest wic seria bada, z ktrych kade powicone jest pomiarowi
innych zmiennych w nadziei na uzyskanie zbienych wynikw pomimo rozbienych
pomiarw. Jest to wic denie do konwergencji wyniku przy dywergencji zmiennych
i metod ich pomiaru.
Przykadem takiej dywergencji zmiennych s badania nad ogln hipotez o dominacji
kategorii moralnych w formuowaniu ocen interpersonalnych oceniajc innego czowieka bardziej
kierujemy si informacjami na temat jego moralnoci-niemoralnoci, ni innymi informacjami o
podobnej wartociowoci (Wojciszke, 1994, Wojciszke, Baziska i Jaworski, 1998). Zaoenie to
opiera si na przesance, e podstawow funkcj spostrzegania spoecznego, a przynajmniej ocen
interpersonalnych, jest lokowanie innych osb na wymiarze denie-unikanie, a wic decydowanie o
tym, czy inna osoba jest dobroczynna dla spostrzegajcego podmiotu (i warto dy do kontaktw z
ni), czy te jest szkodliwa (i warto jej unika). Z tego punktu widzenia moralno-niemoralno
innego czowieka silniej powinna wpywa na oceny ni np. jego sprawno-niesprawno, cho wiele
cech moralnych ma wartociowo zblion do cech sprawnociowych. Np. inteligencja i uczciwo s
jako cechy same w sobie mniej wicej jednakowo cenione - dlatego w caym tym programie
cechy/informacje dotyczce sprawnoci traktowano jako porwnawcze w stosunku do cech/informacji
dotyczcych moralnoci. Moralno-niemoralno innego czowieka bezporednio bowiem przekada
si na zyski i straty spostrzegajcej osoby (ze strony uczciwego czowieka nic mi nie grozi, zodziej
moe okra i mnie), podczas gdy sprawno tego pierwszego ma znaczenie jedynie wtrne i zaley
od tego, czy jest uyta do realizacji moralnych czy te niemoralnych celw (bystro przyjaciela jest
zwykle dobroczynna, w przeciwiestwie do bystroci zodzieja).
Bezporedni konsekwencj zaoenia o dominacji kategorii moralnych jest
przewidywanie, e nasze oceny innych ludzi bardziej zale od tego, co wiemy o ich
11

moralnoci ni o innych cechach o podobnej wartociowoci. Aby sprawdzi to


rozumowanie poprosilimy naszych badanych o oszacowanie 10 moralnych i 10
sprawnociowych cech (o wyrwnanej wartociowoci) kilkunastu osb ze swego
otoczenia, a nastpnie o ogln ocen tych osb. Zgodnie z przewidywaniami
(sprawdzanymi metod regresji wielokrotnej) okazao si, e sdy o cechach
zwizanych z moralnoci pozwalaj znacznie lepiej przewidywa oceny globalne,
ni sdy o cechach sprawnociowych. Pierwsze wyjaniay rednio 53% wariancji
ocen, drugie tylko 29% wariancji. Jednake badanie to ma charakter korelacyjny, a
wic nie rozstrzyga, czy to sdy o moralnoci i sprawnoci z niejednakow si
wpywaj na oceny globalne, czy te na odwrt oglny stosunek do czowieka
silniej wpywa na ocen jego moralnoci ni sprawnoci. Std te hipotez o
silniejszym uzalenieniu ocen od moralnoci ni sprawnoci sprawdzalimy take w
eksperymencie, w ktrym badani najpierw otrzymywali opisy zachowa nieznanych
sobie osb, a nastpnie dokonywali ich ocen. Tre zachowa zmieniaa si wedug
schematu 2 (moralnie pozytywne lub negatywne) x 2 (sprawnociowo pozytywne lub
negatywne). Jak ilustruje rysunek 1, decydujca dla ocen okazaa si informacja o
moralnoci. Gdy bya ona dodatnia, oglna ocena bya zawsze pozytywna, nawet
przy ujemnej informacji o sprawnoci; gdy bya ona ujemna, ocena bya zawsze
negatywna, nawet przy dodatniej informacji o sprawnoci. Najbardziej pozytywne
oceny zyskiway sobie osoby zarwno moralne, jak i sprawne. Najbardziej
negatywnie byy natomiast oceniane osoby sprawne w czynieniu za, a wic przy
informacji negatywnej moralnie, ale pozytywnej sprawnociowo.
Zalet tego eksperymentu jest moliwo rozstrzygnicia, e to informacje o
moralnoci-sprawnoci s przyczyn takich, a nie innych ocen, nie za odwrotnie.
Jego wad jest natomiast badanie osb (spostrzeganych) fikcyjnych, jedynie
wyobraanych sobie przez badanych na podstawie naszych sownych opisw ich
zachowa. Jednake podobny wynik przynioso poprzednio opisane badanie
korelacyjne, gdzie badani szacowali cechy rzeczywistych osb ze swego otoczenia i
oceniali je, cho nie wiadomo, co tam byo przyczyn, a co skutkiem. Wady i zalety
obu tych bada s wic komplementarne, a wynik pozostaje wyranie podobny, co
rzecz jasna podnosi zaufanie do jego wiarygodnoci. Wady i zalety bada
korelacyjnych i eksperymentalnych zwykle przedstawiaj si w taki wanie
komplementarny sposb, std te rwnoczesne ich stosowanie w obrbie tego
samego programu badawczego jest wanym elementem strategii SMAR.
--- tu Rysunek 1 ---
Zaoenie o dominacji kategorii moralnych pozwala sformuowa kilka
dodatkowych hipotez szczegowych (obok hipotezy gwnej, e moralno bardziej
wpywa na oceny ni porwnywalna pod wzgldem pozytywnoci-negatywnoci
informacja o sprawnoci). Na przykad, skoro kategorie moralne s czciej uywane
ni sprawnociowe, powinny si one cechowa chroniczn dostpnoci
pamiciow. Hipotez t sprawdzalimy w prostym badaniu, ktrego uczestnikw
poprosilimy, aby wymienili wszystkie te cechy, ktre chcieliby pozna u nieznanej
osoby, aby zorientowa si, jaka ona jest (Wojciszke, Baziska i Jaworski, 1998,
Badanie 1). Pierwsza dziesitka najczciej wskazywanych cech to: szczero,
uczciwo, bycie wesoym, tolerancja, lojalno, inteligencja, prawdomwno, brak
egoizmu, odpowiedzialno i bycie miym. Znaczna wikszo tych cech wyranie
dotyczy moralnoci, co wskazuje na podwyszon, chroniczn dostpno tych
kategorii spostrzegania innego czowieka.
Pocztkow operacj procesu spostrzegania jest czsto poszukiwanie danych
o spostrzeganym czowieku, ktre stan si podstaw do wydania sdu na jego
12

temat. W jednym z eksperymentw prosilimy badanych o wskazanie na


dostarczonej im licie tych cech innego czowieka, ktre chcieliby sprawdzi (czy
tamten je ma czy nie), aby zorientowa si na jak oglna ocen on zasuguje, albo
czy warto go wybra na skarbnika, albo czy warto go wybra na negocjatora w
trudnym konflikcie. zasuguje on na oglnie pozytywn, czy te negatywn ocen.
Przy celu zwizanym z moralnoci (skarbnik) badani rzecz jasna poszukiwali
najczciej informacji o cechach moralnych; przy celu zwizanym ze sprawnoci
(negocjator) najczciej poszukiwali informacji o cechach sprawnociowych. Co
najwaniejsze, take przy celu oglna ocena badani dwukrotnie czciej
poszukiwali informacji na temat moralnoci ni sprawnoci spostrzeganej osoby,
cho cechy dotyczce obu tych dziedzin byy wyrwnane pod wzgldem stopnia
wysycenia ich ocen (Wojciszke, Baziska, Jaworski, 1998, Badanie 2). Informacja o
moralnoci jest wic bardziej potrzebna do wydania oglnej oceny innego czowieka,
ni informacja o jego sprawnoci.
Kolejn operacj procesu spostrzegania osb jest interpretacja danych o
zachowaniu spostrzeganej osoby. Operacj t badalimy w eksperymencie, w ktrym
ludzie interpretowali zachowania bohaterw omiu historyjek interpretowalnych przez
pryzmat zarwno moralnoci, jak i sprawnoci (np. Zosia prbuje obroni Marysi
przed niesusznymi zarzutami, ale robi to tak nieudolnie, e jeszcze bardziej j
pogra przykad zachowania wiadczcego o moralnoci i o braku sprawnoci).
Badani proszeni byli o ocen bohatera historyjki oraz o uzasadnienie oceny, ktre
byo potem szacowane przez sdziw kompetentnych z uwagi na to, jak dalece
odwoywao si ono do wzgldw moralnych lub sprawnociowych (Wojciszke, 1994,
Badanie 2). Poowa badanych interpretowaa je z punktu widzenia aktora, czyli
samego dziaajcego bohatera (mieli odtworzy jego myli i sposb rozumienia
sytuacji), poowa za - z punktu widzenia obserwatora danego zdarzenia (mieli
odtworzy myli osb, ktrym bohater wyrzdza dobro lub zo). Kategorie moralne
okazay si znacznie silniej ni sprawnociowe uywane przez badanych
interpretujcych cudze zachowania, a wic wystpujcych z pozycji obserwatora
(odwrotnie byo w przypadku pozycji aktora). Przy tym sposb interpretacji
zachowania by silnie powizany z ocenami (badani podkrelajcy moralno Zosi z
przykadu w nawiasie oceniali j pozytywnie, badani podkrelajcy jej nieudolno
oceniali j negatywnie).
Interpretacja danych o zachowaniu osoby spostrzeganej bya take
przedmiotem eksperymentu Baziskiej i Wojciszke (1996), cho przy uyciu zupenie
innej metodologii. Badanym osobom eksponowano na ekranie komputera sowne
opisy zachowa interpretowalnych w kategoriach zarwno moralnych, jak i
sprawnociowych - np. Aby zyska poparcie, podlizywa si swojemu nowemu
szefowi, jednak z powodu kompletnego braku wyczucia tylko zrazi go do siebie,
ktre to zachowanie wiadczy zarwno o nieszczeroci (cecha moralna), jak i o
niezrcznoci (cecha sprawnociowa). Kiedy badany zasygnalizowa, e przeczyta i
zrozumia opis zachowania, na ekranie pojawiao si pytanie o to, czy zachowanie to
wiadczy o stosownej cesze moralnej (faszywy?), bd sprawnociowej
(niezrczny?). Pomiary czasw reakcji wykazay, e badani odpowiadali istotnie
szybciej na pytania o cechy moralne ni sprawnociowe, co wskazuje, e moralny
aspekt zachowa innego czowieka bardziej si obserwatorowi narzuca ni aspekt
sprawnociowy.
Przykady te ilustruj najwaniejsz zasad strategii SMAR: kolejne replikacje
wasnego wyniku polegaj nie tylko na systematycznych modyfikacjach metody
pomiaru (czy manipulacji) tej samej zmiennej, ale take na systematycznej
13

dywersyfikacji zmiennych poddawanych badaniu. Skoro hipoteza dotyczy procesu


(np. spostrzegania i oceniania ludzi), to poszczeglne badania skadajce si na cay
program powinny dotyczy poszczeglnych etapw tego procesu (np. kolejnych
operacji skadajcych si na spostrzeganie poszukiwania danych, ich interpretacji i
integracji w ocen globaln). Oglniej rzecz biorc, jest to oczywicie przykad
generalnej reguy metodologicznej nakazujcej weryfikowanie hipotezy teoretycznej
poprzez sprawdzanie moliwe duej liczby, moliwie rnorodnych konsekwencji
empirycznych tej hipotezy. Strategia ta oznacza sprawdzanie nie pojedynczej
hipotezy, lecz caej teorii, w ktr hipoteza owa jest uwikana i z ktrej wynika.
Nietrudno zauway, e autoreplikacje s niezbdnym elementem takiej strategii.

5. Sprawdzanie skutecznoci manipulacji


Wrmy raz jeszcze do programu bada nad hutawk emocjonaln i
czwartego badania, ktre miao charakter laboratoryjny. Jednym z celw tego
eksperymentu byo sprawdzenie skutecznoci zastosowanej manipulacji, ktre
zwykle polega na zbadaniu, czy wywouje ona zamierzony przez badacza stan lub
proces psychiczny. Kluczowym elementem hutawki jest lk. Jeeli zastosowane
manipulacje wywoyway zamierzone przez autorw stany, to osoby oczekujce na
wstrzsy elektryczne powinny by najbardziej zalknione, osoby oczekujce na
pomiar koordynacji powinny by najmniej zalknione, za pomidzy tymi kracami
winny si znajdowa osoby, u ktrych oczekiwanie zmienio si z jednego na drugie
(warunki ulgi). Oczekujcy na badanie licealici wypeniali kwestionariusz mierzcy
natenie aktualnie przeywanego lku. Wskaniki lku w trzech porwnywanych
grupach okazay si dokadnie zgodne z przewidywaniami.
Sprawdzanie skutecznoci manipulacji jest wanym elementem strategii
SMAR, bowiem pozwala unikn bdu qui pro quo oraz dostarcza dowodw
trafnoci proponowanego przez badacza wyjanienia efektu. Pomiar zasadniczych
efektw manipulacji (tj. gwnej zalenoci interesujcej badacza) i pomiar
skutecznoci manipulacji zwykle nie s moliwe w tym samym badaniu, poniewa
pomiar skutecznoci moe zaburza pomiar waciwego efektu i odwrotnie. Jeeli
badamy wpyw poczucia winy na pomaganie, to moemy badanych wprowadzi w
poczucie winy (subtelnie nakaniajc by wzili do rki przedmiot, ktry
nieoczekiwanie psuje si) oraz zbada czy tacy badani s bardziej skonni pomaga
innemu czowiekowi (np. pozbiera rzeczy, ktre przypadkiem wysypuj si z siatki
przechodzcej obok nieznajomej). Jednak nie moemy w tym samym eksperymencie
zmierzy poczucia winy przeywanego przez jego uczestnikw. Gdybymy zmierzyli
poczucie winy tu po manipulacji, a jeszcze przed okazj do udzielenia pomocy,
zaburzylibymy trafno pomiaru podstawowej zmiennej zalenej, czyli pomagania
np. dlatego, e badani zorientowaliby si, i badanie dotyczy wpywu poczucia winy
na pomaganie, albo poczucie winy zmalaoby wskutek zawierzenia winy innemu
czowiekowi (w kocu na tym polega cz katartycznego efektu spowiedzi).
Gdybymy zmierzyli poczucie winy na sam koniec, ju po ewentualnym udzieleniu
pomocy, pomiar byby nietrafny, gdy poczucie winy mogo zmale u osb
pomagajcych (a wzrosn u niepomagajcych). W takiej sytuacji jedynym wyjciem
jest losowy podzia badanych na dwie grupy, gdzie w jednej przedmiotem pomiaru
jest zasadnicza zmienna zalena (pomaganie nieznajomym), w drugiej za mierzona
jest skuteczno manipulacji (natenie przeywanego poczucia winy). Jest to
oczywicie odmiana auto-replikacji badania.
Zaburzajcy wpyw pomiaru zasadniczej zmiennej zalenej na pomiar
skutecznoci manipulacji i odwrotnie jest szczeglnym przypadkiem oglniejszej
14

zasady intereferencji pomiarw: im wicej zmiennych (zalenych i/lub


poredniczcych) mierzymy w tym samym badaniu, tym mniejsza jest wiarygodno
kadego kolejnego pomiaru poniewa ronie bd, jakim pomiar ten jest obciony
wskutek dokonywania na tej samej osobie badanej pomiarw poprzednich. W
szczeglnoci bezwartociowy bywa retrospektywny pomiar skutecznoci
manipulacji dokonany ju po pomiarze zmiennej zalenej. Badacz twierdzcy, i za
pomoc takich pomiarw wykaza skuteczno swojej manipulacji a wic, e
manipulacja wpyna w zamierzony przeze sposb na procesy psychiczne
badanego czsto przypomina barona Mnnhausena opowiadajcego, jak to
cignc siebie samego za wosy wycign siebie i konia z bagna. Wykazanie, i
manipulacja wywouje okrelone zmiany stanw lub procesw psychicznych oraz, e
wywouje one okrelone nastpstwa tych zmian (np. w zachowaniu) wymaga z reguy
odrbnych bada, a wic systematycznie modyfikowanych autoreplikacji.

6. Poszukiwanie moderatorw zalenoci


Innym jeszcze celem laboratoryjnego eksperymentu Doliskiego i Nawrata
byo poszukiwanie moderatorw zalenoci midzy hutawk emocjonaln, a
wzrostem podatnoci na wpywy spoeczne. Moderator jakiej zalenoci to czynnik,
ktry decyduje o jej wystpowaniu lub nie (czy te mniej kategorycznie czynnik
decydujcy o sile podstawowej zalenoci). Cakiem rozsdne jest np.
przypuszczenie, e moderatorem wpywu ulgi na uleganie wpywom spoecznym w
pierwszych trzech eksperymentach byo poczucie winy. Wszyscy uczestnicy
ulicznych bada Doliskiego i Nawrata dopucili si jakiego wykroczenia (w
niewaciwym miejscu przechodzili przez ulic lub parkowali samochd) i moliwe, e
wanie dlatego przeywana przez nich ulga nasilaa podatno na cudze proby,
bowiem poczucie winy nasila skonno do pomagania innym. Std te autorzy do
swojego laboratorium zaprosili licealistw, ktrzy niczego nie przeskrobali,
przynajmniej tu przed usyszeniem skierowanej do nich proby. Gdyby poczucie
winy odgrywao rol moderatora interesujcej tu nas zalenoci, hutawka
emocjonalna powinna zanikn w tym badaniu. W rzeczywistoci dziaaa nadal, co
wskazuje na to, e poczucie winy nie jest warunkiem wystpowania tego zjawiska.
Poszukiwanie moderatorw jest wanym elementem programw badawczych i
strategii SMAR poniewa oznacza poszukiwanie granic, w jakich prawidowoci
psychologiczne obowizuj, a poznanie tych granic jest rwnie wane jak poznanie
samych prawidowoci, c bowiem za poytek z wiedzy, o ktrej nie wiadomo kiedy
obowizuje. Jest to wyrazem jednej z gwnych rnic midzy wiedz potoczn a
naukow podczas ta pierwsza do beztrosko formuuje prawidowoci oglne, co
do ktrych zakada implicite, e obowizuj zawsze i wszdzie, wiedza naukowa
wiadoma jest wasnych ogranicze w tym faktu, i kada prawidowo,
przynajmniej w naukach spoecznych, obowizuje tylko w pewnych warunkach, cho
ich granice bywaj czasami do szeroko zarysowane.
Przykadem szeroko, cho nie zawsze obowizujcej prawidowoci jest
omawiana poprzednio dominacja kategorii moralnych nad sprawnociowymi w
spostrzeganiu osb, wykazana w okoo 10 badaniach (por. Wojciszke, 1999). Jednak
co najmniej dwa badania wykazay, e wzorzec owej dominacji ulega dokadnemu
odwrceniu, gdy czowiek interpretuje i ocenia swoje wasne zachowania (Wojciszke,
1994). Midzy innymi wspominane ju badanie, ktrego uczestnicy proszeni byli o
ocen bohatera historyjki oraz o uzasadnienie oceny, ktre byo potem szacowane
przez sdziw kompetentnych z uwagi na to, jak dalece odwoywao si ono do
wzgldw moralnych lub sprawnociowych. Poowa badanych interpretowaa je z
15

punktu widzenia aktora, czyli samego dziaajcego bohatera (mieli odtworzy jego
myli i sposb rozumienia sytuacji), poowa za - z punktu widzenia obserwatora
danego zdarzenia (mieli odtworzy myli osb, ktrym bohater wyrzdza dobro lub
zo). Jak ilustruje rysunek 2 (strona prawa) kategorie moralne okazay si co prawda
znacznie silniej ni sprawnociowe uywane przez badanych interpretujcych cudze
zachowania (powtrzenie efektu dominacji kategorii moralnych w spostrzeganiu
innych), jednak w przypadku interpretowania zachowa wasnych pojawia si
tendencja dokadnie odwrotna, co ilustruje lewa strona rysunku 2.
--- tutaj rysunek 2 ---
Oczekiwanie dominacji kategorii sprawnociowych w spostrzeganiu siebie
wynika zreszt z tej samej logiki, ktra kae oczekiwa dominacji kategorii moralnych
w spostrzeganiu innych. Tak jak cudza moralno w wikszym stopniu wpywa na
nasze zyski-straty ni cudza sprawno, tak monitorowanie naszej wasnej
sprawnoci w wikszym stopniu wpywa na nasze zyski-straty ni monitorowanie
wasnej moralnoci (przynajmniej na krtk met). Perspektywa aktor-obserwator
(czy interpretujemy zachowania wasne czy te cudze) jest zatem bardzo silnym
moderatorem dominacji kategorii moralnych w spostrzeganiu jak ilustruje rysunek
2, mamy tu do czynienia ze skrzyowan interakcj: w przypadku perspektywy
obserwatora (spostrzeganie cudzych zachowa) kategorie moralne dominuj nad
sprawnociowymi, za w przypadku perspektywy aktora (spostrzeganie wasnych
zachowa) kategorie sprawnociowe dominuj nad moralnymi.

6. Poszukiwanie mediatorw zalenoci


Kolejny i w pewnym sensie najwaniejszy etap programu bada empirycznych i
strategii SMAR to poszukiwanie mediatorw badanej zalenoci. Mediator to tyle, co
proces lub stan poredniczcy midzy zmienn niezalen (przyczyn), a zmienn
zalen (skutkiem). Znale mediator zalenoci to tyle, co odpowiedzie na pytanie
dlaczego ona wystpuje, podczas gdy znale moderator to tyle, co odpowiedzie na
pytanie kiedy (w jakich warunkach) ona wystpuje. Znalezienie mediatora jakiej
zalenoci jest wic rwnoznaczne z empirycznym dowodem na wyjanienie tej
zalenoci. A poniewa wyjanianie jest najwaniejsz funkcj teorii, poszukiwanie
mediatorw mona uwaa za najwaniejszy element programu badawczego.
Dlaczego nage wycofanie zagroenia wywouje wzrost podatnoci na wpyw
spoeczny? Zwamy, e cztery dotd omwione eksperymenty nie pozwalaj udzieli
odpowiedzi na to pytanie, cho pozwalaj wykluczy niektre moliwoci. Nawizujc
do wczeniejszych prac Ellen Langer, Doliski i Nawrat postawili hipotez, e
powodem takiego dziaania ulgi jest swoista bezmylno, w jak czowiek popada w
tym stanie. Po nagym ustpieniu zagroenia czowiek tak jest jeszcze pochonity
myleniem o przeszoci (ale mi si ugiy kolana) i o tym co mogoby si sta (a co
by byo, gdyby mnie jednak zapali), e brak mu umysowych (uwagowych) zasobw
operacyjnych, by w przemylany sposb przetwarza aktualnie dochodzce do
informacje. W konsekwencji, przetwarzanie informacji staje si bezrefleksyjne i
czowiek automatycznie ulega pojawiajcym si probom, czy naciskom ze strony
innych.
Aby sprawdzi to rozumowanie, autorzy zaaranowali jeszcze jeden
eksperyment, podczas ktrego elegancko ubrana dwjka studentw zbieraa
pienidze w kwecie ulicznej na rzecz dzieci upoledzonych. Studenci podchodzili do
co dziesitego samotnego przechodnia i potrzsajc puszk i mwili Przepraszam
Pana. Zbieramy pienidze. Czy mgby nam Pan da troch pienidzy byy to
warunki tylko proba. W warunkach uzasadnienia rzeczywistego kwestujcy
16

dodawali Jestemy z organizacji Studenci dla dzieci upoledzonych. Czy mgby


Pan wczy si do naszej akcji, bo chcemy zebra tak duo pienidzy jak to
moliwe, aby pokry koszt wakacyjnego obozu dla kilkorga dzieci upoledzonych
umysowo. Wreszcie w warunkach uzasadnienia pozornego, czyli wypowiedzi o
gramatycznej strukturze uzasadnienia, lecz nie przedstawiajcej adnych
argumentw, kwestujcy mwili Czy mgby nam pan da troch pienidzy
poniewa chcemy zebra tak duo pienidzy, jak to tylko moliwe? Autorzy
zakadali, e w normalnych warunkach ludzie bd dostrzega pozorno
uzasadnienia i dawa pienidze rwnie rzadko, jak w warunkach braku
uzasadnienia. Natomiast w warunkach bezmylnoci wywoanej ulg (ponownie
policyjny gwizdek w odniesieniu do osb nieprawidowo przechodzcych ulic) nie
bd w stanie precyzyjnie przetworzy tej informacji i zareaguj na uzasadnienie
pozorne w taki sam sposb jak na rzeczywiste. Wyniki przedstawione w tabeli 2
(Eksperyment 5) dokadnie potwierdziy te przewidywania, sugerujc, e powodem
wzrostu podatnoci na wpywy spoeczne w sytuacji ulgi jest swoista bezmylno,
czyli brak operacyjnych zasobw umysw, ktre s niezbdne do skutecznej obrony
przed naciskiem innych.
Rozrnienie moderatorw i mediatorw w przyjtej tu postaci zaproponowali
Baron i Kenny (1986), ktrzy podaj take do szczegowe wskazwki o metodach
rozstrzygania, czy jaka zmienna jest, czy te nie jest moderatorem, bd
mediatorem danej zalenoci. Schematyczne porwnanie moderatora i mediatora
przedstawia rysunek 3.
-- tutaj rysunek 3 ---
Moderator to zmienna, ktrej warto decyduje o kierunku i/lub sile
zasadniczej zalenoci. Zasadnicz zaleno obrazuje na rysunku strzaka A
istotno zwizku zasadniczych zmiennych 1 i 2 jest wiadectwem istnienia
podstawowej zalenoci. wiadectwem, e jaka trzecia zmienna stanowi moderator
tej zalenoci jest natomiast istotno strzaki C; nie ma przy tym znaczenia, czy
zaleno obrazowana strzak B jest istotna, czy nie.
W klasycznych kategoriach analizy wariancji dowodem na to, e zmienna 3
ma status moderatora zwizku zmiennych 1 i 2 jest istotna interakcja zmiennych 1 i 3
w wyznaczaniu natenia 2 (ta ostatnia ma wic status zmiennej zalenej, podczas
gdy 1 i 3 s w schemacie eksperymentu zmiennymi niezalenymi). Na przykad
wiadomo, e sygnay cierpienia ofiary (zmienna 1) hamuj agresj (zmienna 2), co
jednak silnie zaley od pci agresora (zmienna 3): sygnay cierpienia ofiary
skuteczniej hamuj agresj u kobiet ni u mczyzn. Pe jest wic moderatorem
zwizku sygnaw cierpienia ofiary z agresj.
W kategoriach bada korelacyjnych, 1 i 2 s zmiennymi skorelowanymi,
natomiast 3 jest zmienn, ktrej kontrola za pomoc korelacji czciowej zmienia
natenie i/lub kierunek podstawowej korelacji (pierwszego rzdu) midzy 1 i 2.
Jednym z tradycyjnych problemw psychologii spoecznej jest zwizek midzy
postaw (zmienna 1) a zachowaniem (zmienna 2). rednio rzecz biorc zwizek ten
wynosi r = 0,39 (Eckes i Six, 1992; Kraus, 1995), jednak dobrze wiadomo, e jego
wielko zaley od licznych zmiennych trzecich, takich jak wano i aktywizacja
postawy (postawy wane i zaktywizowane wywieraj istotnie silniejszy wpyw na
zachowanie od niewanych i nie aktywizowanych), cechy osobowoci posiadacza
postawy (osoby o pryncypialnej koncepcji siebie przejawiaj silniejszy zwizek
postaw z zachowaniem ni osoby o koncepcji pragmatycznej), czy cechy sytuacji
(jeeli w danej sytuacji obowizuj jakie silne normy postpowania, zwizek
postawy z zachowaniem spada). Wymienione zmienne trzecie s wic moderatorami
17

zwizku postawa-zachowanie. Przykady te ilustruj, i moderatorami bywaj


zmienne o bardzo rnorodnym charakterze mog to by rwnie dobrze zmienne
osobowociowe, czy osobnicze, jak i zmienne sytuacyjne.
Mediatorami s natomiast z reguy stany lub procesy psychiczne
poredniczce midzy jak zmienn niezalen a jak zmienn zalen. Sposb
ich identyfikacji przedstawia prawa strona rysunku 3. Zmienna 3 ma status mediatora
jeeli spenione s dwa warunki. Po pierwsze, w analizie wstpnej istotne okazuj si
wszystkie zwizki obrazowane strzakami D, E i F, co oznacza, e zmienna 1 wpywa
na zmienn 2 zarwno bezporednio (strzaka E), jak i za porednictwem zmiennej 3
(strzaki E i F: zmienna 1 wpywa na 3, za zmienna 3 wpywa na 2). Po drugie,
zwizek E, zmiennej 1 z 2 zanika (lub przynajmniej istotnie sabnie), jeeli uwzgldni
w analizie (kontrolowa statystycznie) dwa pozostae zwizki D i F.
W przypadku bada korelacyjnych stosown metod analizy s tu rwnania
liniowo-strukturalne. Np. Sdek (1995) wykaza w serii eleganckich bada, e
przeywanie lku na lekcjach (zmienna 1) hamuje postpy szkolne uczniw z danego
przedmiotu (zmienna 2). Jednake zwizek lku z niskimi ocenami cakowicie zanika
po uwzgldnieniu stanu bezradnoci intelektualnej (zmienna 3), czyli nkajcego go
niezrozumienia tego, co dzieje si na lekcji, pomimo podejmowanych w przeszoci
prb by to zrozumie. Sugeruje to, e lk w klasie szkolnej jest o tyle szkodliwy dla
wynikw nauczania, o ile wywouje bezradno intelektualn, natomiast rzeczywistym
wrogiem ucznia jest bezradno bowiem pogarsza ona wyniki szkolne nawet po
eliminacji wpywu lku. Przy tym inne analizy tego autora pokazay, e mediatorem
wpywu bezradnoci na wyniki nauczania nie jest np. inteligencja ucznia, bowiem
nawet po statystycznej eliminacji oddziaywa inteligencji ujemny zwizek
bezradnoci z wynikami nauczania pozostawa istotny.
W przypadku bada eksperymentalnych wielu badaczy traktuje jako test
mediacji dwukrotn analiz wariancji raz przeprowadzon na zmiennej zalenej
(zmiennej 2), drugi raz na domniemanym mediatorze (zmiennej 3). Jeeli rednie
zmiennej 2 i 3 ukadaj si podobnie (jako funkcja zmiennej 1), wnioskuje si, e
zmienna 3 stanowi porednik oddziaywania zmiennej 1 na 2. W rzeczywistoci taka
droga wnioskowania o statusie mediatora jest jednak bardzo zawodna (Fiske, Kenny
i Taylor, 1982), m. in. dlatego, e sam fakt i zmienne 2 i 3 w podobny sposb zale
od zmiennej 1, wcale jeszcze nie wiadczy o ich zwizku przyczynowo-skutkowym,
czyli o tym, e zmiany w zakresie 2 zale od zmian w zakresie 3 (np. korelacja
zmiennych 2 i 3 moe by pozorna i zalee od jakiej nieznanej badaczowi
zmiennej 4). Baron i Kenny (1986) przekonuj, e bardziej adekwatnym sposobem
testowania mediacji jest dokonanie trzech analiz regresji szacujcych kolejno:
- wpyw zmiennej niezalenej (1) na poredniczc (3),
- wpyw zmiennej niezalenej (1) na zmienn zalen (2),
- wpyw zmiennej niezalenej (1) i poredniczcej (3) na zmienn zalen (2).
O tym, e zmienna (3) ma status mediatora mona wnioskowa, gdy obie pierwsze
analizy ujawni istotne wspczynniki regresji, a analiza trzecia ujawni istotny
wspczynnik regresji 3-2. Rwnoczenie w analizie trzeciej wspczynnik regresji 1-2
powinien spa do zera lub przynajmniej istotnie zmale w porwnaniu z
analogicznym wspczynnikiem uzyskanym w analizie drugiej.
Moderatory i mediatory s zwykle identyfikowane przez psychologw dla
rnych powodw i w rnych warunkach. Typowa sytuacja, w ktrej psychologowie
poszukuj moderatorw, to wystpowanie zalenoci sabej i/lub mao rzetelnej, ktra
czasami wystpuje, a czasami zanika, jak np. wpyw postaw na zachowanie.
Identyfikacja moderatorw ma wic due znaczenie praktyczne, pozwala bowiem
18

okreli warunki, w ktrych jaka zaleno wystpuje i odrni je od warunkw, w


ktrych zaleno zanika, nawet jeeli nie rozumiemy dlaczego tak si dzieje.
Typowa sytuacja, w ktrej psychologowie poszukuj mediatorw to natomiast
wystpowanie zalenoci silnej, na tyle silnej, e mona zaoy jej istnienie z du
doz pewnoci i powici si dociekaniom dlaczego (na mocy jakich psychicznych
procesw poredniczcych) ona wystpuje. Poszukiwanie mediatorw jest wic
istotnym elementem budowania teorii psychologicznej.
Znajomo mediatorw prawie zawsze umoliwia precyzyjne wskazanie
przynajmniej niektrych moderatorw; natomiast znajomo moderatorw
niekoniecznie oznacza wiedz o mediatorach - moemy nie rozumie dlaczego np.
pe jest moderatorem jakiej zalenoci, cho wiemy, w jaki sposb j zmienia.
Jednak identyfikacja moderatora zalenoci jest zwykle przynajmniej pierwszym
krokiem w kierunku zrozumienia, dlaczego zaleno ta istnieje. Np. dobrze wiadomo
z licznych bada, i kobiety intensywniej przeywaj swoje emocje ni mczyni (a
wic pe jest moderatorem intensywnoci uczu w reakcji na emotogenne bodce).
Michele Grossman i Wendy Wood (1993) wykazay, e ta rnica pci ronie wraz ze
wzrostem stopnia, w jakim porwnywane kobiety i mczyni wierz w istnienie
oglnych rnic midzy kobietami (uczuciowymi i impulsywnymi) a mczyznami
(opanowanymi i racjonalnymi). Kiedy jednak badanych poinstruowano, e waciwa
reakcja na pokazywane im fotografie pewnych scenek polega na odczuwaniu silnych
emocji, albo sabych emocji, rnice midzy pciami zanikay zarwno gdy
emocjonalno reakcji mierzono za pomoc samoopisw, jak i wskanikw
fizjologicznych (m.in. EMG). Rnice owe pozostaway widoczne w tej grupie
mczyzn i kobiet, w ktrej nie wpywano w aden sposb na normatywne
przekonania co do emocjonalnego reagowania na pokazywane im bodce. W ten
sposb autorki wykazay, i mediatorem (porednikiem) zwizku midzy
emotogennymi bodcami, a intensywnoci reakcji emocjonalnych s normatywne
przekonania dotyczce tego, jaki stopie emocjonalnoci reakcji jest w danej sytuacji
waciwy. Pe jest moderatorem tego zwizku dlatego, i elementem stereotypu pci
(z ktrym ludzie si identyfikuj) s normatywne przekonania dotyczce siy
reagowania na bodce emotogenne.

7. Metaanaliza: ilociowa integracja wynikw rnych bada


Czy hutawka emocjonalna jest skuteczn technik manipulacji spoecznej?
Odpowiadajc na to pytanie jestemy w dosy komfortowej sytuacji, poniewa
wszystkie (i jak dotd nieliczne) znane badania na ten temat maj t sam wymow
wszystkie wskazuj na skuteczno hutawki. Jest to jednak sytuacja raczej
wyjtkowa, bowiem w przypadku wikszoci problemw psychologicznych (jak
skuteczno psychoterapii, wpyw postaw na zachowanie, rnice midzy kobietami i
mczyznami pod wzgldem zdolnoci werbalnych, matematycznych czy agresji)
istniej liczne badania o nierzadko sprzecznych wynikach. W takiej sytuacji
konieczna jest jaka integracja istniejcych wynikw bada, ktrej dokonywa mona
na dwa sposoby za pomoc jakociowej narracji i ilociowej metaanalizy.
Jakociowa narracja to tworzenie wewntrznie spjnej interpretacji, czyli
opowieci o wynikach dotyczcych danej zalenoci czy zaleno istnieje, jak
jest jej zwyka sia, jakie s wyjtki od reguy, kiedy zdaje si ona pojawia, a kiedy
zanika i dlaczego. Ten tradycyjny sposb podsumowywania wynikw rnych
bada ma jednak zasadnicz wad poniewa dochodzenie do konkluzji nie jest w
nim podporzdkowane jasnym i sformalizowanym reguom, tre wyciganych
konkluzji silnie zaley od pogldw osoby, ktra je formuuje. Oczywicie, konkluzje
19

okazuj si zwykle zgodne z pogldami autora. Jeeli wic jaki zbir wynikw jest
niejednorodny (co w psychologii, jak i w nauce w ogle, stanowi raczej regu ni
wyjtek), podsumowujcy go autorzy o rnych pogldach mog doj do zgoa
odmiennych wnioskw w oparciu o te same dane. Tego mankamentu nie ma
metaanaliza ilociowa metoda integrowania w cao wynikw rnych bada nad
tym samym problemem. Metaanaliza opiera si na prostej logice, ktr mona opisa
w czterech krokach.
Krok pierwszy to odnalezienie wszystkich bada na dany temat. W przypadku
hutawki emocjonalnej zadanie jest proste, poniewa wykonano na ten temat
niewiele i stosunkowo niedawnych bada. Oprcz piciu opisanych eksperymentw,
opublikowano jeszcze jedno tylko badanie opisywane przez Doliskiego (1997).
Jednake nad skutecznoci psychoterapii, czy rnicami pciowymi pod wzgldem
agresji wykonano dosownie setki bada i ich odnalezienie jest nieatw sztuk (du
pomoc s tu komputerowe bazy danych w szczeglnoci prowadzony przez
American Psychological Association baza PsychLit zawierajca streszczenia
niemale wszystkich artykuw, jakie ukazay si w rnych jzykach od roku 1887
do chwili obecnej).
Krok drugi to selekcja bada do metaanalizy odrzucenie tych, ktre
zawieraj niepene dane lub z jakich wzgldw s niewiarygodne np. w przypadku
skutecznoci psychoterapii odrzucimy badania bez grupy kontrolnej nie poddanej
psychoterapii. Ustalenie kryteriw wiarygodnoci wyniku powinno oczywicie
poprzedza faktyczn metaanaliz, tak aby jej wyniki nie mogy wpywa na tre
kryteriw.
Krok trzeci to ustalenie jakiego miernika siy rozwaanego efektu
jednakowego dla wszystkich bada. W przypadku hutawki emocjonalnej moe to
by rnica odsetka osb ulegajcych wpywowi spoecznemu w warunkach hutawki
i neutralnych. Rnica ta jest rwnowana wspczynnikowi korelacji, o czym si
zaraz przekonamy. Czsto uywanym wskanikiem siy efektu jest statystyka d
Cohena (1988), czyli standaryzowana rnica midzy rednimi porwnywanych grup
(np. rnica midzy redni emocjonalnoci mczyzn i kobiet wyraona w
jednostkach odchylenia standardowego cznego rozkadu emocjonalnoci obu tych
grup). Statystyka d i wspczynnik korelacji r Pearsona s zreszt wzajemnie
przekadalne istniej reguy przeliczania jednaj na drug (Cohen, 1988; Rosenthal,
1991b).
Wreszcie krok czwarty to ustalenie, jaka jest warto rednia owego
wskanika siy efektu w jakiej grupie bada, zwykle we wszystkich dostpnych
badaniach na dany temat speniajcych jakie minimalne wymogi metodologiczne.
Towarzyszy temu z reguy oszacowanie przedziau ufnoci dla tej redniej oraz test
homogenicznoci efektu, a wic sprawdzenie, czy w danej grupie bada wskanik
siy efektu jest jednorodny, czy te nie. Tego rodzaju testy zwykle wskazuj na
niejednorodno, a wic e rozsiew wskanika siy efektu jest wikszy ni wynikaoby
to z samego przypadku, co pozwala stawia i sprawdza hipotezy co do
domniemanych przyczyn tego zrnicowania.
redni wspczynnik korelacji hutawka-uleganie w szeciu opublikowanych
badaniach na ten temat wynis 0,28. Co to znaczy? Jak ilustruje tabela 3, bez
hutawki rnym probom ulegao, rednio rzecz biorc, 33% nagabywanych, za w
warunkach hutawki byo to ju 61%. Rnica midzy tymi warunkami to wanie 28,
czyli wspczynnik korelacji pomnoony przez 100 (Rosenthal i Rubin, 1982).
--- tutaj Tabela 3 ---
20

Czy wzrost odsetka osb ulegajcych wpywowi spoecznemu o 28% to duo


czy mao? Odpowied w oczywisty sposb zaley od kontekstu przed wszystkim od
treci wpywu spoecznego. Wzrost o 28% osb ulegajcych probie o zoenie
niewielkiego datku pieninego, mona uwaa za may lub umiarkowany. Gdyby
jednak proba dotyczya darowania miliona dolarw albo ycia, to wzrost jej
skutecznoci o 28% naleaoby uzna za spraw pierwszorzdnej wagi. To czy jaka
zaleno jest silna czy saba, zaley wic nie tylko od wielkoci wspczynnika
korelacji, ale i od tego, czego on dotyczy. Chyba najlepszym tu przykadem jest
przytaczane przez Rosenthala (1991b) badanie nad skutkami zaywania aspiryny
prowadzone na prbie ponad 22 tysicy lekarzy. Losowo wybrana poowa z nich
zaywaa co 2 dzie tabletk aspiryny, druga poowa zaywaa placebo. Po pewnym
czasie eksperyment ten przerwano z powodw etycznych, bowiem okazao si i
aspiryna hamuje zapadalno na zawa serca. Korelacja midzy zaywaniem
aspiryny a zapadaniem na zawa wynosia przy tym 0,04 (!), bya wic tak maa, e w
standardowym badaniu psychologicznym nie zostaaby w ogle odnotowana. A
jednak ta korelacja przekadaa si na pewn liczb ludzkich istnie i to wystarczyo
autorom badania do przerwania eksperymentu, by poinformowa wszystkich jego
uczestnikw o poytkach aspiryny.
Konkluzje
Repetitio est mater studiorum (powtarzanie jest matk wiedzy) powiada znana
maksyma nawizujca do losu redniowiecznych akw, ktrzy siedzc na
drewnianych awach uczyli si aciny chralnie powtarzajc za magistrem zdania w
tym jzyku. Powtarzanie jest take matk wiedzy psychologicznej, tyle, e nie jest to
powtarzanie mechaniczne, ale konstruowanie cigu bada, w ktrych pewne
elementy dokadnie si powtarzaj, inne za s celowo zmieniane, wedug strategii
SMAR Systematycznie Modyfikowanych Auto-Replikacji. Jak staraem si pokaza,
SMAR suy co najmniej siedmiu nastpujcym celom: (1) replikacji podstawowego
efektu, (2) sprawdzaniu skutecznoci manipulacji, (3) polepszaniu trafnoci
wewntrznej, (4) polepszaniu trafnoci zewntrznej, (5) eliminacji alternatywnych
wyjanie, (6) poszukiwaniu moderatorw efektu oraz (7) poszukiwanie mediatorw
efektu. Wspczesna psychologia akceptuje jako rzeczywiste tylko prawidowoci
wielokrotnie uzyskiwane w programach bada, w ktrych zrealizowano przynajmniej
wikszo wymienionych celw.
Cho wielu badaczom powtarzanie wynikw wasnych bada wydaje si
przedsiwziciem nudnym i niepotrzebnym, zgromadzone tu argumenty przekonuj,
mam nadziej do tezy, e w istocie bez powtarzania waciwie nie sposb udowodni
czegokolwiek w psychologii rozumianej jako nauka empiryczna. Nie sposb
dowiedzie si, jaka jest badana rzeczywisto, a dokadniej czy rzeczywisto
przedstawia si tak, jak to zakada nasza teoria.
Kto SMARuje ten jedzie bez elementw tej strategii nie sposb uzyska
sensownych, wiarygodnych i poddajcych si jednoznacznej interpretacji danych
empirycznych. Dodajmy, e bez tej strategii nie sposb take opublikowa wynikw
bada w dobrym czasopimie, cieszcym si midzynarodowym uznaniem i
czytanym w wiecie, a wic przez liczniejsz grup osb ni nasi znajomi, ktrym i
tak o swoich badaniach ju opowiedzielimy. Oczywicie, SMARowanie, jak (prawie)
wszystko, naley stosowa z umiarem nie sposb czeka z publikacj wyniku na
cakowite spenienie wszystkich siedmiu omwionych tu celw programu
badawczego. Nie sposb jednak oczekiwa od krytycznych czytelnikw, aby
uwierzyli w jednorazowo uzyskany efekt, ktrego nawet nam samym nie udao si
powtrzy.
21

BIBLIOGRAFIA
Baron, R. M., Kenny, D. A (1986). The moderator-mediator variable distinction in
social psychological research: Conceptual, strategic, and statistical
considerations. Journal of Personality and Social Psychology, 51, 1173-1182.
Baziska, R., Wojciszke, B. (1996). Drawing inferences on moral and competence-
related traits. Polish Psychological Bulletin, 27, 293-299.
Brzeziski, J. (1996). Metodologia bada psychologicznych. Warszawa:
Wydawnictwo Naukowe PWN.
Buss, D. M. (1996). Ewolucja podania. Strategie doboru seksualnego ludzi.
Gdask: Gdaskie Wydawnictwo Psychologiczne.
Buss, D. M. i in. (1990). International preferences in selecting mates: A study of 37
cultures. Journal of Cross-Cultural Psychology, 21, 5-47.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Wyd. 2.
Hillsdale, NJ: Erlbaum.
Doliski, D. (1997). O niektrych konsekwencjach nagego wycofania rde emocji.
Przegld Psychologiczny, 40, 9-20.
Doliski, D., Nawrat, R. (1994). Hutawka emocji jako nowa technika manipulacji
spoecznej. Przegld Psychologiczny, 37, 7-20.
Doliski, D., Nawrat, R. (1998). Fear-then-relief procedure for producing
compliance: Beware when the danger is over. Journal of Experimental Social
Psychology, 34, 27-50.
Eckes, T., Six, B. (1992). Fakten und Fiktionen in der Einstellungs-Verhalktens-
Forschung: Eine Meta-Analyse. Zeitschrift fr Sozialpsychologie, 253-271.
Ernst, C., Angst, J. (1983). Birth order: Its influence on personality. Berlin:Springer-
Verlag.
Fishbein, M., Ajzen, I. (1975). Belief, attitude, intention and behavior. An introduction
to theory and research. Reading: Addison-Wesley.
Fiske, S. T., Kenny, D. A, Taylor, S. E. (1982). Structural models for the mediatopn of
salience effects on attribution. Journal of Experimental Social Psychology, 18,
105-127.
Gardner, M. (1957). Fads and fallacies in the name of science. New York: Dover
Publications, Inc.
Grossman, M., Wood, W. (1993). Sex differences in intensity of emotional
experience: A social role interpretation. Journal of Personality and Social
Psychology, 65, 1010-1022.
Harris, J. R. (2000). Geny czy wychowanie? Co wyronie z naszych dzieci i
dlaczego. Warszawa: Jacek Santorski & Co.
Hensley, W. E. (1991). Pupillary dilation revisited: The constriction of a nonverbal
cue. W: J. W. Neuliep (red.) Replication research in behavioral sciences (s.
97-104). Newbury Park, C. A.: Sage Publications.
Hess, E. H. (1975). The tell-tale eye. New York: Van Nostrand Reinhold.
Ito, T. A., Miller, N. Pollock, V. E. (1996). Alcohol and aggression: A meta-analysis on
the moderating effects of inhibitory cues, triggering events, and self-focused
attention. Psychological Bulletin, 120, 60-82.
Kraus, S. J. (1995). Attitudes and the prediction of behavior: A meta-analysis of the
empirical literature. Personality and Social Psychology Bulletin, 21, 58-75.
Lang, A. R., Goeckner, D. J., Adesso, V. J., Marlatt, G. A. (1975). Effects of alcohol
on aggression in male social drinkers. Journal of Abnormal Psychology, 84,
508-518.
22

Neuliep, J. W., Crandall, R. (1991). Editorial bias against replication research. W: J.


W. Neuliep (red.) Replication research in behavioral sciences (s. 85-90).
Newbury Park, C. A.: Sage Publications.
Pratkanis, A. R., Eskenazi, J., Greenwald, A. G. (1994). What you expect is what you
believe (but not necessarily what you get): A test of the effectiveness of
subliminal self-help audiotapes. Basic and Applied Social Psychology, 15,
251-276.
Rosenthal, R. (1991a). Replication in behavioral research. W: J. W. Neuliep (red.)
Replication research in behavioral sciences (s. 1-30). Newbury Park, C. A.:
Sage Publications.
Rosenthal, R. (1991b). Meta-analytic procedures for social research. Wyd. 2,
zmienione. Newbury Park, CA: Sage
Rosenthal, R., Rubin, D. B. (1982). A simple, general purpose display of magnitude
of experimental effect. Journal of Educational Psyhcology, 74, 166-169.
Schooler, C. (1972). Birth order effects: Not here, not now. Psychological Bulletin, 78,
161-175.
Sdek, G. (1995). Bezradno intelektualna w szkole. Warszawa: Wydawnictwo
Instytutu Psychologii PAN.
Stapel, D. A. (2000). Moving from fads and fashions to integration: Illustrations from
knowledge accessibility research. European Bulletin of Social Psychology, 12,
4-27.
Wojciszke, B. (1994). Multiple meanings of behavior: Construing actions in terms of
competence or morality. Journal of Personality and Social Psychology, 67,
222-232.
Wojciszke, B. (1999). Grzech czy poraka? Moralne i sprawnociowe kategorie w
potocznym rozumieniu wiata spoecznego. W: B. Wojciszke i M. Jarymowicz
(red.) Psychologia rozumienia zjawisk spoecznych (ss. 34-51). Warszawa:
PWN.
Wojciszke, B., Baziska, R., Jaworski, M. (1998). On the dominance of moral
categories in impression formation. Personality and Social Psychology
Bulletin, 12, 1245-1257.

Tabela 1. Przykad replikacji udanej wedug kryterium siy efektu, a nieudanej wedug kryterium

istotnoci statystycznej (za Rosenthalem, 1991a, s. 15).

Badacz

_________________________

Kowalski Nowak cznie

rednia grupy eksperymentalnej 0,38 0,36 0,376

rednia grupy kontrolnej 0,26 0,24 0,256


23

Wielko rnicy 0,12 0,12 0,120

Test t 2,21 1,06 2,45

Liczba stopni swobody (df) 78 18 96

Dwustronne p 0,03 0,30 0,02

Wskanik siy efektu d 0,50 0,50 0,50

Wskanik siy efektu r 0,24 0,24 0,24

Statystyka z 2,17 1,03 2,40


24

Tabela 2. Odsetki osb ulegajcych prbom wpywu w rnych warunkach poszczeglnych

eksperymentw skadajcych si na program bada nad hutawk emocjonaln (zacienione

warunki ulgi)

-----------------------------------------------------------------------------------------------------------------
Eksperyment 1 (zgoda na wypenienie kwestionariusza)
Przechodzcy ulic gwizdek 59
Przechodzcy ulic bez gwizdka 46
Idcy wzdu chodnika 41
Eksperyment 2 (zgoda na wypenienie kwestionariusza)
Kartka za wycieraczk 62
Kartka na drzwiach 37
Brak kartki 36
Eksperyment 3 (zgoda na wypenienie kwestionariusza)
Reklama za wycieraczk 62
Wezwanie na policj za wycieraczk 8
Reklama na drzwiach 38
Brak kartki 32
Eksperyment 4 (zgoda na udzia w kwecie)
Oczekiwanie na wstrzsy elektryczne 38
Oczekiwanie na wstrzsy, potem wycofanie 75
Oczekiwanie na badanie koordynacji 53
Eksperyment 5 (zoenie datku pieninego)
Przechodzcy ulic gwizdek
Tylko proba 39
Proba z uzasadnieniem pozornym 76
Proba z uzasadnieniem rzeczywistym 72
Przechodzcy ulic bez gwizdka
Tylko proba 11
Proba z uzasadnieniem pozornym 15
Proba z uzasadnieniem rzeczywistym 58
-----------------------------------------------------------------------------------------------------------------
(rdo: Doliski i Nawrat, 1994)
25

Tabela 3. redni odsetek osb ulegajcych probie w warunkach hutawki


emocjonalnej i braku hutawki wyniki metaanalizy.

Brak hutawka
hutawki emocjonaln
a
Ulegli 33 61
Nie ulegli 67 39
Razem 100 100

Uwaga: Metaanalizie poddano wyniki 5 eksperymentw Doliskiego i Nawrata (1998)


i 1 eksperymentu A. Borkowskiej cytowanego przez Doliskiego (1997).
26

Rysunek 1. Dominacja kategorii moralnych w spostrzeganiu - ocena osoby


przejawiajcej zachowania moralne lub niemoralne, a przy tym sprawne bd
niesprawne (Wojciszke, Baziska i Jaworski, 1998).

3,5

1,19
1
Ocena globalna

niesprawne
0
sprawne
niemoralne moralne

-1

-2 -2,11

-2,77
-3

-4
Moralno zachowa
27

Rysunek 2. Dominacja kategorii moralnych nad sprawnociowymi w interpretacji


zachowa cudzych (perspektywa obserwatora) i sprawnociowych nad moralnymi
(perspektywa aktora) (Wojciszke, 1994).
5
sprawno 4,46
4,2 moralno

4
natenie interpretacji

3 2,73
2,62

0
aktor obserwator
perspektywa
28

MODERATOR MEDIATOR

Zmienna Zmienna
1. A 3.
D
F
Zmienna B Zmienna Zmienna E Zmienna
3. 2. 1. 2.
C
Interakcja
1x3

Rysunek 3. Schematyczne ilustracje pojcia moderatora i mediatora wedug Barona i


Kennyego (1986).

Вам также может понравиться