Академический Документы
Профессиональный Документы
Культура Документы
ZA STUDENTE PSIHOLOGIJE
Denana Husremovi
Osnove psihometrije
Za studente psihologije
Denana Husremovi
Sarajevo, 2016.
Denana Husremovi
OSNOVE PSIHOMETRIJE ZA STUDENTE PSIHOLOGIJE
Urednik:
Dr. Salih Foo
Recenzenti:
Dr. Nermin apo
Dr. ore ekrlija
Lektor:
Meliha Kemer
Izdanje:
Prvo
Izdava:
Filozofski fakultet Univerziteta u Sarajevu
Sarajevo, 2016.
Elektronsko izdanje
http://www.ff-eizdavastvo.ba/Knjige.aspx
SAETAK
Osnove psihometrije za studente psihologije je prirunik namijenjen lakem
razumijevanju i praenju nastave iz predmeta Psihometrija. U priruniku su prikazani
osnovni pojmovi, koncepti i odnosi u psiholokim mjerenjima. Prvi dio knjige odnosi se na
opis osnovnih postulata mjerenja u drutvenim znanostima. Definira se mjerenje, pravila
mjerenja, te problemi s primjenom pravila u ispitivanju ljudskih karakteristika. Potom se
definira psiholoki test i njegove karakteristike koje ga razlikuju kao dijagnostiko sredstvo
od drugih naina prikupljanja podataka. U poglavlju koje se odnosi na formiranje uratka na
testu detaljno se obrazlau naini kako razliite kombinacije u formiranju uratka utjeu na
metrijske karakteristike testa. Najvanija poglavlja u priruniku odnose se na ispitivanje
metrijskih karakteristika: pouzdanosti, osjetljivosti, valjanosti i pristranosti. U poglavlju o
pouzdanosti diskutira se o tome to je pouzdanost, kako se empirijski provjerava pouzdanost
testa, determinante pouzdanosti, glavne kritike odreivanja pouzdanosti prema Klasinoj
testnoj teoriji, te se prikazuju osnovni koncepti Teorije generalizabilnosti. U poglavlju o
osjetljivosti testa, daje se pregled glavnih determinanti osjetljivosti zadataka i testa te se
pravi poveznica izmeu osjetljivosti, pouzdanosti i valjanosti. Poglavlje o valjanosti daje
pregled suvremenih pogleda na valjanost i njene osnovne tipove konstruktnu valjanost kao
centralni pojam, te dokaze o valjanosti kroz sadraj testa, unutarnju strukturu, povezanost
sa drugim mjerama, psiholoke procese i posljedice testiranja. Poseban znaaj u priruniku
dat je pristranosti u testiranju koja u dananjem vremenu ima veliki znaaj. Poglavlje o
pristranosti prua informacije o vanosti paljivog prijevoda instrumenata, metodama
utvrivanja pristranosti i nainima minimizacije i prevencije pristranosti kako se testovima
ne bi poticala nejednakost u tretmanu grupa ili pojedinaca.
PREDGOVOR
Dragi studenti,
Na samom poetku, da se razumijemo va ivot i nain kako danas doivljavate sebe sigurno je
dijelom oblikovan psiholokim testiranjima. Vi ste kao uenici bili ispitanici u psiholokim
testiranjima, ako nita onda u vidu testova znanja. Vjerovatno niste razmiljali o njima na
znanstveni nain (a i ko bi kada je u tim trenucima samo bitno dobiti dobru ocjenu), ali ti testovi
su svojim kvalitetom utjecali na to da vi o sebi razmiljate kao o nekome kome npr. dobro ide
matematika, ali nije ba dobar u nekom drugom predmetu. Psiholoka testiranja mogu imati i
mnogo ozbiljnije posljedice od toga da li e neko imati 4 ili 5 iz kolskih predmeta. Na primjer,
psiholokim testiranjima utvruje se stepen uraunljivosti neke osobe koja tvrdi da je u trenutku
kada je ubila nekoga bila neuraunljiva. Ukoliko se utvrdi postojanje neuraunljivosti, osoba e
sluiti blau kaznu (ili je moda nee ni sluiti). Pitanje koje sebi postavljamo je: kako moemo biti
sigurni da rezultat testa zaista odraava neuraunljivost? U Sjedinjenim Amerikim Dravama
psiholoki testovi mogu biti pitanje ivota i smrti. U dravama u kojima je dozvoljena smrtna
kazna, osobi koja ima ograniene mentalne sposobnosti smrtna kazna ne moe biti izreena. Kako
moemo biti sigurni da postignuti rezultat na testovima mentalnih sposobnosti doista odraava
stvarno stanje neke karakteristike i, posljedino, kako moemo biti sigurni da smrtna kazna nije
izreena osobi s ogranienim sposobnostima? injenica da itate ovu skriptu govori o tome da
ete u budunosti, u svojoj karijeri biti ne samo korisnik testova nego i njihov kreator, te da ete
biti u situaciji u kojoj ete morati donositi odluke na osnovu rezultata na psiholokim testovima.
Stoga je poznavanje psihometrije jedna od kljunih kompetencija svakog budueg psihologa. Ova
skripta namijenjena je ba vama kako bi vam olakala razumijevanje psihometrije kao psiholoke
discipline i kao osnove znanstvene psihologije, te kako bi vas pripremila za vau buduu karijeru
socijalnog znanstvenika.
Moji studenti nauili su me mnogo toga to me vodilo u pisanju ovog prirunika.
1. Nauila sam da nemali broj studenata upisuje psihologiju, mislei kako na tom studiju nee
morati uiti nita vezano za matematiku. Vjeruju kako e konano zaboraviti i osnovne
raunske operacije, a onda se jako iznenade kada shvate da su prve godine studija psihologije
posveene uglavnom Psiholokoj metodologiji i predmetima kao to su Metodologija
istraivanja, Statistika i Psihometrija. Ovaj raskorak u oekivanjima i stvarnim zahtjevima
utjee na njihovu percepciju samoefikasnosti. Vide sebe kao nedovoljno efikasne u
razumijevanju psihometrije i razvijaju ciljnu orijentaciju u uenju koja se najbolje moe
objasniti reenicom Samo da se ovo poloi. Zato sam eljela da ova knjiga bude lagana za
koritenje, da objanjenja budu pristupana i razumljiva studentima koji nisu vjerovali da e
se na studiju baviti matematikom i da im poalje poruku kako svako ko eli moe savladati
psihometriju i uivati u njoj.
2. Takoer sam nauila da studenti ne vole debele knjige. U pripremama za ispit, oni se teko
snalaze u debelim knjigama pri traenju najvanijih informacija. Za njih je bolja strategija
pisanja prirunika fokusiranih na odreeni sadraj, praenih saecima za predavanja sa
ii
iii
SADRAJ
Saetak ............................................................................................................................................. i
Predgovor .........................................................................................................................................ii
1
1.1
1.2
2
2.1
2.1.1
2.1.2
2.1.3
2.2
2.2.1
2.2.2
2.3
2.3.1
2.3.2
2.3.3
2.3.4
2.4
2.4.1
2.4.2
3
3.1
3.2
3.3
3.4
4
4.1
4.2
4.3
4.4
4.5
4.5.1
4.5.2
Matrice........................................................................................................................ 24
5
URADAK NA TESTU ......................................................................................................... 31
5.1
TRANSFORMACIJE REZULTATA ................................................................................................. 31
5.1.1
Jednostavne linearne transformacije ......................................................................... 32
5.1.2
Sloene (viestruke) linearne transformacije .............................................................. 34
5.1.3
Nelinearne transformacije .......................................................................................... 36
5.2
FORMIRANJE UKUPNOG URATKA NA TESTU LINEARNE KOMBINACIJE ............................................. 37
5.2.1
Aritmetike sredine i varijance linearnih kombinacija................................................ 38
5.2.2
Korelacije linearnih kombinacija i drugih varijabli ..................................................... 41
5.2.3
to moemo koristiti za ponderiranje rezultata? ....................................................... 46
6
6.1
6.1.1
6.1.2
6.1.3
6.1.4
6.2
6.2.1
6.2.2
6.2.3
6.2.4
6.3
6.3.1
6.3.2
6.3.3
6.3.4
6.3.5
6.4
6.5
6.5.1
6.5.2
6.5.3
POUZDANOST ................................................................................................................. 48
KLASINA TESTNA TEORIJA ..................................................................................................... 48
Struktura bruto rezultata ............................................................................................ 49
to je pouzdanost? ...................................................................................................... 51
Pouzdanost i standardna pogreka mjerenja ............................................................. 54
Paralelne forme .......................................................................................................... 55
EMPIRIJSKO ODREIVANJE POUZDANOSTI .................................................................................. 57
Pouzdanost kao stabilnost karakteristike u vremenu................................................. 57
Pouzdanost kao unutarnja konzistencija .................................................................... 59
Pouzdanost linearnih kombinacija.............................................................................. 66
Odreivanje pouzdanosti analizom varijance ............................................................ 69
O EMU OVISI POUZDANOST TESTOVA? .................................................................................... 73
Homogenost uzorka i pouzdanost .............................................................................. 73
Broj pitanja i pouzdanost ............................................................................................ 74
Pogreka mjerenja korelacija pouzdanost ............................................................ 76
Konzistencija pitanja i pouzdanost ............................................................................. 78
Kako pouzdanost primjenjujemo u praksi regresijski model pouzdanosti .............. 81
KRITIKE KLASINE TESTNE TEORIJE ............................................................................................ 85
TEORIJA GENERALIZABILNOSTI ................................................................................................. 86
Tipovi univerzuma i tipovi faceta ................................................................................ 88
G i D studije ................................................................................................................. 89
Odreivanje koeficijenta generalizabilnosti ............................................................... 89
7
OSJETLJIVOST TESTA ....................................................................................................... 94
7.1
POGAANJE I KOREKCIJE ZA POGAANJE .................................................................................... 94
7.1.1
Korekcije za pogaanje na nivou zadatka .................................................................. 95
7.1.2
Korekcije za pogaanje na testu................................................................................. 95
v
7.2
ANALIZA ZADATAKA .............................................................................................................. 96
7.2.1
Kvalitativna analiza zadataka .................................................................................... 97
7.2.2
Kvantitativna analiza zadataka .................................................................................. 97
7.3
OSJETLJIVOST TESTA ........................................................................................................... 110
7.3.1
Kako identificiramo osjetljivost testa ....................................................................... 111
7.3.2
O emu ovisi osjetljivost testa .................................................................................. 112
8
8.1
8.2
8.2.1
8.3
8.3.1
8.3.2
8.4
8.4.1
8.4.2
8.4.3
8.5
8.6
9
9.1
9.1.1
9.1.2
9.2
9.2.1
9.2.2
9.2.3
9.3
9.4
9.4.1
9.4.2
9.4.3
9.4.4
9.4.5
9.5
9.6
9.6.1
9.6.2
9.6.3
10
vii
3. Pravilna primjena testova i interpretacija testovnih rezultata kada kao diplomirani psiholog
budete radili u praksi ili istraivanjima, od velike vanosti e biti da znate odabrati testove, da
ih znate pravilno primijeniti, da znate interpretirati dobivene rezultate, te da znate
ogranienja vaih zakljuaka
4. Stjecanje znanja potrebnih za konstrukciju novih testova ili za standardizaciju i adaptaciju
postojeih od psihologa se oekuje ne samo da znaju primijeniti testove, nego i da znaju
konstruirati test za mjerenje neke karakteristike. Konstrukcija testa, kao i proizvodnja bilo
kojeg drugog mjernog instrumenta, zahtijeva vjetog konstruktora, a sutra to trebate biti
upravo vi.
2 MJERENJE U PSIHOLOGIJI
to je mjerenje u psihologiji? Po emu se razlikuju mjerenje u fizici i mjerenje u
psihologiji? to je mjerenje preferencije okolade, a to stava prema konzumaciji
okolade?
Znanost je definirana sa dvije stvari: ona ima objekt prouavanja i ima metode prouavanja.
Objekt prouavanja moe biti fizike prirode, ali moe biti i nefizike u uem smislu rijei.
Mjerenje je izuzetno vano u svakoj znanosti. Iako mjerenje u znanosti ima vrlo dugu tradiciju
(Leahey, 2001), sama znanost o mjerenju posebno se razvila u posljednjih stotinu godina. Taj
znaajni razvoj znanosti o mjerenju moemo pripisati potrebi stvaranja preduvjeta za razvoj
drugih znanosti koje se bave istraivanjem, primjenom znanstvenih spoznaja u svakodnevnom
ivotu i poveanjem korpusa znanja o razliitim fenomenima (posebno drutvenim). Svi
znanstvenici zainteresirani su za stjecanje spoznaja koje su objektivne, precizne i provjerljive. Cilj
svakog znanstvenika je da prikupi podatke o nekom objektu, fenomenu ili sistemu na to
objektivniji i precizniji nain. Osim toga, objekti ili fenomeni vrlo rijetko egzistiraju izolirani jedni
od drugih. To je razlog zato znanstvenici tee otkriti odnose meu objektima, objektivno
procijeniti kvalitetu tih odnosa i donijeti zakljuak o tome kako se taj odnos mijenja u
meuzavisnosti svih elemenata. Na taj nain znanstvenici mogu identificirati i objasniti fenomene
i sisteme te predviati promjene koje mogu nastati u budunosti.
Kroz mjerenje i kvantifikaciju, uz pomo matematikih modela i statistike, znanstvenici mogu
razluiti objekte i fenomene jedne od drugih, razlikovati njihove osobine, razumijevati
povezanosti i predviati promjene u budunosti, i to s visokim stepenom tanosti i detaljnosti.
Moemo zakljuiti da je mjerenje jedan od osnovnih elemenata znanstvenog istraivanja i
otkrivanja.
Indirektno mjerenje definira se kao standardizirani postupak pomou kojeg se neki psihiki
proces izaziva, pa se efekti tog procesa (tj. ispitanikove reakcije ) registriraju, a zatim se reakcije
pojedinog ispitanika mjere i vrednuju usporeujui ih s reakcijama dobivenim od drugih slinih
ispitanika u jednakoj situaciji. Za razliku od direktnog mjerenja, kod indirektnih mjerenja ne
moemo direktno opaati mjerenu karakteristiku. Ova onemoguenost direktnog opaanja
dovodi nas do niza problema. Prvi problem je kako mi uope definiramo predmet mjerenja (npr.
ta mislimo pod terminom "numerike sposobnosti"). Kada se i dogovorimo oko definiranja
predmeta mjerenja, imamo problem to ga ne moemo direktno opaati, nego o njemu moemo
zakljuivati samo na osnovu nekih vanjskih manifestacija za koje vjerujemo da su povezane s
predmetom mjerenja. Na primjer, o numerikim sposobnostima uenika zakljuujemo na osnovu
njegovog uratka na aritmetikom testu. I tu dolazimo do dilema vezanih za navedena pravila
mjerenja.
U prvom pravilu kae se da su dvije vrijednosti ili iste ili razliite. Zamislimo situaciju da ispitanici
odgovaraju na pitanje:
Tabela 2-1 prikaz jedne tvrdnje iz Upitnika za mjerenje kvalitete timskog rada
Tvrdnja
Nikada
1
Vrlo
rijetko
2
Ponekad esto
3
Gotovo
uvijek
5
Ukoliko dva ispitanika (Marko i Damir) stave oznaku ispod broja 1 (Nikada) vjerovat emo da se
ono to je opisano u tvrdnji ne deava nikada, niti jednom niti drugom, dok ukoliko oznae
razliite brojeve (npr. 1 i 2) vjerovat emo da se Marku opisano ponaanje ne deava nikada, a
Damiru vrlo rijetko. Meutim, vrlo je mogue da na zakljuak nije valjan. Neki od razloga zato
rezultati ne moraju biti valjani su:
1. Ispitanici nisu imali dovoljno podioka da se izraze. Na primjer, moda se to desilo jednom ili
dvaput, ali ni Marko ni Damir nisu nali broj koji bi ukazao na tu uestalost i odluili su se da
zaokrue 1 "Nikada". Dakle, mi emo vjerovati da se to nikada nije desilo, ali to nije prava istina.
2. Moda se to Marku nije nikada desilo, a Damir nikada nije razmiljao o tome, pa je odluio da
zaokrui 1. Dakle, oni opet nisu odgovarali iz iste take, ali mi zakljuujemo da su jednaki. Time
smo prekrili pravilo o identinosti brojeva jer ono to stoji iza brojeva nije identino.
3. Moda se to njima deava, ali oni ne ele priznati i daju odgovor 1. Mi zakljuujemo da su oni
jednaki i da se njima ovo ponaanje nikada ne deava, to opet nije tano.
4. Moda im se podjednak broj puta desilo da ne dobivaju povratne informacije, ali je Marko to
percipirao kao "Nikada" jer mu to nije bitno, a Damir kao "Vrlo rijetko" jer mu je to zasmetalo. Mi
zakljuujemo da izmeu njih postoji razlika, ali u osnovi ne vezana za opisano ponaanje, nego za
njihove percepcije. I opet nismo u pravu.
5
Samo na ovom jednom primjeru vidimo da je vrlo teko zakljuiti da postoji odnos identinosti
brojeva, simetrinost jednakosti te jednakosti brojeva. Jer zapamtimo, indirektno mjerenje je
takvo da mi razliitim intenzitetima neke pojave pripisujemo brojeve, o onda vrlo brzo
zaboravljamo da iza tih brojeva i ne moraju biti iste stvari. Ukoliko nisu zadovoljena prva pravila,
posljedino e se pojaviti problemi i na drugim pravilima, a sve ovo znaajno ugroava mjerenje
i zakljuke koje donosimo o ispitivanim fenomenima.
Zadatak za vas: Zadatak dva ispitanika bio je da ocijene koliko doivljavaju sljedee emocije na
skali od 1 do 5. Koje biste probleme mogli pretpostaviti kod mjerenja emocija na ovoj skali?
Tabela 2-2: prikaz mjerenja iz Upitnika raspoloenja
Uope ne ili
vrlo malo
1
Malo
Umjereno
Dosta
Jako
Zainteresirano
Budno
Pozorno
2.1.3 Atributi
Atributi su svojstva nekog objekta ili fenomena. U prirodnim znanostima obino se koristi termin
"svojstva" kako bi se razlikovao neki kvalitet ili kvantitet odreenog fizikog entiteta, dok u
socijalnim znanostima se ee koristi termin "atribut" kako bi se referiralo na neki
kvantitet/kvalitet ljudskog ili socijalnog fenomena.
Zato pria o atributima? Zbog toga to znanstvenici nikada ne ispituju itav objekt. Kada kaemo
ispitivanje ljudi, to nam ne znai nita. Ali, kada kaemo "ispitivanje inteligencije" ukazujemo
da ispitujemo inteligenciju kao atribut ili svojstvo koje posjeduju ljudi.
teinu od 4 kilograma. S druge strane, kada kombiniramo dva tijela koja imaju jednaku viskoznost
ili gustou uvijek dobijemo tu istu viskoznost, a ne dva puta veu viskoznost. Iz ovog opisa vidimo
koliko je teko razlikovanje kvantitativnih i kvalitativnih varijabli primijeniti u psihologiji. Iako
varijable kao to su sposobnosti ili znanje esto tretiramo kao kvantitativne, prema ovoj definiciji
one nisu kvantitativne (osoba iji je DQI 120 nikako nije dva puta inteligentnija od osobe koja ima
DQI 60).
Prema Cambellu, mjerenje se provodi i na jednoj i na drugoj vrsti varijabli. Ali, kvantitativne
varijable moemo mjeriti direktno, dok kvalitativne moemo mjeriti iskljuivo indirektno.
Glavne teze teorije mjerenja prema Campbellu su:
1. Ne moe se mjeriti objekt nego samo njegove osobine
2. Postoje dvije vrste osobina: kvantitativne i kvalitativne
3. Mjerenje se provodi i na kvantitativnim i na kvalitativnim osobinama, ali su razliiti pristupi
mjerenju
4. Mjerenje kvantitativnih osobina je preciznije i na viem nivou nego mjerenje kvalitativnih
osobina
5. Kvantitativne osobine povinuju se zakonitostima ili pravilima koje vae sa sabiranje i mjere se
direktno
6. Kvalitativne osobine se ne povinuju zakonitostima sabiranja i mjere se indirektno.
Skala
Nominalna
Ordinalna
Intervalna
Omjerna
Osnovna
empirijska Matematika grupna
operacija
struktura
Odreivanje jednakosti Permutacijske grupe
f(x) = x' pri emu je f(x)
bilo koja zamjena jedan
za jedan
Odreivanje vee - Izotone grupe
manje
F(x) = x' pri emu je f(x)
bilo koja monotona
rastua funkcija
Odreivanje jednakosti Generalne
linearne
intervala ili razlika
grupe
F(x) = ax + b
Odreivanje jednakosti Sline grupe
omjera
F(x) = ax
Dozvoljena statistika
Broj sluajeva
Modus
Kontingencijski
koeficijent
Centralna vrijednost
Percentili
Aritmetika sredina
Standardna devijacija
Pearsonova korelacija
Koeficijent
varijabilnosti (koji je isti
samo u sluaju kada se
mnoi s konstantom)
Nominalna skala je najjednostavnija forma mjerenja, a neki autori (prema Stevensu, 1946)
smatraju da nije primjereno ovo zvati mjerenjem. Meutim, ako je mjerenje "dodjeljivanje
brojeva prema nekom pravilu", onda potivanje pravila "ne smije se dodijeliti isti broj kao oznaka
za dvije razliite grupe" kvalificira nominalnu skalu kao mjerenje.
32
=
9
5
Temperatura od 30 celzija je prema formuli:
32
30
=
9
5
F - 32 = 6*9
F = 54 + 32
F = 86
Temperatura od 15 celzija je:
10
32
15
=
9
5
F - 32 = 3*9
F = 27+32
F = 59
Iz ovog primjera vidimo da dva puta vei broj na skali celzija nije i dva puta vei broj u farenhajtima.
Ovo vai i u obrnutom smjeru. Osim toga, unutar same skale kvalitativna razlika izmeu
temperatura nije proporcionalna njihovoj kvantitativnoj razlici. Temperatura od 30 celzija ne
znai da je dva puta toplije od temperature od 15 celzija.
Ovaj problem se velikim dijelom javlja zbog nepostojanja apsolutne nule kao take u kojoj neko
svojstvo ne postoji. Nedostatak apsolutne nule onemoguava koritenje vrste uporine take ili
sidra na osnovu koje bi se komparirala ostala opaanja.
Psiholozi tee da veinu mjerenja obavljaju na intervalnom nivou i ponekada u tome uspijevaju.
Mi mjerenja tretiramo kao intervalne skale prilikom odreivanja interesa, stavova, linosti
motivacije, vrijednosti i drugih psiholokih karakteristika. Skale dizajniramo tako da ponemo od
arbitrarne nule kao take u kojoj neka osobina ne postoji ili neko ponaanje se nikada ne ispoljava
i skaliramo da najviih intenziteta ili najveih frekvencija.
Primjer: Zamislimo da odreujemo uestalost odlaska na pozorine predstave esticom datom
ispod:
Ako je zaokruena 0, zakljuujemo
da ispitanik nikada nije bio u
0. Nikada
pozoritu. Ukoliko zaista nikada
1. Rijetko (jednom do dva puta godinje)
nije bio, onda je to stvarna 0. Ali
2. Ponekada (jednom do dva puta mjeseno)
mnogo je tei zadatak kreirati
3. esto (jednom sedmino)
mjernu skalu na kojoj e pojedini
podioci precizno reprezentirati
jednake razlike u sukcesivnom poveanju kvantiteta ispitivane varijable. Ako pogledamo u ovom
pitanju razliku izmeu odgovora 1 i 2 i odgovora 2 i 3, lako uoavamo da to nisu iste razlike. Koliko
god da je matematiki razlika 1 i 2 jednaka razlici 2 i 3 u frekvenciji odlazaka u pozorite, ta razlika
nije jednaka. Ukoliko nismo uspjeli postii jednakost intervala, bez obzira na to to se intervali
ine jednakim, mjerenje ostaje na ordinalnom nivou.
PITANJE: Koliko esto odlazite na pozorine predstave?
12
3 PSIHOLOKI TEST
Kada neki instrument moemo nazvati psiholokim testom? Kako dijelimo psiholoke
testove? Koja je svrha koritenja psiholokih testova?
Psiholoki test predstavlja glavno sredstvo za rad psihologa. Rije TEST koristi se u razliitim
kontekstima tako da je vano znati to podrazumijevamo pod terminom psiholoki test.
tiu objektivnosti procesa testiranja. Prvi kriterij je uniformnost procedure testiranja u svim
vanim aspektima, poevi od zadavanja testa, bodovanja do interpretacije rezultata. Cilj
standardizacije procedura je da se sve varijable vezane za ispitivaa stave pod kontrolu tako da
svaki ispitanik koji uestvuje u testiranju bude u istoj situaciji. Drugi kriterij je postojanje
standarda ili normi za evaluaciju rezultata. Norme (ili standardi) predstavljaju rezultate velikih
grupa ispitanika (koje zovemo i normativnim uzorkom) koji su prikupljeni u procesu razvijanja
testa. Ovi zbirni rezultati, njihova distribucija i parametri distribucije (prosjeci i varijabilitet) se
prikazuju u priruniku za test, a rezultat naeg ispitanika procjenjujemo na osnovu usporedbe
njegovog individualnog rezultata s rezultatima normativnog uzorka. Testovi koji ne zadovoljavaju
ove kriterije, odnosno nemaju izraene norme niti standardiziranu proceduru testiranja, zovemo
nestandardiziranim testovima ili kako bi profesor Bucik (1997) rekao testovima za domau
upotrebu.
zadatke e uspjeti da rijei zavisi od njegovih znanja ili sposobnosti. U testovima brzine zadaci su
obino lagani do srednje teki, ali je vrijeme rada ogranieno tako da ispitanik mora dosta brzo
procesirati informacije kako bi rijeio vie zadataka. Dakle, kod testova snage rezultat najvie
zavisi od sposobnosti, znanja ili vjetine ispitanika, dok kod testova brzine rezultat zavisi od brzine
procesiranja informacija (to moe biti bitno za razlikovanje ispitanika).
2) Istraivanja
Testovi se koriste u svim podrujima psihologije za istraivanja. Oni su nae najvanije sredstvo
za razumijevanje razvoja i odnosa meu kognitivnim, afektivnim i ponaajnim karakteristikama.
17
Ispitanik
Rezultat X
XM
Devijacijski rezultat
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
58
53
54
56
40
47
42
41
38
37
46
51
11
6
7
9
-7
0
-5
-6
-9
-10
-1
4
(X-M)2
Kvadrirani devijacijski
rezultat
121
36
49
81
49
0
25
36
81
100
1
16
18
58+53+54+56+40+47+42+41+38+37+46+51
12
= 46,9 47
==
( X p)
2
i
(X
2 pX p 2 )
N
19
Vbin =
, a to znai da
22
= 2 .
Vbin = p*q
4.3 VARIJANCA
Varijanca i s njom blisko povezana standardna devijacija pokazuju u kojoj mjeri pojedinani
rezultati odstupaju od aritmetike sredine. Varijanca se rauna prema formuli:
4-4
(X M )
V
N
2
i
2
i
4.4 KOVARIJANCA
Na to vas podsjea rije kovarijanca? Osnova rijei je varijanca, a prefiks ko- ukazuje da se odnosi
na neto zajedniko. Ako varijanca predstavlja variranje rezultata u jednoj varijabli, onda
kovarijanca predstavlja kovariranje rezultata za dvije varijable. Dakle, kovarijanca je stepen
povezanosti varijabiliteta izmeu dvije distribucije rezultata. Zamislimo da, pored mjere
zadovoljstva poslom, za iste ispitanike imamo i rezultate na upitniku stresa na poslu:
Tabela 4-2 Odreivanje kovarijance rezultata
Ispitanik
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
Aritmetika
sredina
Rezultat
na Rezultat
na Devijacijski
Skali
Skali stresa (Y) rezultat X
zadovoljstva
(X MX)
poslom (X)
58
53
54
56
40
47
42
41
38
37
46
51
46,9
1,53
1,74
1,58
1,53
1,68
2,42
1,70
2,79
2,53
2,74
3,26
1,53
2,1
11
6
7
9
-7
0
-5
-6
-9
-10
-1
4
Devijacijski
rezultat Y
(Y MY)
-0,55
-0,34
-0,5
-0,55
-0,4
0,34
-0,38
0,71
0,45
0,66
1,18
-0,55
Umnoak
devijacijskih
rezultata
(X MX) (Y
MY)
-6,05
-2,04
-3,5
-4,95
2,8
0
1,9
-4,26
-4,05
-6,6
-1,18
-2,2
21
( )( )
=
= 2,51
Sada se sigurno pitate kako je kovarijanca negativna kada varijanca moe biti samo pozitivnog
predznaka? Ovaj primjer je namjerno izabran kako biste uvidjeli da su varijanca i kovarijanca dvije
razliite stvari. Kovarijanca prua informaciju i o smjeru povezanosti dvije varijable. Kada je
kovarijanca pozitivna, onda postoji pozitivna povezanost izmeu varijabli, odnosno porast
rezultata u jednoj varijabli praen je tendencijom porasta rezultata u drugoj varijabli. Kada je
kovarijanca negativna onda je povezanost takva da porast rezultata u jednoj varijabli prati
tendencija sniavanja rezultata u drugoj varijabli. Da li vas ovo podsjea na neto to ste uili u
Statistici? U pravu ste, kovarijanca je slina korelaciji. Da vidimo kakva je veza kovarijance i
korelacije.
Kao to smo mogli vidjeti u prethodnom primjeru, kovarijanca se izraunava iz sirovih rezultata i
na visinu kovarijance utjeu skale na kojima su izraeni sirovi rezultati. S druge strane, korelacija
se izraunava na osnovu rezultata transformiranih u z-vrijednosti i njena formula je:
4-6
( )
( )
[( )( )]
Ako usporedite formulu za kovarijancu i korelaciju, primijetit ete razliku u brojniku. U kovarijanci
koristimo sirovi (bruto) devijacijski rezultat, a u korelaciji z-vrijednost. U nazivniku kod
kovarijance imamo samo N, dok kod kovarijance imamo i standardne devijacije. Korelacija je,
ustvari, standardizirana kovarijanca. Njihov odnos objanjava se formulom:
4-7
= , odnosno =
22
4.5.1 Vektori
Vektor je niz brojeva poredanih po odreenom redoslijedu u jednom stupcu (koloni) ili jednom
redu. Oznaavaju se malim slovima. U geometrijskoj prezentaciji, elementi vektora su take na
osama koordinatnog sistema tako da je, geometrijskim rjenikom reeno, broj elemenata vektora
odreen brojem osi koordinatnog sistema. Svaki element vektora ukazuje na poziciju na
odgovarajuoj osi. U koordinatnom sistemu sa dvije osi, prvi element vektora je taka na X osi, a
drugi element vektora taka na Y osi. Pojedini elementi vektora x oznaavaju se imenom vektora
i odgovarajuim indeksom, na primjer, vektor sa deset elemenata oznaava se sa xi pri emu je
i = 1,,10.
Kada vektori imaju brojeve poredane u stupcima (kolonama), zovemo ih stupani, a kada su
brojevi poredani u redu, vektor zovemo retani.
1
= (2)
3
= (1 2
3)
Dva vektora su jednaka ako i samo ako imaju sve elemente jednake i istog su oblika:
8
a=(8,5); b=(8,4); c=(8,5) d= ( )
5
ab; a = c; a d; b c; b d; c d
23
1
1
1 +1
( 2 ) + (2 ) = (2 +2 )
3
3 +3
3
1
1 1
1
(2 ) (2 ) = (2 2 )
3
3 3
3
( 2 ) = ( 2 )
3
3
Da bismo mogli mnoiti dva vektora, mora biti zadovoljen isti kriterij kao i kod matrica (jer su
vektori samo posebni oblik matrice sa jednim redom ili jednom kolonom) broj kolona u prvom
vektoru mora biti jednak broju redova u drugom vektoru. Rezultat mnoenja dva vektora
dobijemo tako da pomnoimo korespondentne elemente, a njihove produkte saberemo. Krajnji
produkt mnoenja dva vektora je broj ili skalar.
(1
1
3 ) (2 ) = 1 1 + 2 2 + 3 3 =
3
4.5.2 Matrice
Matrica je skup brojeva poredanih u m redova i n kolona (Fulgosi, 1988). Matricu opisujemo i kao
mxn matricu (na primjer matrica 4x5 znai da matrica ima 4 reda i 5 kolona). Svaki uneseni
24
rezultat zovemo elementom matrice, oznaavamo ga malim slovom sa dva broja u supskriptu pri
emu je prvi broj uvijek broj reda, a drugi broj uvijek broj kolone. Na primjer, c 23 je element c u
matrici C koji se nalazi u 2. redu i 3. koloni. Matrice se oznaavaju velikim slovima (X-matrica
bruto rezultata u testu, C matrica kovarijanci i sl.). Bruto rezultate prikazujemo u matrici bruto
rezultata u kojoj se u redovima nalaze ispitanici, a u kolonama rezultati na zadacima ili dijelovima
ispitivanja. Kovarijanna matrica ili matrica varijanci i kovarijanci je matrica koja kao elemente
sadri vrijednosti varijanci i kovarijanci izmeu dva seta rezultata:
Tabela 4-3 Primjer kovarijanne matrice
Varijabla 1
Varijabla 1
V1
Varijabla 2
c12
Varijabla 3
c13
Varijabla 4
c14
Varijabla 2
c21
V2
c23
c24
Varijabla 3
c31
c32
V3
c34
Varijabla 4
c41
c42
c43
V4
( 1)
2
25
Varijabla X
C1x
C2x
C3x
Varijabla 1
Varijabla 2
Varijabla 3
Varijabla Y
C1y
C2y
C3y
Varijabla Z
C1z
C2z
C3z
Jo jedan vaan pojam za matrice je transpon matrice. Transpon matrice je matrica izvedena iz
druge matrice, pri emu su elementi redova i stubaca zamijenili mjesta.
11
[ 21
31
12
11
22 ] + [21
32
31
12
11 + 11
22 ] = [21 + 21
31
31 + 31
12 + 12
22 + 22 ]
32 + 32
Na primjer:
1
[0
3
2
0] +
3
4
[3
5
1+4
3
]
=
[
0+3
4
3+5
5
2+3
5 5
]
=
[
0+4
3 4]
3+5
8 8
11
[21
31
12
11
22 ] [21
32
31
1 2
[0 0 ]
3 3
4
[3
5
12
11 11
22 ] = [21 21
31
31 31
12 12
22 22 ]
32 32
3
14 23
3 1
]
=
[
]
=
[
4
03 04
3 4]
5
35 35
2 2
primjer, ako mnoimo matricu A reda 3x2 s matricom B reda 2x3, dobit emo produktnu matricu
C reda 3x3, a ako mnoimo matricu B s matricom A, dobit emo matricu D reda 2x2. Dakle, za
matrice ne vai pravilo komutacije u mnoenju.
Zamislimo da imamo dvije matrice A i B.
11
A = [21
31
12
22 ] i B = [ 11
21
32
12
22
13
]
23
11
AxB = [21
31
12
22 ] [ 11
21
32
11 11 + 12 21
= [21 11 + 22 21
31 11 + 32 21
12
22
13
]=
23
11 12 + 12 22
21 12 + 22 22
31 12 + 32 22
11 13 + 12 23
21 13 + 22 23 ]
31 13 + 32 23
BxA =[ 11
21
12
22
11
13
] x [21
23
31
12
+ 12 21 + 13 31
22 ] = [ 11 11
21 11 + 22 21 + 32 31
32
11 12 + 12 22 + 13 32
]
21 12 + 22 22 + 23 32
Primjer:
1 4
A = [2 5 ]
3 6
7
B =[
10
1 4
7
A x B =[2 5] [
10
3 6
47
= [64
81
52
71
90
8
11
9
]
12
1 7 + 4 10
8
9
] = [2 7 + 5 10
11 12
3 7 + 6 10
1 8 + 4 11 1 9 + 4 12
2 8 + 5 11 2 9 + 5 12] =
3 8 + 6 11 3 9 + 6 12
57
78]
99
27
Ako zadanoj matrici oduzmemo jedan ili vie redova i stubaca, dobivamo minore matrice. Uvijek
se oduzima jednak red redova i stubaca. Ako se iz zadane matrice oduzme red j i stubac k, koji se
sijeku u elementu ajk, preostala determinanta se zove minor elementa ajk.
Elementima determinante se prilikom izvoenja operacija dodjeljuju predznaci tako da dva
susjedna elementa nemaju isti predznak. Ako minoru elementa ajk pridruimo pozicioni znak
elementa, dobivamo kofaktor elementa ajk.
Kako odreujemo kofaktor elementa? Pretpostavimo da elimo odrediti kofaktor elementa a11.
To emo uraditi tako da iz matrice odstranimo elemente prvog reda i prvog stupca. Elementi koji
ostaju tvore minor elementa a11 . Poto je ovo prvi element on e kao kofaktor zadrati svoj
predznak. Element a21 je njemu susjedni element, tako da prilikom odreivanja znaka za njegov
kofaktor mijenjamo mu predznak .
4
Pogledajmo na primjeru. Uzmimo matricu A s elementima [6
8
5 3
7 2]
9 1
Minor elementa a11 dobijemo tako da odstranimo elemente prvog reda i prvog stupca. Dobit
7 2
emo minor [
]. Ovo je prvi element i on e kao kofaktor zadrati svoj predznak. Minor
9 1
6 2
elementa a12 dobijemo tako da iz matrice oduzmemo prvi red i drugi stubac te nam ostane [
].
8 1
Ovo je drugi element i njegov kofaktor bi promijenio predznak (ako bi bio pozitivan, postat e
negativan broj i obrnuto).
Determinantu matrice 2x2 odreujemo tako da pomnoimo suprotne elemente i oduzmemo ih:
| =
Ono to smo uradili je odredili minor elemenata u koloni 1 (elementi a i c). U matrici 2x2 minor
elemenata a je element d, a minor elementa c je element b. Svaki element pomnoimo s njegovim
minorom i oduzmemo ih zbog toga to kofaktor elementa c mijenja predznak.
Za matrice veeg reda determinantu odreujemo preko kofaktora:
4-13
1
|2
3
1
2
3
2 | = 1 | 2
3
3
| - 2 | 1
3
3
| + 3 | 1
3
2
1
|
2
U sluaju matrica vieg reda, ovaj raun postaje sloeniji. Tada za odreivanje determinanti
matrice koristimo Excel ili neki od statistikih paketa koji imaju opcije za izraunavanje
determinante.
Pogledajmo na primjeru kako bismo izraunali determinantu matrice A:
28
4
|6
8
5 8
7 2
5 8
5
|-6|
| + 3 |
7 2| = 4 |
9 1
9 1
7
9 1
8
|=
2
7129
5 8
]
M
=[
5891
7 2
5872
9 1
6281
4881
4286
6987
11
4
4 9 8 5] = [ 31
24
4765
26 40
2
4]
2
Elementima matrice minora pridruimo predznake kako bismo dobili matricu kofaktora.
Predznaci se pridruuju prema sljedeem rasporedu (pridruuju u smislu da ukoliko je znak
pozitivan, onda to znai da broj zadrava svoj originalni predznak, a ako je negativan, to znai da
e broj promijeniti predznak):
+
[
+
+
+ ]
+
11 4 2
Naa matrica minora e sada postati matrica kofaktora K: [31 24 4 ]
26 40 2
Matricu kofaktora transponiramo, odnosno zamijenimo mjesta redovima i stupcima kako bismo
dobili transpon matrice K K' ili adjunktu matrice K:
11
K' =[ 4
2
31 26
24 40 ]
4
2
29
11
1 = [ 4
2
30
5 URADAK NA TESTU
Zato slue transformacije rezultata? to se deava s parametrima distribucije kada se
rezultati na zadacima ili testovima transformiraju u neku novu skalu ? Kako moemo
formirati ukupni uradak na testu? Kakav je odnos parametara testa prema parametrima
njegovih elemenata?
31
Ispitanik
Sirovi rezultat
1
2
3
4
5
6
7
8
1
0
1
1
0
0
1
0
Sabiranje s
konstantom 1
Y = X+1
2
1
2
2
1
1
2
1
Oduzimanje
konstante 1
Y = X-1
0
-1
0
0
-1
-1
0
-1
Mnoenje s
konstantom 3
Y = 3X
3
0
3
3
0
0
3
0
Dijeljenje s
konstantom 3
Y=X/3
1/3
0
1/3
1/3
0
0
1/3
0
(+)
=+
( )2
[( + ) ( + )]2
[ + ]2
[ ]2
=
=
=
=
=
32
()
5-4
( )2
[( ) ( )]2
[ + ]2
[ ]2
=
=
=
=
=
()
5-6
( )2
[ ]2
[( )]2
2 [ ]2
=
=
=
=
= 2
5-7
. = = 2 = .
33
5-8
( )
5-9
2
2 [( )]
2
[
( )
( )2
=
=
=
=
= 2
2
5-10
.
. = = 2 =
z-skala ima aritmetiku sredinu 0 i standardnu devijaciju 1 to moemo dokazati na sljedei nain:
( ) 1 ( )
=
=
=
= 1 [
] = 1 ( ) = 1 0 = 0
)2
0)2
()2
(
=
) ( )
=
=
=1
34
= +
pri emu su a i b konstante, gdje a predstavlja standardnu devijaciju nove skale, a b predstavlja
aritmetiku sredinu nove skale.
Pretpostavimo da je ispitanik na testu inteligencije, ija je aritmetika sredina bila 55, a
standardna devijacija 8, postigao rezultat 65.
Njegov z-rezultat iznosio bi:
=
65 55
=
= 1,25
Kada bismo eljeli izraziti njegov rezultat na skali DQI (devijacijskog kvocijenta inteligencije) koja
ima aritmetiku sredinu 100 i standardnu devijaciju 15, njegov rezultat bi iznosio:
= + = 15 1,25 + 100 = 18,25 + 100 = 118,25 118
Ukoliko elimo preskoiti raunanje z-vrijednosti i sirovi rezultat direktno transformirati u novu
skalu sa zadanim parametrima, dovoljno je samo da u formulu 5-12 ubacimo formulu za zvrijednost i dobit emo opu formulu za linearnu transformaciju rezultata s jedne skale na drugu:
5-13
= ( ) +
Osim DQI skale postoje i druge standardne skale koje se koriste. Jedna od njih je T-skala ija je
aritmetika sredina 50, a standardna devijacija 10.
Rezultati transformirani prema viestrukoj linearnoj transformaciji zadrat e oblik distribucije,
to je jedna od prednosti ovih transformacija. Meutim, linearne transformacije vezane su za
aritmetiku sredinu i standardnu devijaciju te se stoga mogu provoditi samo u sluaju kada
rezultati ne odstupaju znaajno od normalne distribucije. Ukoliko na testiranju dobijemo
rezultate koji znaajno odstupaju od normalne distribucije, onda ne moemo jednostavno izvriti
linearnu transformaciju nego rezultate prvo treba normalizirati. Koju funkciju emo koristiti
kako bi distribuciju rezultata normalizirali, zavisi od oblika distribucije. Prema Tabachnik i Fidell
(2007,str. 87), transformacijske funkcije koje trebamo poznavati za razliite vrste asimetrija su:
Tabela 5-2 Vrste transformacija radi normalizacije rezultata
Vrsta asimetrije
Umjerena pozitivna asimetrija
Umjerena negativna asimetrija
Transformacijska funkcija
=
= *
Znaajna pozitivna asimetrija
=
Znaajna negativna asimetrija
= log(k X)
1
Krivulja u obliku obrnutog slova J
=
1
Krivulje u obliku slova J
=
*Konstanta k odreuje se tako da se pronae najvii rezultat u distribuciji i onda odredi visina k tako da k
bude vee od najveeg rezultata (obino za 1). Onda se kreira nova varijabla tako da se od konstante k
oduzmu rezultati i negativna asimetrija pretvori u pozitivnu asimetriju. Vodite rauna o smjeru
povezanosti kada interpretirate ovako reflektiranu varijablu. Ako ste dobili pozitivnu korelaciju, onda to
znai da u stvarnosti imate negativnu korelaciju jer su vam u transformiranoj skali najvii rezultati postali
najnii i obrnuto.
5-14
+ 0,5 =
100
+ 0,5 =
60 + 0,5 4
62
100 =
100 =
100 = 77,5 76
80
80
sredina
varijanca
jednostavne
aditivne
linearne
Y = X1 + X2 + X3 + ... + XK
Njena aritmetika sredina je jednaka:
=
( 1 + 2 + 3 + + )
1 2 3
+
+
++
5-16
= 1 +2 +3 + +
Aritmetika sredina jednostavne aditivne linearne kombinacije jednaka je zbiru aritmetikih
sredina pojedinih elemenata. Ukoliko su varijable binarne i kodirane sa 0 i 1, onda e aritmetika
sredina linearne kombinacije biti jednaka zbiru proporcija odgovora kodiranih sa 1. Ukoliko su
varijable standardizirane na z-vrijednosti, onda e njihove aritmetike sredine iznositi 0, pa e i
aritmetika sredina aditivne linearne kombinacije biti jednaka 0.
Kako bismo vidjeli emu je jednaka varijanca linearne kombinacije, zamislimo jednostavni primjer
u kojem je jednostavna aditivna kombinacije formirana od samo dva zadataka.
= 1 + 2
Varijanca jednostavne aditivne linearne kombinacije iznosi:
=
=
( )2
[(1 + 2 ) (1 +2 )]2
38
=
=
[1 + 2 + 1 2 ]2
[(1 1 ) + (2 2 )]2
(12 )
(12 + 21 2 + 22 )
(12 ) 2 (1 2 ) (22 )
+
+
(22 )
2 (1 2 )
[1 + 2 ]2
kombinacije, a da je
kovarijanca prvog i drugog dijela. To znai da je varijanca
= 1 + 2 + 212
Opa formula za varijancu jednostavne aditivne linearne kombinacije bi onda bila:
5-18
= + 2
Dakle, varijanca jednostavne linearne kombinacije jednaka je sumi svih varijanci dijelova linearne
kombinacije i dvostrukoj sumi kovarijanci koju imaju svi parovi varijabli. Ukoliko pogledamo
kovarijannu matricu (tabela 4-3), vidjet emo da je varijanca linearne kombinacije jednaka sumi
svih elemenata kovarijanne matrice elemenata linearne kombinacije.
= 1 2
Aritmetika sredina jednostavne suptraktivne kombinacije odreena je kao:
5-20
= 1 2
Varijanca je odreena kao:
39
( )2
=
=
=
=
[(1 2 ) (1 2 )]2
[1 2 + 1 + 2 ]2
[(1 1 ) (2 + 2 )]2
[1 2 ]2
(12 21 2 + 22 )
(12 ) 2 (1 2 ) (22 )
5-21
= 1 + 2 212
Kada su rezultati svake varijable ponderirani, njihove pojedinane aritmetike sredine bit e
uveane za umnoak konstante kao to smo vidjeli u formuli 5-6. To podrazumijeva da e i
aritmetika sredina linearne kombinacije biti odreena kao suma ponderiranih aritmetikih
sredina:
5-23
5-24
= 2 + 2 = 2 + 2
Ma kraju prie o formiranju ukupnog rezultata treba napomenuti kako se ukupan uradak moe
formirati i kao aritmetika sredina. McDonald (1999) je istaknuo da je razuman izbor formiranja
ukupnog uratka kod pitanja Likertovog tipa (pitanja sa skalama) prosjeni rezultat, odnosno
aritmetika sredina svih pitanja u skali:
5-25
pri emu je m broj pitanja u skali. Ovaj nain odreivanja uratka nita ne mijenja u smislu
razlikovanja ispitanika, ali nama olakava razumijevanje ukupnih uradaka. Kada ispitanik osvoji
21 bod na skali Likertovog tipa od 1 do 5, mi trebamo informaciju o broju pitanja u skali da bismo
se orijentirali da li je ovo visok, srednji ili nizak rezultat. Ali, ako odredimo uradak kao aritmetiku
sredinu (21 podijelimo s brojem pitanja i dobijemo 3,8), mnogo se lake orijentiramo o poloaju
ispitanika.
da
je
korelacija
izmeu
=
dvije
( )
varijable
definirana
formulom:
( )
[( )( )]
[ ]
Vidjeli smo ranije da je standardna devijacija jednostavne linearne kombinacije jednaka zbiru
varijanci svakog dijela kombinacije, te dvostrukoj sumi kovarijanci njenih elemenata. Kako su nam
ovdje dijelovi linearne kombinacije standardizirani, onda su im i standardne devijacije jednake 1.
Osim toga, vidjeli smo da je korelacija standardizirana kovarijanca, odnosno da, kada imamo
standardizirane varijable njihova kovarijanca jednaka je njihovoj korelaciji.
U formuli to izgleda ovako:
= + 2
= + 2
Vi svake standardizirane varijable jednaka je 1, te je = , odnosno broju lanica (u naem
sluaju je to 3). kod standardiziranih varijabli jedanaka je te ova formula sada glasi:
= + 2
Naa formula za korelaciju izgledat e sada ovako:
42
[(1 + 2 + 3 ) ]
+ 2 (12 + 13 + 23 )
(1 ) + (2 ) + (3 )
+ 2 (12 + 13 + 23 )
= 1
= 2
= 3
(2 )
(3 )
Sada moemo pisati emu je jednaka korelacija izmeu tri lanice linearne kombinacije i neke
vanjske jednostavne varijable:
=
1 + 2 + 3
+ 2 (12 + 13 + 23 )
+ 2
Pri emu je korelacija svake lanice linearne kombinacije s kriterijem, a korelacije meu
lanicama linearne kombinacije.
Da vidimo gdje se nalaze ovi elementi formule u korelacijskoj matrici:
Tabela 5-3 Korelacijska matrica tri prediktora i kriterija
Zadatak 1
Zadatak 2
Zadatak 3
Zadatak 1
1
21
31
Zadatak 2
12
1
12
Zadatak 3
13
23
1
Kriterij
1
2
3
idu u brojnik, dok je u nazivniku zbir svih elemenata matrice korelacija i varijanci elemenata
linearne kombinacije. Jednostavno, zar ne?
Kada e korelacija izmeu linearne kombinacije i neke kriterijske varijable biti vea? Iz
matematike znamo da e kolinik biti vei to je brojnik vei, a nazivnik manji. To znai da e
korelacije izmeu linearne kombinacije i neke kriterijske varijable biti vee kada su korelacije
pojedinanih lanica linearne korelacije s kriterijem vee, a meusobne korelacije lanica
linearne kombinacije manje.
( 1 ) [( )(1 1 )]
=
1
1
[ 1 ]
[(1 + 2 + 3 ) 1 ]
+ 2 (12 + 13 + 23 )
(1 1 ) + (2 1 ) + (3 1 )
+ 2 (12 + 13 + 23 )
(1 1 )
= 1 = 1
(2 1 )
= 21
(3 1 )
= 31
1 + 21 + 31
+ 2 (12 + 13 + 23 )
1 =
1 + 1
+ 2
pri emu u brojniku imamo sumu korelacija koju svaka lanica linearne kombinacije ima s onom
lanicom za koju raunamo spurioznu korelaciju.
Ako pogledamo u matrici korelacija 5-4 gdje se nalaze elementi brojnika i nazivnika, vidimo da su
elementi brojnika ustvari elementi reda varijable za koju raunamo spurioznu korelaciju, dok su
elementi nazivnika suma svih elemenata korelacijske matrice.
Tabela 5-4 Korelacijska matrica tri zadatka
Zadatak 1
Zadatak 2
Zadatak 3
Zadatak 1
1
21
31
Zadatak 2
1
12
Zadatak 3
23
1
45
A
B
C
G
H
ponderiranih i neponderiranih ukupnih skorova obino jako visoke ukoliko test ima najmanje 20
pitanja. Dakle, ponderiranje daje neto vie koristi ako test ima manje od 20 pitanja, ako
korelacije pitanja i ukupnog rezultata jako variraju te je uzorak ispitanika veliki (najmanje nekoliko
stotina).
Neki osnovni naini odreivanja pondera su:
1. Ponderiranje prema indeksu teine zadatka na primjer ukoliko je to jako teak zadatak
koji rjeava samo 10 % ispitanika pri emu je q=0,9, kao broj bodova koji se dobiva za
tano uraen zadatak moemo odrediti 10*q, odnosno 9 bodova.
2. Ponderiranje prema proporciji uea u rezultatu ukoliko na primjer elimo da neki
segment testiranja uestvuje u konanoj ocjeni sa 20 %, tada odredimo rezultat na tom
segmentu kao
w=
100
3. Regresijsko ponderiranje
Prema Fajgelju (2003) ovo je najpoznatije optimalno ponderiranje. U ovom ponderiranju
koriste se regresijski koeficijenti (koje ste spominjali u regresijskoj analizi na Statistici, a o
kojima e biti rijei u poglavlju o valjanosti).
47
6 POUZDANOST
to je pouzdanost testa? Kako odreujemo koliko je neki test pouzdan? Kako uzorak i
broj zadataka u testu utjeu na pouzdanost? to je generalizabilnost?
Psiholoka mjerenja su neophodna za istraivanja i aplikaciju psiholokih spoznaja u realnom
ivotu. Jednostavno je nemogue zamisliti psiholoko istraivanje i provoenje nekog
psihosocijalnog programa bez mjerenja. Da bi mjerenje bilo kvalitetno, testovi moraju biti
pouzdani.
Zapitajmo se: ko je pouzdan ovjek? Va odgovor vjerovatno ukljuuje opise kao to su onaj
ovjek kome mogu vjerovati, onaj ko je taan, onaj ko neku aktivnost uvijek radi na isti nain,
neko na koga se mogu osloniti.
to je, onda, pouzdan test? Slino kao i ovjek, to je test kojem moemo vjerovati da e svaki put
kada je upotrebljen s istim ispitanikom dati iste ili vrlo sline rezultate i na koje se moemo
osloniti prilikom zakljuivanja. Zamislite da odete kod lijenika i on vam dva puta mjeri krvni tlak.
Prvi put rezultat pokae da je va krvni tlak u fiziolokim granicama, a drugi put vam tim istim
tlakomjerom izmjeri vrijednosti koje ukazuju da vi hitno morate na terapiju zbog visokog tlaka?!
Sada zamislite kako bi bilo da koristimo nepouzdan psiholoki test u situacijama kada odluujemo
ko e se upisati u kolu, koga emo zaposliti na neko radno mjesto ili koga emo hospitalizirati.
Nepouzdan test bi nam mogao jednom pokazati da neki uenik ne moe biti upisan u kolu, a
drugi put da moe ili u prvom mjerenju zakljuimo da osobu treba hospitalizirati, a u drugom
mjerenju zakljuimo da je moemo pustiti na kuni tretman. Koritenje nepouzdanih testova
predstavljalo bi opasnu prijetnju po ljude.
Pouzdanost testa predstavlja jednu od osnovnih metrijskih karakteristika koja govori o
konzistenciji i preciznosti rezultata mjernog procesa. Kako bismo mogli vjerovati testnim
rezultatima, mi moramo biti uvjereni da ako e ispitanici, ako im damo test nekoliko puta, postii
sline ili iste rezultate. Nedostatak pouzdanosti znai nepreciznost i nekonzistenciju, odnosno
pogreku mjerenja. Pogreka mjerenja definira se kao promjena u rezultatu koja je nastala pod
utjecajem faktora povezanih s procesom mjerenja, ali nerelevantnih za ono to je mjereno.
Prema tome, pouzdanost kao metrijska karakteristika govori o tome koliko su rezultati
konzistentni i osloboeni od pogreke mjerenja (Urbina, 2004, str. 117).
1. U mjerenju postoji pogreka, rezultat koji se dobije mjerenjem u sebi uvijek sadri
pogreku
2. Pogreka nastaje zbog djelovanja nesistematskih faktora i ona je sluajna
3. Korelacija moe biti koritena za izraunavanje pouzdanosti
Visina rezultata ispitanika na testu ili pitanju odreena je:
1. Karakteristikom koju mjerimo ako testom mjerimo depresiju, onda e izraenost
depresivnosti kod ispitanika uestvovati u formiranju rezultata
2. Sistematskim faktorima varijablama koje uestvuju u formiranju rezultata tako da kod
svih ispitanika mijenjaju rezultat u istom smjeru. Na primjer, ako mjerimo raspoloenje, a
ispitanici su prije toga gledali neku komediju i od srca se smijali, to e uticati tako da e
kod veine dovesti do pomjeranja rezultata na upitniku prema viim vrijednostima
3. Nesistematskim faktorima varijablama koje djeluju po sluaju i rezultate mijenjaju u oba
smjera i sa razliitim intenzitetom.
Teorija pouzdanosti se bavi djelovanjem nesistematskih faktora.
TESTOVI
ISPITANICI
PARAMETRI
PO TESTU
M
PARAMETRI PO ISPITANIKU
..
.. X1k
bM1.,tM1.,eM1.
bV1.,tV1.,eV1.
X2k
bM2.,tM2.,eM2.
bV2.,tV2.,eV2.
.. X3k
bM3.,tM3.,eM3.
bV3.,tV3.,eV3.
bMN.,tMN.,eMN.
bVN.,tVN.,eVN.
..
..
XNk
bM.N,
tM.N,
eM.N
bV.1,tV.1, eV.1
bV.2,tV.2, eV.2
bV.N,tV.N, eV.N
Svaki bruto rezultat moemo posmatrati kao linearnu kombinaciju pravog rezultata i komponente
pogreke. U sluaju ovako definirane linearne kombinacije (jednostavne i aditivne) znamo da je:
1. Aritmetika sredina linearne kombinacije jednaka zbiru aritmetikih sredina dijelova, to
znai da je aritmetika sredina bruto rezultata jednaka zbiru aritmetike sredine pravih
rezultata i aritmetike sredine pogreke
2. Varijanca linearne kombinacije jednaka je zbiru varijanci elemenata i dvostrukom zbiru
kovarijanci elemenata. To znai da je varijanca bruto rezultata hipotetski jednaka zbiru
varijanci pravih rezultata, varijanci pogreke te dvostrukoj kovarijanci izmeu pravih
rezultata i komponente pogreke.
Uzimajui u obzir osnovne pretpostavke Klasine testne teorije, te osnovnu matematiku vezanu
za aritmetiku sredinu i varijancu linearnih kombinacija, moemo rei poneto o aritmetikoj
sredini i varijanci za ispitanika i za mjerenje.
Parametri po ispitaniku:
Ako vae pretpostavke KTT-a koje kau da su pogreke sluajne i da po sluaju mijenjaju rezultat,
onda moemo zakljuiti da je:
1. Aritmetika sredina pravih rezultata u osnovi sam pravi rezultat
tMi. = tXi.
2. Aritmetika sredina komponenti pogreke nula jer se pogreke ponite
eM.1 = eM.2=.= eM.j =0
50
6.1.2 to je pouzdanost?
Furr i Bacharach (2013) su predloili jedan koristan nain da mislimo o pouzdanosti kao odnosu
izmeu signala i uma. Signal bi bio na pravi rezultat, a um je pogreka mjerenja koja ometa
percepciju signala i oteava nam da ga detektiramo. Pouzdanost bi bila odnos izmeu koliine
signala i ukupne koliine signala i uma, odnosno:
=
SIGNAL
SIGNAL + UM
U Klasinoj testnoj teoriji postoje najmanje etiri naina da promiljamo o pouzdanosti, a svi se
tiu odnosa izmeu bruto rezultata, pravog rezultata i komponente pogreke. Ova etiri pristupa
okarakterizirana su sa dvije dimenzije:
da li se pouzdanost tumai kao odnos bruto rezultata prema pravom rezultatu ili prema
komponenti pogreke.
da li se pouzdanost tretira kao proporcija varijance ili kao korelacija
Primijetite da oznaka za pouzdanost u supskriptu ima dva ista slova. To znai da se ovaj koncept
odnosi samo na jedan test i razlikuje se od oznake za korelaciju gdje u supskriptu imamo dva
razliita slova za dva razliita testa.
Pretpostavimo da smo ispitivali grupu ispitanika i da smo mogli zabiljeiti i njihov pravi rezultat i
njihov bruto rezultat. Pretpostavimo da je varijanca pravih rezultata bila 100, a varijanca bruto
rezultata bila 125. Prema gore navedenoj formuli koeficijent pouzdanost bi iznosio:
=
100
= 0,8
125
odnosno, 80% variranja bruto rezultata objanjeno je variranjem pravih rezultata, dok je 20%
variranja u bruto rezultatima posljedica pogreke. Koeficijent pouzdanost je proporcija varijance
pravih rezultata unutar varijance bruto rezultata. Kao i svaka proporcija, koeficijent pouzdanosti
se kree u rasponu od 0 do 1 (u procentima od 0 do 100 %). Vea vrijednost koeficijenta
pouzdanosti ukazuje da imamo precizniji test jer je vea proporcija variranja objanjena pravim
rezultatima. Osim toga, primijetite da e pouzdanost testa biti nula ukoliko je varijanca pravih
rezultata jednaka nula to jo jednom naglaava injenicu da je pouzdanost vezana za variranje
karakteristike meu ispitanicima. Koeficijent pouzdanosti e biti 1 onda kada u mjerenju nije bilo
nimalo pogreke, to se u realnom ivotu nikada ne dogaa, posebno ne u drutvenim
znanostima. Iako ne postoji recept koliko visok treba da bude koeficijent pouzdanosti, moe se
preporuiti to via pouzdanost, to bolje. U istraivanjima se esto zadovoljavamo
koeficijentima pouzdanosti koji su vei od 0,7 ili 0,8, dok u situacijama kada moramo donijeti
vane odluke na osnovu testiranja teimo jo viim koeficijentima pouzdanosti. U svakom sluaju,
52
ukoliko nam je koeficijent pouzdanosti nii od 0,5 trebamo se zabrinuti i rezultate ne koristiti za
donoenje zakljuaka.
Kada posmatramo pouzdanost iz perspektive odnosa varijance pogreke i bruto rezultata
konceptualno emo zakljuiti isto kao i u prethodnom sluaju. Radi matematike, da vidimo emu
je jednaka pouzdanost kada usporedimo varijancu pogreke i varijancu bruto rezultata.
Znamo da je VB= Vt + Ve odnosno da je Vt = VB - Ve . Kada ovo uvrstimo u formulu za pouzdanost,
dobijemo:
6-2
=
=1
U naem ranijem primjeru, ako je varijanca pravih rezultata bila 100, varijanca bruto rezultata
bila 125, to znai da je varijanca komponente pogreke 25. Stoga bi pouzdanost prema ovoj
formuli bila:
= 1
25
= 1 0,25 = 0,75
100
( + ) ( 2 + )
2
=
=
+
Poznato nam je iz sekcije 6.1.1.da je suma otklonskih rezultata pogreke 0 jer se pogreke ponite,
to znai da e drugi dio ovog izraza biti 0. Ostane nam:
2
=
Sada znamo da je
= =
53
6-3
=
Kao to vidimo, korelacija bruto i pravih rezultata je drugi korijen koeficijenta pouzdanost i zove
se INDEKS POUZDANOSTI (Ghiselli, Campbell i Zedeck, 1981). Moemo rei da je koeficijent
pouzdanost u stvari koeficijent determinacije za koeficijent korelacije pravih i bruto rezultata i
odreuje proporciju zajednike varijance pravih i bruto rezultata.
= 1
Iz toga slijedi:
= 1
= (1 )
= (1 )
6-4
= (1 )
Ova formula pokazuje da je standardna pogreka mjerenja povezana s koeficijentom pouzdanosti.
Kada je pouzdanost = 1 tada je standardna pogreka mjerenja jednaka 0, odnosno ako nema
greke u mjerenju tada je pouzdanost savrena. Takoer vidimo da standardna pogreka
mjerenja ne moe biti vea od standardne devijacije bruto rezultata.
54
Xb =Xt + Xe
Osim toga znamo da je korelacija izmeu dva mjerenja X i Y jednaka:
55
+ + +
Kako znamo da je pogreka sluajna i ne korelira ni sa im, moemo rei da su kovarijance bilo
kojeg rezultata sa komponentom pogreke jednake 0.
= = = 0
Slijedi da je:
=
Kod odreivanja korelacije izmeu dvije paralelne mjere, korelacija izmeu pravih rezultata je
jednaka 1, varijanca pravih rezultata je jednaka i varijance pogreke su jednake, pa samim tim i
varijance bruto rezultata:
=
= 1
= ; = =
Dobijemo da je korelacija izmeu bruto rezultata dvije paralelne forme jednaka:
6-5
2
=
=
2
Vidimo da je korelacija dvije paralelne forme jednaka odnosu izmeu varijance pravih rezultata i
varijance bruto rezultata, odnosno koeficijentu pouzdanosti.
56
12 =
Iako djeluje vrlo jednostavno, postoji nekoliko pretpostavki koje lee u osnovi vjerovanja ovom
koeficijentu. Prva pretpostavka je da se pravi rezultati ispitanika ne mijenjaju tokom vremena. Mi
trebamo biti uvjereni da je karakteristika koju mjerimo toliko stabilna da na nju nee nita uticati
tokom vremena koje protekne izmeu prvog i drugog mjerenja. Druga pretpostavka je da e
varijanca pogreke u prvom mjerenju biti jednaka varijanci pogreke u drugom mjerenju.
Meutim, koliko je ova pretpostavka opravdana? Mi znamo da se varijanca pogreke javlja zbog
sluajnih faktora koji djeluju u svakom trenutku i koji mijenjaju pravi rezultat u oba smjera i sa
razliitim intenzitetom. Da bi bili sigurni u ovu pretpostavku za drugo mjerenje moramo kreirati
situaciju koja e biti gotovo identina situaciji na prvom mjerenju. Ispitanike bi trebali smjestiti u
istu prostoriju; testirati ih u isto doba dana; imati istog ispitivaa jer, kako navodi Bucik (1997,str
106), neki ispitivai mogu dati jasnu i potpunu uputu, a drugi ne; formirati iste grupe kako bi
socijalni kontekst bio isti i tako dalje. Ukoliko i pretpostavimo da se moemo nositi sa
legitimnou ove pretpostavke, opet nam ostaje pitanje stabilnosti karakteristike u vremenu.
Zato? Prvo, zato jer su psiholoki konstrukti rijetko tako stabilni u vremenu. Pretpostavimo da
mjerimo ekstraverziju. Ekstraverzija se smatra stabilnom karakteristikom. Pretpostavimo da su
neka od pitanja na testu bila:
57
58
59
Tabela 6-2 Korelacije dva seta varijabli jednake pouzdanosti razliite dimenzionalnosti
Varijabla
1
2
3
4
5
6
1
0,8
0,8
0,3
0,3
0,3
2
0,8
0,3
0,3
0,3
Varijabla
1
2
3
4
5
6
1
0,5
0,5
0,5
0,5
0,5
2
0,5
0,5
0,5
0,5
Pogledajmo ove dvije korelacijske matrice. Za oba seta podataka dobili smo isti koeficijent
pouzdanosti od 0,86. Meutim, u prvom setu vidimo da izmeu prva tri pitanja i druga tri pitanja
imamo visoke korelacije, te da obrazac korelacija ukazuje na postojanje zajednikog generalnog
faktora. Kada bismo eliminirali generalni faktor, elementi matrice u kojima se nalaze korelacije
prva tri pitanja sa druga tri pitanja ostali bi prazni, odnosno njihove korelacije bez generalnog
faktora bile bi 0. S druge strane, oni meusobno unutar dvije grupe imaju visoke korelacije koje
bi se zadrale (ali ne tako visoko) i kada bismo izbacili generalni faktor. To nam govori je ovo
test koji mjeri vie dimenzija. Test ima visok koeficijent unutarnje konzistencije, ali nije homogen.
Odstranjivanje generalnog faktora iz rezultata u drugoj matrici doveo bi do nultih korelacija to
govori o tome da nema nekih grupno specifinih i item specifinih faktora koji utiu na odgovore
ispitanika te je ovaj test jednodimenzionalan, odnosno homogen. Stoga je jako vano da
razlikujemo homogenost kao jednodimenzionalnost i unutarnju konzistenciju (kao pomalo
neprecizan termin) kao povezanost izmeu pitanja.
Iz perspektive unutarnje konzistencije (za koju sada znamo da nije homogenost), dva su kljuna
faktora koja utiu na pouzdanost testa. Prvi faktor je (oigledno) konzistencija pitanja. Ako su
pitanja povezana meu sobom tada e i test biti pouzdan, odnosno ukoliko su opaene razlike
meu rezultatima na pitanjima konzistentne, onda moemo zakljuiti da imamo bruto rezultate
konzistentne sa pravim rezultatima. Drugi faktor je duina testa. to je test dui, to je njegova
pouzdanost vea, s tim to duina testa podrazumijeva da imamo kvalitetna pitanja. O ovome e
biti vie govora u dijelovima koji slijede.
Nauit emo dvije metode kako se odreuje koeficijent pouzdanosti po unutarnjoj konzistenciji:
split- half koeficijent ili prepolovljeni koeficijent pouzdanosti i Cronbachov (alfa) koeficijent
pouzdanosti.
60
treba voditi rauna su 1) da li se pitanja sistematski razlikuju kroz test i 2) da li je brzina igrala
ulogu u testiranju, odnosno da li je bio test brzine:
1. Testovi u kojima se pitanja razlikuju po teini (kao to je to sluaj u testovima postignua
gdje poinjemo sa lakim pitanjima, a zavravamo sa tekim pitanjima) ne mogu biti
podijeljeni tako da u jednoj polovini budu laka pitanja, a u drugoj polovini teka pitanja.
Neki multidimenzionalni testovi, kao to su testovi linosti, imaju pitanja poredana tako
da ide pitanje iz jedne dimenzije, pa druge dimenzije, pa tree dimenzije, itd. U ovakvim
situacijama, test ne moemo dijeliti par-nepar niti moemo samo prepoloviti test.
Moramo u svakoj polovini imati podjednak broj pitanja prema svakoj dimenziji.
2. Ukoliko imamo testove brzine, ispitanici imaju ogranieno vrijeme rjeavanja i
pretpostavka je da nee stii do zadnjih pitanja. Kada bismo ove testove samo prepolovili
dobili bismo u prvoj polovini gotovo sve rijeene zadatke, a u drugoj vie nerijeenih
zadataka.
Prilikom podjele trebamo voditi rauna da u svakom dijelu testa imamo zadatke koji su razliite
teine i da svaki zadatak u prvom dijelu ima svoj par u drugom dijelu.
Nakon to smo test podijelili, izraunamo ukupne uratke na dvije polovine i odredimo koeficijent
korelacije izmeu njih. Ovaj koeficijent korelacije izmeu dvije polovine testa je koeficijent
pouzdanosti za svaku od polovina testa.
Sada prelazimo na korak 2 , a to je odreivanje pouzdanosti za itav test. Za ovu svrhu koristimo
Spearman Brownovu formulu ili Spearman Brownov popravak koju su ova dva autora
nezavisno izveli 1910. godine (prema Fajgelj, 2003, str.230). Ova formula je za sluaj kada se testu
kojem je poznat koeficijent pouzdanost povea duina za dva puta:
6-7
2
1 +
Ovu formulu emo, u njenom opem obliku spomenuti i kada budemo govorili o determinantama
pouzdanosti.
Dakle, sada nakon to smo dobiveni koeficijent pouzdanosti polovine testa uvrstili u S-B formulu
dobili smo koeficijent pouzdanosti za itav test. Vano je da primjetimo razliku izmeu split-half
koeficijenta i koeficijenta dobivenog na alternativnim formama ili test-retest koeficijenta.
Posljednja dva su dobivena kao korelacije izmeu itavih testova, dok je korelacija u odreivanju
split half koeficijenta dobivena na dvije polovine istog testa, te je stoga mjera unutarnje
konzistencije, a ne stabilnosti karakteristike u vremenu.
Da pogledamo jedan primjer. Zamislimo da je grupa od 12 uenika radila test iz numerikog
faktora gdje su mogli na zadatku odvojiti 0; 0,5 i 1 bod.
61
Zadaci
Isp
Split half
Z1
Z2
Z3
Z4
Z5
Z6
0,5
0,5
7
8
Split half
5,5
U
neparni zadaci
2,5
U
parni zadaci
3,0
U
prva 3
3,0
U
druga 3
2,5
6,0
3,0
3,0
3,0
3,0
0,5
0,5
3,5
1,5
2,0
1,5
2,0
0,5
4,5
1,5
3,0
2,0
2,5
5,0
2,0
3,0
3,0
2,0
0,5
4,5
1,5
3,0
2,0
2,5
0,5
5,5
3,0
2,5
2,5
3,0
0,5
0,5
3,0
1,5
1,5
1,0
2,0
0,5
5,5
2,5
3,0
3,0
2,5
10
0,5
0,5
5,0
2,5
2,5
3,0
2,0
11
0,5
5,5
2,5
3,0
3,0
2,5
12
6,0
3,0
3,0
3,0
3,0
0,8
0,7
1,0
0,6
0,9
5,0
2,3
2,7
2,5
2,5
St.dev
0,33
0,49
0,00
0,29
0,23
0,94
0,62
0,50
0,71
0,40
Koraci:
1. Podijelimo test na dva dijela i formiramo ukupne uratke na ta dva dijela. U ovom primjeru
test je podijeljen dva puta: jednom u parne i neparne zadatke, a drugi put na prva tri i
druga tri zadatka. U kolonama od 9 do 12 dati su rezultati na ovim polovinama.
2. Izraunamo korelaciju izmeu dvije polovine. U naem sluaju
a. Korelacija izmeu parnih i neparnih zadataka: 0,40
b. Korelacija izmeu prve i druge polovine testa: 0,41
Ove korelacije su ujedno i koeficijenti pouzdanosti za polovine testa
3. Ovu korelaciju uvrstimo u S-B formulu i dobijemo split-half koeficijent pouzdanosti. U
naem sluaju oba koeficijenta iznose rxx=0,58.
Prvi korak odreivanje koeficijenta zapoinje odreivanjem parametara zadataka i testa. Prvo
odredimo varijance zadataka i varijancu testa. Pretpostavimo da smo imali set podataka
ispitivanja studenata o kvaliteti 5 ispitnih pitanja na testu iz Psihometrije. Na osnovu njihovih
rezultata odredili smo kovarijannu matricu:
Tabela 6-4 Kovarijanna matrica pet pitanja
Pitanje 1
Pitanje 2
Pitanje 3
Pitanje 4
Pitanje 5
[1
]
1
5
1,2 + 0,4 + 1,2 + 1,2 + 0,6
[1
]
51
11,8
= 1,25 [1 0,39]
= 1,25 0,61
= 0,49
Vidimo da naa mjera nije bila pouzdana jer je samo 49 % varijance objanjeno pravim rezultatima,
dok je 51 % varijance koju moemo pripisati pogreki.
Da jo jednom ponovimo logiku koeficijenta . Svako pitanje se tretira kao jedna mjera. to su
pitanja konzistentnija, to je njihova povezanost vea, odnosno njihove kovarijance se vee. Ako
su njihove kovarijance vee, to e varijanca testa biti vea i vie e se razlikovati od jednostavne
63
sume varijanci pojedinih zadataka. Pri tome e kolinik sume varijanci zadataka i varijance testa
biti manji, a kada ga oduzmemo od 1 razlika e biti vea. Dio izraza na poetku k/k-1 utjee na
visinu koeficijenta pouzdanosti jer to imamo vie zadataka to e i pouzdanost biti vea.
1 + ( 1)
1
2
3
4
5
1
1
0,56
0,40
0,47
0,31
1
0,60
0,30
0,30
1
0,46
0,36
1
0,51
Prosjena korelacija za naih pet pitanja i deset pojedinanih korelacija iznosi = 0,43. Kada
ovo uvrstimo u formulu dobit emo da je na standardizirani koeficijent :
=
5 0,43
1 + (5 1) 0,43
64
5 0,43
1 + (5 1) 0,43
= 0,79
Koeficijenti korelacije
-0,5
-0,3
-0,1
0,1
0,3
0,5
Koeficijenti determinacije
0,25
0,09
0,01
0,01
0,09
0,25
Iako se nama ini da je razlika izmeu koeficijenta korelacije 0,1 i 0,3 u odnosu sa 0,3 i 0,5 jednaka,
kada ove korelacije kvadriramo i pretvorimo u proporcije (koeficijente determinacije) vidimo da
odnos izmeu 0,01 i 0,09 nije isti kao i odnos 0,09 i 0,25. U prvom sluaju razlika je 0,08, a u
drugom 0,14. Osim toga, to uraditi kada imamo i pozitivne i negativne korelacije (kao to je
prikazano u tabeli), kolika e biti aritmetika sredina korelacija? U naem sluaju ona bi bila 0. Da
li trebamo rei kako u prosjeku ove varijable ne koreliraju kada jasno vidimo da izmeu njih ima
povezanosti? Da bismo izraunali prosjenu korelaciju, koeficijente korelacije trebamo
transformirati u intervalnu skalu. Za transformaciju korelacije koristimo Fischer-ovu z
transformaciju, odnosno transformaciju korelacija u Fisherove z koeficijente (Fisher, 1915).
Napomena: ove z-koeficijente ne treba pomijeati sa z-vrijednostima, odnosno sa
standardiziranim rezultatima.
Formula za odreivanje Fisherovih z-koeficijenata je
6-10
ln(1 + ) ln(1 )
2
Pri emu je ln prirodni logaritam. Ove transformacije moemo izvriti pomou kalkulatora ili uz
pomo formule koja se u Excel-u zove FISHER.
Nakon to smo odredili z-koeficijent svih korelacija pitanja, saberemo ih i odredimo prosjeni zkoeficijent, koji onda transformiramo u korelaciju preko formule:
65
6-11
2 1
= 2
+1
Vidimo da sada imamo eksponencijalnu funkciju u kojoj je e eksponencijalna konstanta i njena
vrijednost je oko 2.718. U Excelu za povratak z-koeficijenta u koeficijent korelacije koristimo
funkciju FISHERINV.
20 =
()
[1
]
1
Druga formula, koju su dali isti autori, odnosi se na odreivanje koeficijenta pouzdanosti u
situacijama kada su nam poznate samo aritmetika sredina testa i varijanca testa.
6-13
(1 )
]
20 =
[1
1
za 3 subskale nekog upitnika. Takoer pretpostavimo da svaka od subskala ima visok koeficijent
pouzdanosti, ali su meusobno u nultim korelacijama. U ovom sluaju koeficijent bi bio nula.
Meutim, pogreno bi bilo zakljuiti da je pouzdanost takve linearne kombinacije nula.
Najispravnije bi bilo da pouzdanost odreujemo koristei alternativne forme. U tom sluaju bi
koeficijent korelacije izmeu dvije alternativne forme bio koeficijent pouzdanosti za svaku od tih
formi. Ali, ukoliko nije mogue administrirati dvije alternativne forme, tada moemo procijeniti
pouzdanost linearne kombinacije na sljedei nain:
1. Znamo da je koeficijent pouzdanosti odnos izmeu varijance pravih rezultata linearne
kombinacije i varijance bruto rezultata te kombinacije
2. Varijanca bruto rezultata linearne kombinacije jednaka je zbiru varijanci elemenata i
dvostrukoj sumi kovarijanci. Dakle, varijancu ove velike linearne kombinacije odreujemo
kao sumu sloene matrice linearne kombinacije (pogledati matricu 5-5)
3. Varijanca pravih rezultata linearne kombinacije bie jednaka sumi varijanci pravih
rezultata dijelova linearne kombinacije i dvostrukoj sumi kovarijanci elemenata. Znamo
da se kovarijanca izmeu rezultata javlja iskljuivo zbog pravih rezultata jer pogreka ne
korelira ni sa im, te je stoga lako doi do podatka o kovarijanci linearne kombinacije.
Ostaje nam da se prisjetimo da je koeficijent pouzdanosti jednak omjeru varijance pravih
rezultata i varijance bruto rezultata, te da varijancu pravih rezultata za elemente linearne
kombinacije moemo izraunati tako da pomnoimo varijancu bruto rezultata sa
koeficijentom pouzdanosti.
4. Nakon toga izraunamo varijancu pravih rezultata velike linearne kombinacije, koju
podijelimo sa varijancom bruto rezultata i dobijemo koeficijent pouzdanosti.
Zamislimo da imamo jednu kovarijannu matricu dva testa koja mjere dvije vrste
profesionalnih interesa:
Tabela 6-7 Kovarijanna matrica subtestova profesionalnih interesa
Sa21
Sa22
Sa23
Sa24
Ea25
Ea27
Ea28
Ea30
Sa21
Sa22
Sa23
Sa24
Ea25
Ea27
Ea28
Ea30
0,34
0,09
0,11
0,08
0,13
0,1
0,13
0,1
0,09
0,3
0,11
0,07
0,17
0,11
0,09
0,06
0,11
0,11
0,46
0,21
0,19
0,13
0,13
0,1
0,08
0,07
0,46
0,65
0,12
0,09
0,15
0,1
0,13
0,17
0,21
0,12
0,52
0,2
0,11
0,16
0,1
0,11
0,19
0,09
0,2
0,47
0,1
0,22
0,13
0,09
0,13
0,15
0,11
0,1
0,42
0,1
0,1
0,06
0,13
0,1
0,16
0,22
0,1
0,48
1. Bruto rezultati:
o Varijanca bruto rezultata testa Sa (prve linearne kombinacije zbir svih
elemenata njene kovarijanne matrice) = 3,34
o Varijanca bruto rezultata testa Ea (druge linearne kombinacije zbir svih
elemenata njene kovarijanne matrice) = 3,67
67
=
[1
]
1
4
0,34 + 0,3 + 0,46 + 0,65
= [1
] = 0,63
3
3,34
4
0,52 + 0,47 + 0,42 + 0,48
= [1
] = 0,65
3
3,67
3. Varijance pravih rezultata testova Sa i Ea
=
= 0,63 3,34 = 2,12
= 0,65 3,67 = 2,37
4. Varijanca pravih rezultata sloene linearne kombinacije
= + + 2
= 2,12 + 2,37 + 2 1,9 = 8,29
5. Pouzdanost sloene linearne kombinacije
=
8,29
=
= 0,76
10,92
Drugi nain bi bio preko formule (Nunnally i Bernstein, 1994, str. 268):
6-14
i2 rii i2
rYY 1
2
Y
Pri emu je
Y2 varijanca linearne kombinacije testova
i2 varijanca svakog testa
68
ispitanicima bude to vei, dok rezidualni varijabilitet treba da bude to manji (jer je neobjanjiv,
odnosno on je pogreka).
U tabeli 6-8 su dati svi podaci koje raunamo u analizi varijance:
Tabela 6-8 Izvori varijabiliteta u analizi varijance
Izvor varijance
Suma kvadrata
Stepeni slobode
to sadrava prosjeni
kvadrat
kod
ponovljenih mjerenja
Ispitanici (i)
j (Xij Xi.) 2
i-1
jV isp + Vrezidual
i (Xij X.j) 2
j-1
jVzad + Vrezidual
Rezidual
(Xij Xi.-X.j-X..) 2
(i-1) (j-1)
Vrezidual
Total
(Xiij X..) 2
ij-1
11 =
Ispitanik
1
2
3
4
5
6
7
8
9
10
11
12
.
.
Zadatak
1
1
1
1
1
0
0
0
0
1
0
0
1
6
36
Zadatak
2
1
1
0
1
1
1
0
0
1
1
1
1
9
81
Zadatak
3
1
1
0
0
1
0
1
0
1
1
1
1
8
64
Zadatak
4
1
1
0
1
1
0
1
1
1
1
1
1
10
100
4
4
1
3
3
1
2
1
4
3
3
4
16
16
1
9
9
1
4
1
16
9
9
16
70
Zadatak 1
Zadatak 2
Zadatak 3
Zadatak 4
Zadatak 1
0,273
0,045
Zadatak 2
0,045
0,205
0,091
0,045
Zadatak 3
0,000
0,091
0,242
0,121
Zadatak 4
0,000
0,045
0,121
0,152
[1
]
1
4
0,871
= [1
]
3
1,477
4
0,871
= 3 [1 1,477] = 0,56
( )
Pri emu je
Xij rezultat ispitanika na svakom pojedinanom mjerenju. U naem primjeru imamo ukupno 48
rezultata.
N ukupan broj mjerenja, u naem sluaju to je 48 mjerenja
2
Malo podsjeanje na osnove matematike:
znai a da svaki rezultat kvadriramo, pa onda
2
saberemo, dok ( ) znai da prvo sve rezultate saberemo, a onda taj zbir kvadriramo.
= 33
1089
= 10
48
71
.2 ( )
=
= 4,06
4
48
3. Odreivanje sume kvadrata po zadacima
=
6-18
.2
( )
281 1089
= 0,72
12
48
=
= 10 4,06 0,72 = 5,22
Tabela 6-11 Izvori varijance u odreivanju koeficijenta pouzdanosti na primjeru
Izvor varijance
Suma kvadrata
Stepeni slobode
MS (prosjeni kvadrat)
Ispitanici (i)
4,06
i-1
0,37
0,72
j-1
0,24
Rezidual
5,22
(i-1) (j-1)
0,15
Total
10
ij-1
72
11 =
0,370,15
0,37
= 0,57
Vidimo da imamo malu razliku u ova dva koeficijenta ( i koeficijenta pouzdanosti po Hoytovoj
metodi) to je rezultat zaokruivanja brojeva.
Na ovom primjeru nauili smo kako odreujemo pouzdanost preko analize varijance i na taj nain
stvorili podlogu za priu o Teoriji generalizabilnosti.
Selekcionirani uzorak
135
29,7
105,3
0,78
73
Kako bismo provjerili koliki bi bio koeficijent pouzdanosti testa primijenjenog na homogenom
uzorku, odnosno na uzorku ogranienog obima, koristimo formulu koju zovemo popravak za
omeenost obima:
6-20
2 + 2
1
Pri emu je
korigirani koeficijent pouzdanosti
koeficijent pouzdanosti dobiven na omeenom uzorku
standardna devijacija rezultata na neomeenom uzorku
standardna devijacija rezultata dobivenih na omeenom uzorku
Trebamo primijetiti da je ova korekcija mogua samo onda kada imamo sve parametre na
raspolaganju.
Varijanca pravih rezultata, kada jednom mjerenju dodamo jo samo jedno mjerenje, bit e
poveana 4 puta. to e biti s pogrekom? Istom ovom logikom, ako jednom mjerenju dodamo
jo samo jedno mjerenje varijanca pogreke e biti:
= 1 + 2 + 212 1 2
74
Poto znamo da je pogreka sluajna i ne korelira s bilo im, to e dio izraza 212 1 2 biti
jednak 0, a varijanca pogreke e biti:
= 2
Vidimo da varijanca pravih rezultata raste mnogo bre nego varijanca pogreke, a posljedino
raste i koeficijent pouzdanosti. Upravo su na ovoj logici Spearman i Brown pripremili formulu
kojom provjeravamo odnos izmeu duine testa i koeficijenta pouzdanosti i koja glasi:
6-21
1 + ( 1)
Na primjer, dobili smo da test koji sadri 20 zadataka ima koeficijent pouzdanosti od 0,7. Zanima
nas koliko bi se promijenila pouzdanost kada bismo testu dodali jo 10 zadataka?
=
20 + 10 30
=
= 1,5
20
20
1,5 0,7
1 + (1,5 1) 0,7
1,05
1,35
= 0,78
Vidimo da bi se pouzdanost poveala na 0,78.
Druga verzija ove formule nam omoguava da raunamo koliko treba da produimo test da
promijenimo duinu testa da bismo dobili eljeni koeficijent pouzdanosti. Ta formula je:
6-22
(1 )
(1 )
75
Na primjer, imamo test od 20 pitanja koji ima pouzdanost od 0,7. Mi elimo da nam pouzdanost
bude 0,78. Koliko zadataka trebamo dodati?
= 20
0,78 (1 0,7)
0,7 (1 0,78)
= 20
0,78 (1 0,7)
0,7 (1 0,78)
= 20
0,234
= 30
0,154
Dakle, nova forma treba da ima 30 zadataka, odnosno potrebno je dodati jo 10 zadataka.
Moemo zakljuiti da, ukoliko sve drugo ostaje isto, produavanjem testa, odnosno dodavanjem
zadataka, poveavamo pouzdanost testa. Meutim, ovdje moramo biti oprezni. Prvo, dodani
zadaci moraju biti konzistentni s ostalim pitanjima. Drugo, ne moemo test produavati do
unedogled. Moramo voditi rauna da ispitanici gube koncentraciju i da nakon to vide kako
odgovaraju na prva pitanja dolazi do udeavanja u odgovaranju. Oni prestanu misliti o pitanjima
i samo zaokruuju odgovore koje vide da preferiraju. Stoga je vano razmotriti odnos kvalitete
testiranja kao procesa i kvalitete prikupljenih podataka naspram poveavanja duine testa.
Trebamo znati da je odnos izmeu duine testa i koeficijenta pouzdanosti objanjen krivuljom
negativne akceleracije. To znai da na poetku, kada imamo kratke testove, dodavanje pitanja
znaajno poveava koeficijent pouzdanosti, ali kada je test ve prilino dug, porast koeficijenta je
mnogo manji i nikada ne dosegne jedan. O svemu ovome treba voditi rauna jer kriterij dobrog
testa nije samo pouzdanost, nego i njegova ekonominost i praktinost upotrebe.
76
Isp
1
2
3
4
5
6
7
8
9
10
11
12
Pravi rezultat
prvo mjerenje
1
2
3
4
5
6
7
8
9
10
11
12
Pravi rezultat
drugo mjerenje
1
2
3
4
5
6
7
8
9
10
11
12
Bruto rezultat
prvo mjerenje
1
1
3
2
5
6
5
8
7
10
12
12
Bruto rezultat
drugo mjerenje
1
2
1
4
3
6
6
8
8
8
11
10
Korelacija izmeu pravih rezultata je 1. Meutim, kada izraunamo korelaciju izmeu bruto
rezultata zakljuimo da je ona nia 0,93. Pogreka mjerenja utjee na korelaciju tako da je
umanjuje ili atenuira. Na visinu korelacije izmeu dvije varijable utjeu:
1. Prirodna povezanost izmeu te dvije varijable
2. Pouzdanost prvog testa
3. Pouzdanost drugog testa
Nas, u svakom sluaju, moe zanimati kolika je korelacija izmeu pravh rezultata ili kolika bi bila
korelacija meu mjerama kada bismo poveali pouzdanost? Ove korigirane korelacije zovemo
disatenuirane, a formulu za odreivanje korelacije idealnih mjera zovemo korekcija za atenuaciju.
Osnovni obrazac za disatenuaciju glasi:
6-23
6-24
Valid
Excludeda
Total
1921
93.1
143
6.9
2064
100.0
U ovoj tabeli vidimo da je bio ukupno 1921 ispravno unesen podatak, te da su 143 ispitanika
iskljuena iz analize. U narednoj tabeli dobili smo podatak o visini pouzdanosti :
Tabela 6-15 SPSS tabela s koeficijentom pouzdanosti
Reliability Statistics
Cronbach's
Alpha
.503
Cronbach's
Alpha Based
on
Standardized
Items
.525
N of Items
5
78
1.000
.045
.534
.375
.045
Pitanje 2
Pitanje 3
.045
1.000
.059
.059
.278
.534
.059
1.000
.405
.012
Pitanje 4
.375
.059
.405
1.000
-.006
Pitanje 5
.045
.278
.012
-.006
1.000
Item-Total Statistics
Scale
Scale Mean if Variance if
Item Deleted Item Deleted
Pitanje 1
Pitanje 2
Pitanje 3
Pitanje 4
Pitanje 5
9.51
8.60
9.66
9.61
8.22
5.377
5.735
5.315
5.546
5.894
Corrected
Item-Total
Correlation
.395
.185
.395
.317
.138
Squared
Multiple
Correlation
.317
.082
.335
.202
.080
Cronbach's
Alpha if Item
Deleted
.376
.511
.374
.422
.544
79
U ovoj tabeli nam je najzanimljivija zadnja kolona koja govori o tome to e se desiti s
koeficijentom pouzdanosti ukoliko neko pitanje izbacimo. Vidimo da, ukoliko izbacimo pitanja 2
i 5, koeficijent pouzdanosti e porasti, a u sluaju izbacivanja pitanja 1, 3 ili 4, on e opasti.
Koristei se ovom statistikom, moemo donositi odluke koja pitanja ima smisla ostavljati u
upitnicima, a koja ne. Ipak, kod odluivanja o izbacivanju pitanja, moramo voditi rauna o
sadraju pitanja jer neka pitanja ne moraju biti visoko konzistentna s drugim, mogu biti takva da
ih rijetki rjeavaju ili zaokruuju, ali da im je i dalje mjesto u upitniku. Jedan primjer je pitanje u
upitnicima depresije koje se odnosi na suicidalne misli, osjeanja ili ponaanja. Ova pitanja tipino
nisu visoko povezana s drugim pitanjima niti ih ispitanici esto zaokruuju, ali za dijagnostiku i
intervencije ovo pitanje ima kljunu vanost. Moramo balansirati izmeu konzistencije pitanja i
sadrajne heterogenosti pitanja. Ranije smo govorili o homogenosti i heterogenosti pitanja kada
smo zapoeli priu o pouzdanosti kao unutarnjoj konzistenciji. Ali, sada, kada smo nauili to je
unutarnja konzistencija i koji faktori utjeu na pouzdanost, vrijeme je da unaprijedimo priu o
homogenosti i heterogenosti pitanja. Prilikom konstrukcije testa moramo sadrajno pokriti
razliite domene (situacije ili ponaanja) u kojima se neka karakteristika ispoljava. To znai da
moramo dopustiti odreeni nivo heterogenosti pitanja kako bismo zahvatili sam konstrukt. Ovaj
zadatak je utoliko zahtjevniji to je varijabla varijabilnija i to se ispoljava u vie konteksta i
vremenskih okvira. Sadraj pitanja se nalazi pod kontrolom psihologa koji razvija test i njegov
zadatak je da ocijeni koliko heterogen treba biti sadraj pitanja, pri emu odluku treba bazirati na
literaturi i poznavanju karakteristike za koju priprema test, te namjene testa i populacije za koju
se test priprema. Kako Urbina naglaava: Stepen u kojem je test namjerno dizajniran da sadri
heterogena pitanja ne moe biti tretiran kao izvor pogreke. Heterogenost testa ili kognitivnih
funkcija koje mjeri test i koje su potrebne za uradak na testu postaju izvor pogreke samo onda
kada je namjera bila da test bude homogen kroz sva ili veinu pitanja (2004, str.130).
Urbina u istom poglavlju daje sjajan pregled relativnosti homogenosti i heterogenosti u testovima.
Pitanje homogenosti i heterogenosti odnosi se na dva elementa: uzorke ponaanja koritene u
pitanjima i grupe ispitanika. Oba elementa utjeu na statistike parametre kojima se provjeravaju
metrijske karakteristike testa (npr. ogranienost obima, inter-item korelacije, atenuiranje
korelacije...) te je vano imati na umu:
1. Heterogenost i homogenost su uvijek u psihologiji relativni pojmovi. Dva su pitanja,
samom injenicom da su drukije formulirana, heterogena. Dva ovjeka su uvijek
heterogena jer nisu identini.
2. Definiranje pitanja ili ispitanika kao homogene ili heterogene grupe uvijek mora biti
uraeno na osnovu varijable ili varijabli koje slue za ustanovljavanje slinosti i razlika. Na
primjer, dva pitanja mogu biti homogena jer mjere isti profesionalni interes, ali su
heterogena u odnosu na sadraj (na primjer pitanja: Volim itati znanstvene lanke i Volim
izvoditi znanstvene eksperimente). Isto tako, grupa ljudi moe biti heterogena prema
spolu ili prema mjestu stanovanja, ali homogena prema nekoj drugoj varijabli (mogu biti
sve medicinski tehniari na klinici).
80
Kada ovo prevedemo u termine pravih i bruto rezultata gdje mi na osnovu bruto rezultata
pokuavamo predvidjeti pravi rezultat, ova formula poprima sljedei oblik:
6-25
=
6-26
=
Dakle, pravi devijacijski ili otklonski rezultat jednak je umnoku koeficijenta pouzdanosti i bruto
otklonskog rezultata.
Pravi rezultat procjenjujemo na osnovu bruto rezultata koristei formulu:
= ( ) +
pri emu je = , odnosno devijacijski bruto rezultat ispitanika od aritmetike sredine.
= +
Na primjer, ukoliko je ispitanik na testu, ija je aritmetika sredina 50, a koeficijent pouzdanosti
0,80, postigao rezultat 58, njegov procijenjeni pravi rezultat e biti:
= 0,80 (58 50) + 50 = 56,4 56
U procjeni pravog rezultata na osnovu bruto rezultata primjeujemo efekat koji zovemo regresija
prema sredini. To je efekat koji se odnosi na vjerovatnou da e drugi rezultat ispitanika biti blii
aritmetikoj sredini grupe nego prvi rezultat. Zbog ovog efekta, kada je ispitanikov bruto rezultat
vei od aritmetike sredine, njegov predvieni pravi rezultat je uvijek manji od bruto rezultata, a
kada je ispitanikov bruto rezultat manji od aritmetike sredine, njegov predvieni pravi rezultat
je uvijek vei od bruto rezultata ili blii aritmetikoj sredini.
Iz formule za procjenu pravog rezultata i poznajui efekat regresije prema sredini, moemo rei
da visina procijenjenog pravog rezultata ovisi o:
1. pouzdanosti testa
2. udaljenosti bruto rezultata od aritmetike sredine testa
3. smjeru razlike bruto rezultata od aritmetike sredine testa
6-27
( )
Znamo da je aritmetika sredina bruto rezultata ujedno i aritmetika sredina pravih rezultata, a
da je korelacija pravih i bruto rezultata jednaka odnosu standardne devijacije pravih i standardne
devijacije bruto rezultata, to znai da je:
= =1
Kada jedinicu uvrstimo u formulu 6-27, dobijemo da je predvieni bruto rezultat jednak pravom
rezultatu:
= +
6-28
Procijenjeni pravi rezultat je prosjeni rezultat na crti regresije. Da bismo odredili interval
pouzdanosti u kojem se s odreenom sigurnou nalazi pravi rezultat ispitanika, koji je na
testiranju ostvario neki bruto rezultat, potreban nam je i podatak o rasprenju moguih pravih
rezultata oko crte regresije. Ovo rasprenje nije nita drugo do standardna pogreka mjerenja.
Standardna pogreka mjerenja je rasprenje bruto rezultata jednog ispitanika na nizu ponovljenih
mjerenja ili standardna pogreka prognoze intervala pouzdanosti u kojem oekujemo bruto
rezultate ispitanika koji ima neki pravi rezultat.
Formula za standardnu pogreku mjerenja je:
6-29
= (1 )
Interval pouzdanosti odreuje se kao interval u kojem se sa 95 % ili 99 % sigurnosti oekuje da e
biti bruto rezultat ispitanika i odreuje se kao:
+ 1,96* ili + 2,58*
Na primjer, na testu ija je aritmetika sredina bila 50, standardna devijacija 8, a pouzdanost =
0,80, ispitanik je postigao rezultat 60. U kojem intervalu sa 95 % sigurnosti se nalaze bruto
rezultati ispitanika?
= 56 50 = 6
= 0,80 6 + 50
= ,
= 8 (1 0,80)
83
= 3,57
Gornja granica intervala pouzdanosti: 54,8 + 1,96*3,57= 61,8
Donja granica intervala pouzdanosti: 54,8 - 1,96*3,57= 47,8
Bruto rezultati ispitanika sa 95 % sigurnosti se nalaze u intervalu 48 62.
. = (1 )
Interval pouzdanosti odreuje se kao interval u kojem se sa 95 % ili 99 % sigurnosti oekuje pravi
rezultat ispitanika:
+ 1,96*. ili + 2,58*.
pri emu u formuli imamo koeficijent pouzdanosti koji je na paralelnim mjerenjima korelacija
izmeu rezultata na dvije primjene testa.
84
odnosno tada e test mjeriti iri raspon ponaanja i moi emo rei da on zaista mjeri
realistine interese. Korelacije meu pitanjima su atenuirane, ali ova atenuacija nije
klasina posljedica nepouzdanosti i ne znai nepouzdanost. Rjeenje ovog problema treba
traiti u umjerenosti. Nemudro je oekivati da u testu imamo pitanja u jedininim
korelacijama. Treba teiti ka tome da pitanja koreliraju s ukupnim uratkom u testu u
intervalu od 0,3 do 0,8, a da njihove meusobne korelacije budu od 0,1 do 0,6 (Guilford,
1965).
2. Kongenerinost jedna od osnovnih pretpostavki Klasine testne teorije je da pitanja
mjere samo jednu karakteristiku, odnosno da su jednodimenzionalna. Kongenerinost je
u osnovi paralelnosti mjerenja. Ne moemo oekivati visoke korelacije izmeu pitanja
ukoliko ne mjere jednu karakteristiku. Meutim, u analizama valjanosti (o kojima emo
priati kasnije) gotovo uvijek se pokae da pitanja mjere vie dimenzija. Kongenerini
model pretpostavlja i da nema korelacije meu grekama, a jednodimenzionalnost nema
jasno postavljenu pretpostavku o nekoreliranim pogrekama. Pogreke zaista mogu
korelirati. Nakon to se analizom valjanosti identificira povezanost pitanja s nekom
latentnom varijablom, ostaci varijanci pitanja (koju u Klasinoj testnoj teoriji pripiemo
pogreki) meu sobom mogu korelirati. Korelacije pogreaka javljaju se zato to je na
uradak u zadatku djelovalo vie faktora ili zbog uticaja metode ispitivanja (Podsakoff,
MacKenzie i Podsakoff, 2013). Dakle, pogreke nisu uvijek sluajne, one mogu korelirati iz
raznih razloga jer pitanja gotovo pa nikad ne mjere samo jedan faktor.
3. Tau-ekvivalentnost Klasina testna teorija pretpostavlja da pitanja, ne samo da mjere
jedan faktor nego taj faktor mjere u jednakoj koliini. To bi znailo da svako pitanje na
testu znanja treba imati jednak broj bodova za tano uraen zadatak ili da svako pitanje
u upitnicima linosti u jednakoj mjeri odreuje neku osobinu linosti. U praksi, to nije tako.
U testovima znanja pitanja skaliramo tako da imamo laka i tea, na upitnicima linosti
koristimo razliite domene. U analizi valjanosti vidimo da ne doprinosi svako pitanje
podjednako objanjenju latentne varijable. Moemo konstatirati da pitanja u testovima
nisu tau-ekvivalentna. tavie, njihova visoka tau-ekvivalentnost smanjila bi mogunost
da varijablu kvalitetno mjerimo i da razlikujemo ispitanike.
Na osnovu kritika Klasine testne teorije, teoretiari su postavili nove teorije kao to je Teorija
generalizabilnosti.
Individualne razlike
Subjektivnost posmatraa
Vremenska taka
Interakcija radnici X vrijeme
Interakcija posmatrai X vrijeme
Interakcija radnici X posmatrai X vrijeme
Greka mjerenja
6.5.2 G i D studije
Teorija generalizabilnosti koristi se za razliite vrste analiza, ali osnova ove teorije je da se analize
dogaaju u dva koraka. Prvi korak zovemo G studija ili studija generalizabilnosti (Marcoulides,
1996) u kojoj se procjenjuju komponente varijance iz prikupljenih podataka. U ovoj fazi se
identificiraju faktori koji utjeu na varijancu bruto rezultata i procjenjuje se njihov efekat preko
izraunavanja koeficijenta generalizabilnosti. U drugom koraku, rezultati prvog koraka koriste se
da bi se procijenila generalizabilnost kombinacija faceta i da bi se donijela odluka o buduem
mjerenju. Kako je ovo faza u kojoj se donosi odluka o nacrtu budueg mjerenja, ona se naziva i D
studija (decision study). Na primjer, provjerava se koliko pitanja treba ostati u upitniku, a da on i
dalje zadri svoj nivo generalizabilnosti ili koja su to pitanja koja imaju najbolje koeficijente
generalizabilnosti kako bi bila zadrana u buduem instrumentu.
2 =
Ispitanici
veseli
drueljubivi
otvoreni
1
2
3
4
5
Prosjeni rezultat
na pitanju
4
2
4
4
4
3,6
5
2
3
5
7
4,4
4
2
4
6
7
4,6
Prosjeni rezultat
ispitanika
4,3
2,0
3,7
5,0
6,0
Izvor varijance
Suma kvadrata
Stepeni
slobode
MS (prosjeni
kvadrat)
Komponente
varijance
Proporcija
varijance
Ispitanici (i)
27,1
i-1
6,8
1,2
0,54
Pitanja (j)
2,8
j-1
1,4
0,2
0,09
Rezidual
6,5
(i-1)(j-1)
0,8
0,8
0,37
Total
36,4
ij-1
2,2
1,00
6,8 0,8
= 0,88
6,8
Za svaku facetu moemo izraunati komponentu varijance, odnosno proporciju varijance koja
ukazuje na stepen u kojem je odreena faceta uticala na rezultate ekstraverzije.
Komponente varijance raunaju se prema formuli:
Tabela 6-20 Komponente varijance rezultata
Komponenta varijance
Ispitanici
Pitanja
Rezidual
pokazali nii prosjeni rezultat na pitanju koliko su veseli nego koliko su otvoreni. Meutim, mi i
elimo da ispitujemo razlike i ne elimo da imamo iste ocjene na pitanjima, a naa glavna briga je
da li u naim pitanjima imamo slinost u rangiranju ispitanika, odnosno da li su nam pitanja
konzistentna u smislu rangova koje ispitanici zauzimaju na svakom pitanju. Ako je Markov rezultat
bio drugi po rangu na prvom pitanju, da li je on drugi ili blizu drugog ranga na ostalim pitanjima?
Upravo zato to elimo razliite prosjene rezultate na pitanjima, nama efekat pitanja nije bitan.
Kada smo vidjeli prvi korak u kojem smo odredili komponente varijance, da vidimo to radimo u
drugom koraku studije, odnosno u D studiji.
2 =
+ ( 1)
91
6,8 0,8
6
=
= 0,71
6,8 + (3 1) 0,8 8,4
2 =
( 1) ( 1 )2
21
2 =
( )
+
pri emu je j broj pitanja u prvoj formi testa, a k- broj pitanja u drugoj formi testa.
3. U treoj moguoj strategiji imamo samo jedno pitanje za svakog ispitanika i pri tome se
pitanja ne ponavljaju. Ovaj dizajn mjerenja moemo zamisliti u situaciji ispitivanja branih
parova gdje brani partneri procjenjuju jedno drugo (teko bi bilo zamisliti zato bi neki
psiholog elio da svakom ispitaniku da jedno pitanje i da se ta pitanja ne ponavljaju).
Vidimo iz ovog primjera kako dizajn mjerenja u psihologiji moe biti kreativan. U sluaju
da imamo ovakvu situaciju, naa matematika postaje jednostavna analiza varijance jer
vie nemamo interakcije.
92
6-36
2 =
( )
+
+
4. Na kraju, mjerna strategija moe biti da imamo nekoliko pitanja ili ocjenjivaa za svaku
osobu pri emu ocjenjivai ocjenjuju samo tu osobu. Takav primjer imamo kada radnici
ocjenjuju kvalitetu rada svog rukovodioca. Rukovodilac je samo njihov i radnici sa drugih
odjela ga i ne mogu ocjenjivati.
U tom sluaju formula bi bila
6-37
2 =
( )
+
+
93
7 OSJETLJIVOST TESTA
Koji su osnovni koraci u analizi zadataka? Kako prepoznamo i kako korigiramo pogaanje
odgovora na testovima? Kako moemo odrediti osjetljivost testa?
Osjetljivost testa direktno je povezana sa pouzdanou kroz priu o homogenosti,
jednodimenzionalnosti i konzistentnosti. Iz didaktikih razloga, mi emo se osjetljivou testa
baviti u izdvojenom poglavlju. Osjetljivost ili diskriminativnost testa odnosi se na potencijal testa
da razlikuje ispitanike po odreenoj karakteristici. Kada kaemo diskriminativnost, u psihologiji
se referirano na razlikovanje. Ovaj termin je u osnovi neutralan, te je vano da ga ne mijeamo
sa negativnom konotacijom koju je poprimio u drutvenom kontekstu diskriminacija kao oblik
nepravednog postupanja sa odreenim grupama ljudi. Za psihologe on ima svoje izvorno
znaenje razlikovanje.
Moemo rei da je test osjetljiviji kada je sposoban da registrira i male razlike koje postoje u
karakteristici meu ispitanicima. Kao kad kuhamo kola, da bi kola bio dobar moramo imati
dobre sastojke. Tako je i kod testa da bi test bio osjetljiv njegova pitanja moraju biti osjetljiva.
Zato emo prvo govoriti o osjetljivosti zadatka, a onda i o osjetljivosti testa.
Prije nego krenemo u priu o osjetljivosti zadataka, moramo rei neto o pogaanju odgovora.
94
Zadatak
1
2
3
4
Ukupan
rezultat
KOLONA 2
Mio
bez
pogaanja
1
1
1
0
3
KOLONA 3
Azra
sa
pogaanjem
0
0
0
0
0
KOLONA 4
Mio
bez
pogaanja
1
1
1
0
3
KOLONA 5
Azra
sa
pogaanjem
0
1
1
0
2
Test snage
Test brzine
Sa korekcijom za pogaanje
1
=
1
=
Pri emu je
Np broj ispitanika koji je tano rijeio zadatak
Nn broj ispitanika koji je netano rijeio zadatak
Nz broj ispitanika koji nisu stigli do zadatka zbog ogranienog vremena (nepokuani zadaci)
4. U nepokuani zadaci zadaci iza kojih vie nema pokuaja rjeavanja (U untried)
U testovima snage, odnosno testovima u kojima vrijeme nije ogranieno, oekujemo da vidimo
tane i netane zadatke jer je ispitanik imao dovoljno vremena da proba rijeiti sve zadatke od
kojih je neke uspjeno uradio, a neke nije uspjeno uradio. U testovima brzine, koji su koncipirani
tako da ispitanik moe rijeiti sve zadatke, oekujemo da vidimo tane zadatke i nepokuane
zadatke. I u jednom i u drugom sluaju ne oekujemo da vidimo preskoene zadatke. Uzimajui
zdravo za gotovo injenicu da ispitanici pogaaju odgovore na pitanja objektivnog tipa, mi
moemo procijeniti koliko ispitanik zaista zna odgovoriti koristei formulu za korigirani rezultat
(Nunnally i Bernstein, 1994, str. 341):
7-1
Pri emu je A broj alternativa, R rezultat koji je ispitanik ostvario, a W broj pogrenih
odgovora. Vidimo iz formule da je korekcija manja to imamo vie alternativa. Dakle, kada imamo
samo dvije alternative (na primjer da li je tvrdnja tana ili pogrena) tada je korekcija najvea.
U sluaju da smo u testu naili na zadatke koje ispitanici nisu pokuavali rijeiti (preskoene i
nepokuane zadatke) korekciju radimo prema formuli:
7-2
= +
Kod testova brzine, u obzir moramo uzeti injenicu da je ispitanik bio ogranien vremenom i da
nije stigao probati da uradi sve zadatke. Za ovu korekciju koristimo formulu
7-3
pri emu su C i D konstante, gdje se preporuuje da C bude neto manje od A-1, a D neto vee
od A, odnosno broja alternativa.
Pogaanje je veliki problem koji Fajgelj (2003, str. 400 405, 470-472) obrazlae sa aspekta
jednakih vjerovatnoa pogaanja i sa aspekta vrste pitanja u testovima, te se preporuuje
dodatno prouavanje literature radi boljeg razumijevanja ovog fenomena.
Teine zadatka
Diskriminativne valjanosti zadatka ili diskriminabilnosti zadatka
Analizu distraktora
Korelacija meu zadacima
Karakteristine krivulje zadatka
97
Pitanje
1
2
3
4
5
P
0,1
0,3
0,5
0,7
0,9
q
0,9
0,7
0,5
0,3
0,1
Varijanca
0,09
0,21
0,25
0,21
0,09
Vidimo da bilo koja druga kombinacija p i q nee dati tako visoku varijancu. Naravno, pitanja koja
imaju veu varijancu poveat e varijancu testa i samim tim initi da test bude osjetljiviji.
Napomena: u sluaju da pitanje ne bodujemo sa 0 i 1, nego sa 1 i 2 (dodavanje konstante kako bi
se izbjegla nula) varijanca e ostati ista.
U testu elimo da imamo pitanja koja imaju visoke varijance. Ali, da li je to ba uvijek tako? Dva
su razloga za oprez prilikom odgovaranja na ovo pitanje: 1) odnos izmeu varijance pitanja i
njegova vanost za test i 2) ko je odgovorio tano ili zaokruio 1 na ovom pitanju.
Kada bismo test pravili samo od umjereno tekih stavki, mi bismo 1) onemoguili ispitanike koji
imaju neku karakteristiku malo izraenu da je uope pokau jer nemamo laganih zadataka; 2)
onemoguili ispitanike koji imaju karakteristiku jako izraenu da je pokau u punom kapacitetu.
Na primjer, kada bismo test iz aritmetike konstruirali samo od umjereno tekih zadataka, uenici
koji nisu dosegli taj nivo znanja dobili bi (hipotetski) 0 i mi bismo zakljuili kako oni nita ne
znaju. S druge strane, uenici koji matematiku jako dobro poznaju i mogu uraditi mnogo tee
zadatke osvojili bi maksimum na naem testu, ali njihov pravi rezultat prevazilazi skalu naeg testa.
I tada ne bismo dobro dijagnosticirali visinu izraenosti karakteristike. U klinikim testovima,
uvijek ima pitanja na koja samo rijetki daju pozitivan odgovor jer je to, na primjer, neki jako teak
i rijedak simptom. Kao laici mogli bismo rei da to pitanje treba izbaciti iz testa, ali, kao psiholozi,
mi smo svjesni vanosti sadraja tog pitanja i injenice da na njega pozitivno odgovara samo mali
procenat populacije. Zato takva pitanja ne eliminiramo iz testova.
Indeks teine nam nita ne govori o tome ko su ispitanici koji tano rjeavaju taj zadatak. Da bi
zadatak bio osjetljiv, on ispitanike treba da razlikuje tako da ga bolje rade ili ga vie zaokruuju
oni koji karakteristiku imaju vie izraenu. Moe se desiti da je pitanje optimalne teine, ali da ga
podjednako dobro rade i slabiji i bolji. Dakle, na osnovu odgovora na pitanje mi ne moemo
98
predvidjeti ko je bolji, a ko loiji. Stoga nam indeks teine ne moe biti jedini parametar u
odluivanju u osjetljivost zadatka, iako u sastavljanju finalne forme testa o njoj treba voditi rauna.
Ukoliko imamo jako lagana pitanja za nau populaciju, distribucija rezultata vie nee biti
normalna, nego negativno asimetrina. Kada imamo previe teka pitanja za nau populaciju,
distribucija rezultata na testu bie pozitivno asimetrina.
Optimalna teina zadataka zavisi i od broja alternativa. Jedan nain da procijenimo kolika bi
trebala biti optimalna teina pitanja u zavisnosti od broja alternativa dao je Gregory (1992)
7-4
1+
2
Pri emu je g- vjerovatnoa pogaanja odgovora. Na primjer, kada imamo etiri alternative
vjerovatnoa pogaanja tanog odgovora je 0,25. Optimalna teina zadatka je fleksibilan pojam i
nema recepta, ali se treba drati pravila da optimalna teina treba omoguiti najbolje razlikovanje
ispitanika. Optimalna teina bi bila izmeu 0,5 i 0,8, s tim da u testu trebamo imati i zadatke sa
teinom od 0,15 pa do 0,90.
Da rezimiramo priu oko teine zadatka, pogaanja i diskriminativnosti. Korekcije za pogaanje
radimo da bismo doli do procjene prave teine koja uzima u obzir injenicu da su ispitanici
spremni pogaati. Teina zadataka je bitan parametar diskriminativnosti, ali nije jedina mjera, te
ne moe objasniti kvalitetu razlikovanja u nekom testu.
Kada govorimo o kriteriju, govorimo o mjeri sa kojom emo usporediti zadatak. Osim testa, koji
je unutarnji kriterij, moemo koristiti i neko vantestno ponaanje za koje smo ranije potvrdili da
mjeri onu karakteristiku koju mjerimo zadatkom. To moe biti rezultat na nekom drugom
mjerenju. U tom sluaju govorimo o vanjskom kriteriju. Na primjer, ako imamo upitnik
ekstraverzije u kojem se nalazi pitanje: Imam iroki krug prijatelja , oni koji su ekstravertniji bi
trebali odgovarati na pitanje sa 1, a oni koji su introvertniji bi trebali odgovarati sa 0. Ako je to
pitanje koje zaista mjeri ekstraverziju, onda bi odgovori ispitanika trebali korespondirati sa
99
rezultatom na nekom drugom testu koji potvreno mjeri ekstraverziju. Vanjski kriterij moe biti i
rezultat objektivnih opaanja. Ipak, ukupan uradak na testu je uobiajeni kriterij.
Diskriminativnu valjanost zadatka odreujemo:
1. Metodom ekstremnih grupa
2. Korelacijama izmeu zadatka i kriterija
D= p+ - pto je indeks diskriminativnosti vii, to je diskriminativnost zadatka vea. Na primjer, imamo 1156
ispitanika koji su radili test matematike. Odredili smo rezultate na testu koji dijele ispitanike u
prvom i treem kvartilu. Rezultat Q1 = 9 i manje predstavlja najslabije, a Q3 = 16 i vie su oni
najbolji. U slabijoj grupi se nalazi 351 ispitanik, odnosno oni koji su postigli 9 ili manje bodova na
testu, dok se u grupi boljih nalaze 373 ispitanika koji su postigli rezultat 16 ili vie. Od 351
ispitanika, njih 88 je tano uradilo prvi zadatak, a njih 263 netano. U boljoj grupi, njih 267 je
uradilo tano prvi zadatak, a 106 netano.
Tabela 7-4 Kontingencijska tablica frekvencija uspjenosti uratka na zadatku i testu
Rijeili zadatak
Nisu rijeili zadatak
Bolja grupa
267
106
Slabija Grupa
88
263
p- = 88/351 = 0,25
p+= 267/373= 0,72
D = p+ - p- = 0,72 0,25 = 0,47
Vidimo da oni, koji su generalno bolji na testu, u veoj proporciji rjeavaju zadatak, a oni slabiji u
manjoj proporciji rjeavaju i zadatak. To je osnovna logika indeksa diskriminativnosti, kao i
diskriminativne valjanosti zadatka.
100
Ispitanik Zadatak
1
0
2
1
3
1
4
1
5
1
6
0
7
0
8
1
9
0
10
1
11
1
12
0
Test
8
9
7
6
5
8
4
5
5
10
10
9
Ispitanik Zadatak
14
0
15
1
16
0
17
0
18
1
19
1
20
0
21
1
22
0
23
0
24
1
25
0
Test
3
9
7
4
8
9
6
5
8
5
8
8
101
13
1
9
26
1
8
Odredimo aritmetiku sredinu testa za ispitanike koji su zadatak tano rijeili (ili koji su
oznaili 1 na pitanju, ukoliko je test postignua).
Mp= 7,7
7,7 7 0,54
2,01
0,46
= 0,37
Napomena: kada raunamo point-biserijalni koeficijent korelacije za zadatke u testovima brzine
uzimamo u obzir samo one ispitanike koji su doli do tog zadatka. U tom sluaju Mt, koja je bila
aritmetika sredina svih ispitanika, postaje Mt', odnosno aritmetika sredina na testu onih
ispitanika koji su doli do zadatka. p i q se obavezno raunaju samo sa rezultatima ispitanika koji
su doli do odreenog zadatka.
7.2.2.2.2.2 Biserijalni koeficijent korelacije
Biserijalni koeficijent korelacije rauna se kada nemamo zadatak kao prirodno dihotomnu
varijablu, nego smo varijablu naknadno dihotomizirali, dok s druge strane imamo rezultate testa
izraene na intervalnoj skali. Na primjer, mogli smo pitati ispitanike da ocijene skali od 1 do 5
koliko esto posjeuju kulturne dogaaje. 1 je nikako, 2 rijetko, 3 ponekad, 4 esto i 5
stalno. Za potrebe istraivanja kaemo da su ispitanici sa odgovorima 1 i 2 jedna grupa koja ima
nisku izloenost kulturnim sadrajima, a oni koji su odgovorili sa 3, 4 i 5 druga grupa sa veom
izloenou kulturnim sadrajima.
Biserijalni koeficijent se rauna prema formuli
7-7
pri emu je
Mp prosjeni rezultat na testu za one koji su zadatak tano rijeili
Mn prosjeni rezultat na testu za one koji su zadatak pogreno rijeili
102
Testni
rezultat
Uspjeni
Neuspjeni
Suma
Zadatak
pogreno
b
d
b+d
pravilno
A
C
a+c
Suma
a+b
c+d
N
= cos [
]
103
Pri emu je =3,14. Sada vidimo zato je ovaj koeficijent nepopularan meu psiholozima jer
koristi kosinus funkciju za odreivanje koeficijenta korelacije. Meutim, da vidimo to u
geometrijskoj prezentaciji znai kosinus.
Kosinus ugla odreen je kao odnos izmeu nalegle katete b i hipotenuze c. Kosinus ugla je vei
ukoliko je ugao otriji, a duina ove dvije dui slinija, odnosno to su dva vektora slinija duinom
to je njihov kosinus ugla vei:
7-9
= cos =
=
=1
=1 2 =1 2
Ovaj odnos je taan jer znamo da je u Pitagorinoj teoremi zbir kvadrata kateta jednak kvadratu
hipotenuza. U terminima varijance i standardne devijacije, zbir kvadrata kateta su u stvari
varijance dvije varijable, a kvadrat nad hipotenuzom je varijanca kombinacije dvije varijable. U
ovoj situaciji same varijable imaju nultu korelaciju.
Sada pretpostavimo da su X i Y povezane. To znai da e njihova varijanca biti jednaka:
+ = + + 2
U terminima odreivanja kosinusa ugla koji nije pravi analogna formula za odreivanje kosinusa
nepravog ugla je
2 = 2 + 2 2
104
+
2
+ + 2
2
=
Kako je
2
2
= rXY, to je onda
7-10
=
to je varijabilitet u jednoj varijabli manji, a u drugoj vei, to e i korelacija meu njima biti manja,
a to varijable slinije variraju to e i korelacija biti vea. Mi varijable moemo zamisliti kao dva
vektora. Ukoliko je ugao koji oni zaklapaju otriji to znai da su njihovi rezultati vie sinhronizirani,
odnosno poveanje rezultata na jednom vektoru, praeno je poveanjem rezultata na drugom
vektoru. Kosinus ugla koji ova dva vektora zaklapaju je u stvari njihova korelacija. Kada imamo
pravi ugao, kosinus ugla je 0, odnosno korelacija izmeu ove dvije varijable je 0. Ovakve vektore
zovemo ortogonalne. Kada dva vektora zaklapaju tupi ugao, njihov kosinus je negativan, odnosno
korelacija je negativna, a kod ugla od 180 kosinus je -1, odnosno korelacija je -1.
Pogledajmo primjer odreivanja tetrahorinog koeficijenta korelacije. Zamislimo da imamo
kontingencijsku tablicu s rezultatima 100 ispitanika na zadatku i na testu:
Testni
rezultat
Tabela 7-7 Kontingencijska tablica rezultata 100 ispitanika tetrahorini koeficijent korelacije
Zadatak
pogreno
10
20
30
pravilno
60
10
70
Uspjeni
Neuspjeni
Suma
Suma
70
30
100
10 10
10 10 + 60 20
= cos [
100
]
44,6
105
= cos [
100
]
44,6
( + )( + )( + )( + )
Zamislimo da smo imali grupu ispitanika kojima smo ispitivali sljepou na boje. Ispitanik radi
zadatak uspjeno ili neuspjeno, a na kraju je rezultat na testu ili da vidi boje ili da ne vidi boje.
Testni
rezultat
Uspjeni
Neuspjeni
Suma
pravilno
60
10
70
Zadatak
pogreno
10
20
30
Suma
70
30
100
60 20 10 10
70 30 70 30
= 0, 53
Napomena:
U literaturi (npr. Nunnaly i Bernstein, 1994) se navodi da u sluaju kada imamo dihotomne
varijable koristimo koeficijent. Meutim, ono to napominje Fajgelj (2003) i to je vano da
znamo je da, kada su podaci binarni, formule za i za Pearsonov r su identine, odnosno daju
identine vrijednosti jer je samo poseban sluaj Pearsonovog koeficijenta korelacije. Isto tako,
kada imamo jednu prirodno dihotomnu varijablu, a drugu kontinuiranu, tada je vrijednost pointbiserijalnog koeficijenta identina vrijednosti koju bismo dobili da raunamo obini r jer je pointbiserijalni koeficijent specifini oblik formule Pearsonovog koeficijenta korelacije. Za razliku od
106
Visina korelacije
0,40
0,3 0,39
0,2 0, 29
0,2
Kvaliteta pitanja
Vrlo dobro pitanje
Dobro pitanje
Slabo pitanje
Loe pitanje
50
50
50
50
50
50
50
50
50
50
rpbis
0,80
0,78
0,62
0,84
0,88
0,74
0,54
0,44
0,54
0,86
0,36
0,53
0,44
0,51
0,54
0,46
0,54
0,16
0,60
0,20
0,23
0,52
0,41
0,30
0,29
0,37
0,44
0,10
0,44
0,17
da li se radi o testu koji nije jednodimenzionalan. Da bismo odluili elimo li vie korelacije meu
pitanjima ili su nam i nie korelacije prihvatljive, moramo uzeti u obzir namjenu testa. Ukoliko se
radi o testu postignua sa zadacima razliite teine i iz razliitih domena, tu prirodno ne moemo
oekivati visoke korelacije, mada moemo oekivati pozitivne korelacije. S druge strane, ako
zaista mjerimo karakteristiku koja je homogenija (nego to je to znanje), onda oekujemo da
izmeu zadataka imamo vie korelacije. Dakle, nema recepta za proglaavanje pitanja dobrim ili
loim. Sve ovisi o cilju testiranja, facetarnosti varijable i njenoj varijabilnosti. Pogledajmo dvije
matrice korelacija na testu znanja i upitniku anksioznosti:
Tabela 7-71Korelacije pitanja na testu znanja i testu anksioznosti
Test znanja
k1
k1
k2
k3
k4
k5
1,0
0,1
-0,1
0,2
0,3
k2
1,0
0,4
0,2
0,0
k3
1,0
0,0
0,0
Upitnik anksioznosti
k4
1,0
0,3
k5
1,0
A1
A2
A3
A4
A5
A1
A2
A3
A4
A5
1,0
0,4
0,4
0,3
0,4
1,0
0,5
0,6
0,5
1,0
0,6
0,6
1,0
0,6
1,0
Usporedbom korelacija u ove dvije matrice vidimo da u upitniku anksioznosti imamo visoke
pozitivne korelacije, dok u testu znanja imamo niske korelacije. Razlog tome je to je test znanja
multidimenzionalan, odnosno mjeri razliita podruja znanja, dok je anksioznost homogenija
(makar kako je definirana za pripremu ovog upitnika). U poglavlju o valjanosti opet emo govoriti
o sadraju upitnika.
Psihologijom
Fizikom
Biologijom
Sociologijom
109
Inteligencijom
Statistikom
Biologijom
Sociologijom
Student koji je uio moe biti zbunjen jer je Spearman, osim to se bavio inteligencijom, dao veliki
doprinos razvoju statistikih metoda, te moemo rei da se bavio statistikom. To e dovesti do
toga da ispitanici koji znaju, daju pogrean odgovor, pa e pitanje ispasti tee nego to stvarno
jeste. Analiza distraktora se radi tako da ispitanike podijelimo u bolju i slabiju skupinu prema
uratku na testu, podatke o zaokruenim alternativama prikaemo u tabeli i pregledamo relativne
odnose izmeu broja odgovora na distraktorima u boljoj i loijoj skupini. Sjetite se da loijoj
skupini distraktori trebaju biti podjednako atraktivni, a bolju skupinu da ne zbune. Moramo voditi
rauna i o teini zadatka kada je zadatak laki, prirodno da ga bolje rade i ispitanici u slabijoj
skupini.
Tabela 7-82 Analiza distraktora
Bolja grupa
Slabija grupa
Pitanje 1
A B* C
7 8 2
6 6 4
D
1
3
Pitanje 2
A B C
10 2 2
3 2 2
Pitanje 3
D* A* B C
4
17 1 1
12 10 2 3
D
1
3
Pitanje 4
A B* C
1 7 3
0 19 4
D
7
5
Ako pogledamo pitanje 1, u obje grupe imamo podjednak broj biranja alternative A i B. Moemo
konstatirati da ovo pitanje podjednako uspjeno rade i jedna i druga grupa, a da je alternativa A
bila previe slina alternativi B. U drugom pitanju vidimo da je pitanje diskriminativno jer ga
slabije rade ispitanici u slabijoj grupi, ali im je alternativa D bila previe privlana i mogue da su
neki od njih bili zbunjeni pitanjem. U pitanju 3 vidimo dobru raspodjelu po distraktorima i to je
dobro udeeno pitanje, dok u pitanju 4 imamo inverziju njega bolje radi grupa slabijih nego
boljih. Ovo pitanje treba provjeriti zato je ono lake slabijim ispitanicima?
ispitanika ini da je test iskoristiv. Ako postoji neka razlika u nekoj karakteristici izmeu dva
ispitanika, a mi ne moemo da je identificiramo testom, onda taj test nema svoju funkciju jer e
ta dva ispitanika biti tretirana kao jednaki, ba kao i neka druga dva ispitanika koja zaista jesu
jednaki. Zato je to vano? Zato jer smo kao psiholozi svjesni da razlike u psiholokim
karakteristikama nisu samo kvantitativne prirode. Razlike su, prije svega, kvalitativne prirode. Na
primjer, ako govorimo o inteligenciji, razlika od 10 DQI jedinica nije isto to i razlika u 10 cm u
duini, zato jer se iza ove razlike od 10 DQI jedinica nalaze kvalitativne razlike u mentalnim
procesima. Osjetljivost testa vana je zbog kvalitativnih razlika.
Mogui rezultati na
testu
Frekvencije
(N = 60)
Broj ostvarenih
razlikovanja (BOR)
Maksimalni broj
ostvarenih razlikovanja
(BORmax)
5x 25 = 125
20 x 20 = 400
25
5 x 30 = 150
20 x 20 = 400
30
25 x 30 = 750
20 x 20 = 400
Ukupno 1025
Ukupno 1200
Vidimo da imamo ukupno 1025 parova razliitih rezultata. Maksimalni broj parova razliitih
rezultata bi bio kada bi distribucija bila kvadratina, odnosno kada bi jednak broj ispitanika
postizao svaki od moguih rezultata na testu.
Da bismo odredili osjetljivost testa, koristimo Fergusonov (delta) koeficijent. Iako je Thurlow
(1950) bio meu prvima koji je prepoznao da postoji razlika izmeu osjetljivosti i pouzdanosti
testa, te pisao o osjetljivosti i ponudio koeficijent, ovaj koeficijent ostao je poznat kao
Fergusonova delta. Thurlow i Ferguson (Ferguson, 1949) rekli su da za svaku veliinu uzorka
111
postoji maksimalni mogui broj razlikovanja koji se moe opaziti (BORmax). Maksimalni broj
razlikovanja moe se usporediti s brojem stvarno opaenih razlikovanja i taj odnos se moe izraziti
proporcijom. Fergusonov je odnos izmeu opaenog broja razlikovanja i maksimalnog mogueg
broja razlikovanja:
7-12
Ukoliko su svi postigli isti rezultat, onda je =0. Ovaj koeficijent baziran je iskljuivo na ordinalnim
karakteristikama podataka. Iako neki autori smatraju da je ovaj koeficijent nepotreban (Norman,
2008) i da je generalno osjetljivost jednako pouzdanost, drugi autori istiu da je ovaj koeficijent
koristan jer predstavlja dodatni indeks, osim koeficijenata pouzdanosti i valjanosti. On se i rauna
kada postoje zadovoljene glavne metrijske karakteristike pouzdanost i valjanost.
Formula za odreivanje Fergusonovog koeficijenta u sluaju kada imamo dihotomne varijable
je:
7-13
( + 1)( 2 2 )
=
2
Pri emu je:
K broj pitanja
N broj ispitanika
F frekvencija svakog rezultata
U sluaju kada imamo politomne varijable (varijable s vie vrijednosti) Fergusonov koeficijent
se rauna kao:
7-14
(1 + ( 1))( 2 2 )
2 ( 1)
podruju viih vrijednosti. Neko ko nije dovoljno upuen u psihologiju rekao bi da onda trebamo
imati zadatke srednje teinske primjerenosti. Ali, kao to smo ranije rekli, trebamo u testovima i
zadatke koji su tei i laki kako bismo svima omoguili da pokau raspon u kojem posjeduju
karakteristiku. To znai da moramo balansirati u pripremi zadataka, a kriterij teinske
primjerenosti zadatka ne smije biti jedini kriterij.
Kao grubu procjenu teinske primjerenost testa raunamo prosjeni indeks teine zadataka:
7-15
dijeljenje M sa brojem zadataka = nam daje uvid u visinu prosjenog indeksa lakoe.
Ipak, kvaliteta i teina zadataka u testu zavisit e prije svega od namjene testa i populacije za koju
je test namijenjen. Ako je namjena testa da ga koristimo na iroj populaciji i da imamo norme,
tada moramo voditi rauna o sastavu samog testa tako da u njemu imamo zadatke koji
omoguavaju postizanje normalne distribucije. Testovi mogu biti konstruirani tako da za opu
populaciju budu jako lagani ili jako teki, ali oni imaju posebnu namjenu. Na primjer, test moe
biti namijenjen djeci s odreenim deficitima u mentalnom funkcioniranju, ali to ne znai da se
djeca ne razlikuju po svojim kapacitetima. Ovaj test bi imao izrazito negativnu asimetriju i jako
slabo razlikovao djecu u iroj populaciji, ali na populaciji djece s odreenim mentalnim deficitom
rezultati bi mogli imati normalnu raspodjelu. Ista situacija je i za izrazito nadarenu grupu.
Nadarena grupa e uraditi test za opu populaciju bez ikakvih problema. Za njih trebamo test sa
zadacima koji su jako teki za djecu u iroj populaciji, ali e omoguiti da unutar specifine grupe
detektiramo razlike. Dakle, namjena testa odreuje i teine zadataka.
Kako provjeravamo da li je dolo do poremeaja diskriminativnosti?
1. Vizuelnim pregledom distribucije rezultata ve pogled na distribuciju u sluaju izrazitih
odstupanja od normaliteta moe nam rei da je to
Slika 7-3 Normalni grafikon vjerovatnoe
nedovoljno
osjetljiv
test.
Ipak,
ova
odokativna metoda ne moe biti osnova za
dokazivanje u psihologiji.
2. Normalnim grafikonom vjerovatnoe u kojem se na
apscisi nalaze opaene frekvencije, a na ordinati
teoretske frekvencije. U sluaju normalne raspodjele,
krianja se tada nalaze na pravcu x=y. Ako nije normalna
raspodjela, onda emo imati devijaciju s pravca.
3. Indeks asimetrije i kurtoze (indeks varijabilnosti i
visine distribucije) o kojim ste uili na Statistici ukazuju
na to da li postoji problem. Kada imamo problem, onda e indeks asimetrije biti vei od
standardne devijacije, a javit e se i problem s visinom distribucije.
113
KV =
100
BRR = k+1
Na primjer, ako na testu imamo 5 zadataka na testu tada je:
BRR = 5+1=6
2 2
=
2
korelacija r=0, tada je varijanca minimalna, ali bi broj razliitih individualnih ukupnih rezultata
mogao biti ak k +1. Tada imamo problem da su zadaci potpuno heterogeni. Ovdje se osjetljivost
kosi sa dvije stvari: s pouzdanou (pouzdanost je bazirana na korelacijama) i injenicom da
heterogeni zadaci daju neupotrebljiv ukupni rezultat jer se ne zna koja je od karakteristika vie
utjecala na uradak. Kako rjeavamo ova dva problema? U praksi, vodimo rauna da korelacije
meu zadacima imamo u prihvatljivoj zoni i da nisu previsoke (jer to znai da imamo redundantne
zadatke). Rjeenje je da test sadri zadatke nejednake teine, ali da oni budu u
pristojnim korelacijama.
Indeks
teine
Mia
Ema
0,2
0,4
0,6
0,8
0,9
JLK
DPLK
Z1
1
0
Z2
1
1
Z3
1
0
U4
0
1
Z5
0
1
3
3
1,2
2,1
Mia je znala rijeiti prva tri zadatka, a Ema drugi, etvrti i peti. Ako pogledamo indekse teine ovih
zadataka, vidjet emo da je Ema znala rijeiti tee zadatke, a Mia samo lake. Kada rezultat
formiramo kao JLK one imaju jednak rezutat i kaemo: One su jednake. U koli bi dobile istu
ocjenu. Ali, Ena i Mia nisu jednake. Ena je bolja. Ako ponderiramo njihove uratke s indeksima
teine zadataka, onda vidimo tu razliku. Ukoliko dopustimo da teina zadataka utjee na
bodovanje ispitanika, onda emo ih moi bolje razlikovati. Stoga, iako se u literaturi mogu nai
argumenti protiv ponderiranja, ponderiranje vodi ka osjetljivijim testovima.
115
8 VALJANOST
to je valjanost? Da li je to karakteristika testa ili testnih rezultata? Zbog ega je vana?
Koji su dokazi valjanosti?
Zamislimo sljedeu situaciju. Miro eli postati pilot. Prijavio se na testiranje za pilota. Tamo ga je
doekalo mnogo ispitivanja od senzornih sposobnosti, zdravstvenih provjera pa sve do
psiholokih testova inteligencije i linosti. Miro se potrudio, ali je za dvije sedmice dobio
odbijenicu. Bio je jako ljut i uloio je albu. Dobio je odgovor da, prema psiholokom profilu, ne
odgovara za mjesto pilota. Miro se zapitao kako to oni znaju? to se mjeri psiholokim testovima
pa da bi mogli predvidjeti moj budui uspjeh kao pilota? Ovo pitanje, koje je sebi Miro postavio,
jedno je od glavnih pitanja u psihometriji to mjerimo naim testovima? Ovim pitanjem emo
se baviti u poglavlju o valjanosti.
8.1 TO JE VALJANOST?
Dva pitanja koja sebi stalno postavljamo su:
Kako se moe interpretirati psihika osobina, stanje ili proces nekim testom kao mjernim
postupkom?
U kojem stepenu ili koliko dobro ispitujemo predmet mjerenja nekim mjernim postupkom?
testa) i onoga ko koristi test u praksi (ko procjenjuje dostupne dokaze u kontekstu u kojem se test
koristi).
Na primjer, Test opih sposobnosti (Smith i Whetton, 1999) sadri 4 subtesta kojima se mjere
Numeriki, Verbalni, Spacijalni i Neverbalni faktor. Verbalni faktor sposobnosti mjeri se testom
od 36 zadataka koji zahtijevaju traenje analogija meu ponuenim rijeima. Autori su, pri
konstrukciji testa, krenuli od definicije da je verbalni faktor sposobnost razumijevanja rijei kroz
koritenje analogija. U terminima valjanosti, ovih 36 zadataka sami od sebe nisu ni valjani ni
nevaljani. Ali, autorove interpretacije rezultata mogu biti valjane ili nevaljane. Da li su autori
ispravno interpretirali rezultate na svih 36 pitanja kao razumijevanje rijei kroz koritenje
analogija? Valjanost je pitanje tanosti i legitimiteta interpretacija testnih rezultata. U definiciji
valjanosti se kae predviena podruja za koritenje. Testovi se mogu koristiti u razliitim
podrujima. Test verbalnih sposobnosti moemo koristiti u istraivanju, ali i u profesionalnoj
selekciji kako bismo utvrdili da li je kandidat dovoljno verbalno vjet da bi se nosio sa zahtjevima
posla. Meutim, rezultati na naem testu moda jesu valjano interpretirani kao verbalni faktor,
ali da li je ovaj rezultat zaista koristan u smislu predvianja ponaanja budueg zaposlenika? Svaki
test ima vie namjena, odnosno podruja u kojima se testni rezultati mogu koristiti, a dokazi za
interpretacije rezultata mogu biti izvedeni na razliite naine. Valjanost je kao, na primjer, kaika.
Moemo rei da je kaika koristan predmet. Ali za to je korisna? Kaika je korisna da jedemo
supu ili varivo ili da izvadimo sladoled u iniju, manje je korisna da njome jedemo komad mesa,
ali je gotovo beskorisna za rezanje kruha (iako u nedostatku noa i kaika moe posluiti). Tako je
i s valjanou mjernih instrumenata za neka podruja test je jako koristan, ali za neka potpuno
beskoristan. Valjanost nije karakteristika testa, nego karakteristika interpretacije rezultata testa.
Brojni psiholozi ipak i dalje govore o valjanosti testa, vjerovatno zbog toga to je tako
jednostavnije, to ne vide nijanse valjanosti ili to im je lijeno da kau valjanost rezultata, pa kau
verbalni test je valjan. Valjanost testnih rezultata bazira se na dokazima i teoriji. To znai da
koritenje testova mora biti posljedica poznavanja dokaza koji podravaju koritenje tog testa u
odreenoj situaciji. Suvremeni pogledi na valjanost upravo naglaavaju vanost interpretacije
testova u okviru stabilne psiholoke teorije.
Valjanost testnih interpretacija pregleda se kroz osnovne tipove valjanosti. Tradicionalna podjela
tipova valjanosti ukljuivala je sadrajnu, kriterijsku i konstruktnu valjanost. Meutim, u
posljednjih 20 godina pogled na valjanost se promijenio. Ta promjena se, prije svega, ogleda u
pozicioniranju konstruktne valjanosti kao centralnog koncepta koji povezuje druge koncepte,
odnosno dokaze za identificiranje valjanosti rezultata. Osim toga, kao kriterij za ocjenu valjanosti
promoviran je i kriterij socijalnih posljedica testiranja. U Standardima za pedagoko i psiholoko
testiranje (AERA, APA, i NCME, 2006) potcrtano je 5 osnovnih grupa dokaza za identificiranje
valjanosti testnih interpretacija. Tih pet grupa prikazano je na slici 8-1:
117
Unutarnja
struktura
Povezanost
s drugim
varijablama
Sadraj
testa
Konstruktna
valjanost
Proces
odgovaranja
Posljedice
koritenja
Konstruktna valjanost interpretacija rezultata zavisi od sadraja pitanja, unutarnje strukture testa,
psiholokih procesa ukljuenih u odgovaranje, povezanosti s drugim varijablama te posljedicama
koritenja testova. Od sada emo rije konstrukt esto koristiti, pa je trebamo objasniti.
Konstrukt predstavlja sve to se nalazi u ljudskom umu, a to nije mogue direktno opaati. U
psihologiji, konstrukt oznaava koncepte kao to su osobine, ali oznaava i teoretske povezanosti
izmeu koncepata koje izvodimo na osnovu empirijskih dokaza iz ponaanja ljudi. Psiholoki
konstrukti razlikuju se po svojoj irini i kompleksnosti, potencijalu za koritenje i stepenu
apstrakcije potrebnom da bi se o njima zakljuivalo na osnovu prikupljenih podataka. Po pravilu,
ue definirani konstrukti su manje apstraktni i imaju ue podruje primjene (na primjer, lokus
kontrole). Ali, kako je za njih jednostavnije doi do dogovora izmeu znanstvenika to je taj
konstrukt, oni se mnogo lake mjere nego kompleksni multifacetni konstrukti koji mogu imati
drukija znaenja izmeu kultura, konteksta ili vremena.
konstruktom. Facijalna valjanost je stepen u kojem laici doivljavaju relevantnost testa i namjenu
testiranja. Zbog toga je nama, u psihometrijskom smislu, mnogo vanija sadrajna valjanost.
120
( )
( )
[( )( )]
2
1 2
Pri emu su stepeni slobode df = N-2. U sluaju kada raunamo koeficijent korelacije, statistika
znaajnost se rauna preko 2 , a formula je:
8-3
2 = 2
pri emu su stepeni slobode df =1
Dobivena korelacija je samo jedna od moguih korelacija izmeu prediktora i kriterija jer je
dobivena na uzorku ispitanika. Stoga nas zanima u kojem intervalu moemo oekivati korelaciju
izmeu naeg testa kao prediktora i neke varijable kao kriterija. Da bismo odredili interval
pouzdanosti, ne moemo koristiti sirovu korelaciju (o tome smo govorili u dijelu 6.2.2) nego je
moramo transformirati u Fisherov z-koeficijent.
=
ln(1 + ) ln(1 )
2
Osim z-koeficijenta potrebna nam je i standardna pogreka kako bismo mogli postaviti interval
pouzdanosti. Ona se rauna prema formuli:
8-4
1
3
121
2 1
2 + 1
122
Kada pogledamo kole pojedinano, vidimo da postoji korelacija izmeu uratka na testu i
zakljunih ocjena. Ali prosjeni rezultati na testu matematike meu kolama se sistematski
razlikuju i ovi uenici nisu jedinstvena populacija, odnosno imamo heterogen uzorak. Kada ovo
ne bismo uzeli u obzir i sve rezultate ispitanika korelirali na ukupnom uzorku, dobili bismo da je
ta korelacija blizu 0. Ovo bi bio pogrean zakljuak jer korelacija oigledno postoji. Kada imamo
heterogene uzorke, potrebno je izraunati pojedinane korelacije za svaki poduzorak i odrediti
prosjenu korelaciju, i to tako da prvo korelacije transformiramo u Fisherove z-koeficijente, a
potom dobiveni prosjeni z-koeficijent transformiramo u koeficijent korelacije. Dobiveni
prosjeni koeficijent korelacije predstavlja reprezentantu odnosa testnih rezultata i zakljunih
ocjena.
123
12.3 =
12 13 23
1 13 2 1 23 2
U naem primjeru agresivnost je oznaena sa 1, postignue u koli sa 2, a broj sati pred TV-om 3:
12 = 0,5; 13 = 0,4 i 23 = 0,6.
12.3 =
Dakle, parcijalna korelacija izmeu agresivnosti i postignua u koli iznosi -0,35 to je manje od
njihove neparcijalizirane korelacije.
124
U drugom pitanju kolika bi bila korelacija izmeu broja sati provedenih pred televizorom i
postignua u koli ako parcijaliziramo utjecaj agresivnosti dobili bismo sljedei rezultat:
8-6
23.1 =
23.1 =
23 12 13
1 12 2 1 13 2
0,6 (0,5 0,4)
1 0,251 0,16
23.1 = 0,5
Kao i svaki put, potrebno je da provjerimo statistiku znaajnost korelacije koja se u sluaju
parcijalne korelacije rauna preko formule:
8-7
12.3
1 12.3
1
r12 = +0,20
r13 = +0,80
125
r23 = 0,40
Zar nije udno da je korelacija izmeu uloenog napora i rezultata na testu tako niska? Ove
korelacije nam govore da to je vei strah, to e student uloiti i vei napor (rXZ= 0,80). S druge
strane, to je vei strah, to e student biti slabiji na testu (rYZ=0,40). Ako parcijaliziramo utjecaj
straha, dobijemo da je korelacija izmeu napora i uratka jednaka:
12.3 =
0,2 + 0,32
1 0,641 0,16
12.3 = 0,94
Vidimo da je stvarna korelacija izmeu napora i uratka mnogo vea od one koju smo imali na
poetku (to naim studentima iz primjera nije i ne mora biti neka utjeha), ali je nismo vidjeli zbog
supresorskog efekta varijable straha.
1(2.3) =
12 13 23
1 23 2
1(2.3) = 0,096
=
12.3
1 12.3
1
0,096
2
1 0,096
300 1
127
1 =
1 2 12
2
1 12
1 =
2 1 12
2
1 12
8-10
8-11
2 =
1 2 + 2 2 21 2 12
2
1 12
1
R= [
1
1
]
1
1
r= ( )
128
pri emu je R matrica korelacija meu prediktorima, a r stupani vektor korelacija prediktora
s kriterijem. Primijetite da se u formuli koristi inverz matrice R, a ne originalna matrica. U dijelu
4.5.2.3 nauili smo to je inverz matrice. Vektor beta pondera odreuje se kao umnoak inverza
matrice korelacija meu prediktorima i vektora korelacija prediktora s kriterijem. Ukoliko su
prediktori u nultim korelacijama, tada e ponderi biti jednaki korelacijama koje prediktor ima s
kriterijem, odnosno:
= 0 =
Kako su ponderi standardizirani regresijski koeficijenti b, regresijske koeficijente odreujemo
koristei kovarijance:
b = C-1 *c, odnosno
1
=()
1
C= [
1
1
r= ( )
pri emu je C matrica kovarijanci meu prediktorima a r stupani vektor kovarijanci prediktora
s kriterijem.
Konstanta a ili odsjeak na y -osi (intercept) rauna se prema formuli:
8-13
=
Pri emu je aritmetika sredina kriterija, b regresijski koeficijent prediktora, a
aritmetika sredina prediktora.
2 = ; = 2
129
= 2
Pri emu je:
2
1
kvadrirana korelacija prvog prediktora s kriterijem
2
(2.1)
kvadrirana semiparcijalna korelacija drugog prediktora s kriterijem (nakon to je iz
drugog prediktora parcijalizirana zajednika varijanca s prvim prediktorom)
2
(.123..1)
semiprarcijalna korelacija P prediktora s kriterijem (kada su iz ovog prediktora
parcijalizirane zajednike varijance svih drugih prediktora).
U ovom trenutku pretpostavimo da nije vano koji je prediktor u grupi bio prvi u jednaini. Ono
to treba da primijetite je da je prvi prediktor i jedini prediktor koji u jednaini odreivanja
multiple korelacije ima puni koeficijent korelacije. U dijelu 8.3.1.6 koji se odnosi na ukljuivanje
prediktora u multiplu regresiju, postat e vaan i poredak prediktora. Zato koristimo
semiparcijalnu korelaciju, a ne parcijalnu korelaciju? Zbog toga to nam je potrebno da
parcijaliziramo povezanost ve ukljuenog prediktora u jednainu, ali ne i povezanost sa samim
kriterijem.
3. Trei nain smo spominjali kada smo govorili o linearnim kombinacijama. Rezultat na kriteriju
predstavlja diferencijalno ponderiranu linearnu kombinaciju prediktora, odnosno
= 1z1 + 2z2 + . . . + kzk
Za razliku od r, beta ponderi mogu biti vei od 1, ali treba nai set beta pondera, takvih da se
zadovolji princip najmanjeg kvadrata, odnosno da ( )2 =minimum, odnosno da
( (1 1 + + )2 ) = minimum. U sluaju sa dva prediktora ova korelacija izmeu
seta prediktora kao linearne kombinacije i kriterija iznosila bi:
130
8-16
2
2
1
+ 2
21 2 12
=
2
1 12
2
=
(1 2 )
1
pri emu je k broj prediktora, 2 kvadrirani koeficijent multiple korelacije, a N broj ispitanika.
Stepeni slodobe odreeni su ovdje i brojem prediktora i brojem ispitanika, tako da je df= k/N-k1.
2 2
=
(1 2 )
1
Svi parametri sa b u supskriptu odnose na set s veim brojem prediktora, a parametri sa a na
set s manjim brojem prediktora. Vidimo da i ovdje koristimo F statistiku pri emu su stepeni
slobode:
df = ( ) / ( 1)
Primjer: Pretpostavimo da matricu korelacija izmeu tri prediktora i kriterija:
131
KRITERIJ
0,56
0,4
0,47
0,56
0,6
0,3
0,4
0,6
0,46
Zadnja kolona predstavlja vektor korelacija izmeu tri prediktora i kriterija, dok je lijevi dio ove
matrice matrica korelacija meu prediktorima.
Odredit emo 1) inverz matrice, 2) vektor pondera, 3) koeficijent multiple korelacije.
Korak 1: Odreivanje inverza matrice
1
0,56 0,4
R =[0,56
1
0,6]
0,4
0,6
1
1.1.
Determinanta matrice:
1
0,56 0,4
1 0,6
0,56
D = |0,56
1
0,6| =1*|
| 0,56*|
0,6 1
0,6
0,4
0,6
1
0,4
0,56 0,4
| + 0,4*|
|=
1
1
0,6
Inverz matrice:
0,64
1.2.1. Matrica minora M = [ 0,32
0,064
0,32
0,84
0,376
0,064
0,376 ]
0,686
0,64
0,32
0,84
1.2.2. Matrica kofaktora K= [ 0,32
0,064 0,376
0,64
0,32
0,84
1.2.3. Transpon matrice K' =[0,32
0,064 0,376
0,064
0,376]
0,686
0,064
0,376]
0,686
R -1
0,64
= [[0,32
0,064
0,32 0,064
1,47
0,84
0,376]] / 0,435 = [0,74
0,376 0,686
0,15
0,73 0,14
1,93 0,86]
0,86 1,58
132
1,47 0,73
R -1 = [0,74 1,93
0,15 0,86
0,14
0,86]
1,58
= r' * = (0,47
0,40
0,3 0,6) (0,16) = 0,47 0,40 + 0,3 (0,16) + 0,6 0,54 = 0,386
0,54
Na slici lijevo korelacije prediktora s kriterijem su jednake kao i na slici desno, odnosno njihove
zajednike varijance s kriterijem su jednake. Ali zbog korelacije meu prediktorima, na slici lijevo
dio zajednike varijance ulazi u objanjenje varijance prediktora samo jednom, dok na slici
desno nema podskupa i poveava se proporcija objanjene varijance za dupli dio zajednike
varijance prediktora. Ovo nije jedina prednost nekoreliranih prediktora. Druga prednost je to ne
postoji dilema kojem prediktoru pripisati zasluge za objanjenje varijance kriterija. Ovo e
postati vrlo vano pitanje kod ukljuivanja prediktora u regresijsku jednainu. Izuzetak od ovog
naela su supresori i komplementarne varijable.
133
2. Koeficijent multiple korelacije ne moe biti negativan. Statistiki postupci koje koristimo
za odreivanje pondera podeavaju predznake tako da R bude 0 ili pozitivan (Nunnally i
Bernstein, 1994, str. 187). Naravno, to znai da moramo obratiti panju na smjer odnosa
meu varijablama jer o njemu ne moemo zakljuivati iz R.
3. Koeficijent multiple korelacije ne moe biti nii od najvie vrijednosti korelacije koju neki
prediktor ima s kriterijem. Na primjer, ako jedan prediktor korelira s kriterijem 0,6, onda
nema smisla da koeficijent multiple korelacije bude nii. Logiki, to bi znailo da dodavanje
prediktora umanjuje mogunost predvianja rezultata na kriteriju.
4. Korelacije meu prediktorima i beta pondere nezahvalno je odreivati bez matematikog
izrauna oslanjanjem samo na grafike prikaze. Ovo je posebno vano u situacijama kada
imamo supresor varijable.
5. Kada su prediktori dobro izabrani, koeficijent multiple korelacije rijetko ima dramatian
porast dodavanjem prediktora. Osim toga, ne smijemo zaboraviti na princip parsimonije i
trebamo voditi rauna da ne dodajemo prediktore koji su praktino neznaajno povezani
s kriterijem. Ponekada se psiholozi zaborave, neke im se varijable uine interesantnim, te
ih ukljuuju u regresijske modele ime kontaminiraju objanjenja dobivenih rezultata.
6. Multipla korelacija dobivena na uzorku sistematski je vea od korelacije u populaciji. Ova
razlika se smanjuje s poveanjem uzorka ispitanika i poveanjem broja prediktora. Zato
se ovo deava? Zbog toga to je sve u uzorku (kako smo govorili u teoriji
generalizabilnosti)! Mi biramo iz vee grupe prediktora (s tim da sada imamo ogranieni
broj prediktora koji su vezani za neko kriterijsko ponaanje) manji broj prediktora, i to
tako da unaprijed znamo koji su prediktori najvie povezani s kriterijem. Ova
inflacija korelacije je jo vea kada prediktore biramo prema rezultatima istraivanja, a
ne prema teoriji. Na pristranost odabira prediktora dolazi i greka uzorkovanja. Na primjer,
u istraivanju organizacijskog kontraproduktivnog ponaanja u kojem je uestvovalo 500600 ljudi odredili smo visinu korelacije izmeu odabranih prediktora (savjesnosti,
integriteta i lokusa kontrole) i kontraproduktivnih ponaanja (kao to je laganje, varanje,
krae, kanjenja i slino). U selekciji nam je vano da predvidimo koliko bi kandidat bio
sklon ovakvim ponaanjima. Ali mi smo izabrali neke prediktore iz itavog skupa
prediktora, te imali ispitanike koji su, koliko god mi vodili rauna, samo uzorak vee
populacije. Zato nam je potrebno da procijenimo kolika bi bila multipla korelacija u
populaciji. Za procjenu populacijskog R koristimo formulu:
8-19
2 = 1 (1 2 )
1
1
134
135
K1
K
3
K23
2
3
K
2
K12
12
8.3.1.6.1
Standardna
regresijska analiza
U standardnoj regresijskoj
analizi svi prediktori ulaze
odjednom
u
regresijsku
jednainu pri emu je svaki prediktor tretiran tako da su iz njega parcijalizirani utjecaji svih drugih
prediktora (samo semiparcijalne korelacije svakog prediktora). Ako pogledate sliku 8-8, vidjet
ete da varijanca kriterija koju objasnimo standardnom regresijskom analizom predstavlja
podruja K1, K2 i K3, dok dijelovi K12 i K13 ostanu neobjanjeni, odnosno koeficijent multiple
determinacije odnosi se samo na oiene zajednike
Slika 8-7 Standardna regresijska analiza
varijance prediktora s kriterijem.
Tabela 8-5 Standardna regresijska analiza
136
Change Statistics
Std.
Error of
R
Adjusted the
Square R Square Estimate
Model R
0.362a
0,13
0,12
R
Square
F
Change Change
11,56
0,13
19,99
Sig. F
df1
df2
Change
3,00 397,00
0,00
U prvoj koloni je koeficijent korelacije R=0,362, a proporcija objanjene varijance 0,13. F statistika
nam pokazuje da je ovo znaajan koeficijent korelacije, odnosno da su prediktori znaajno
povezani s kriterijem.
Druga tabela prikazuje pondere (izvjetaj sadri i druge tabele, ali o njima vie detalja u literaturi
o statistikim programima):
Tabela 8-3 ponderi u standardnoj regresijskoj analizi
Model
62,073
,299
Std.
Error
5,100
,097
,195
,594
B
1
Standardize
d
Coefficients
Unstandardize
d Coefficients
(Constant)
SAVJESNOST
EMOCIONALNA_STABILNOS
T
INTELEKT
Sig.
Beta
,157
12,171
3,079
,000
,002
,092
,104
2,123
,034
,117
,247
5,090
,000
Std.
Error of
R
Adjusted the
Square R Square Estimate
Model R
1
2
3
.254
.273b
.362c
,065
,075
,131
Change
Statistics
R Square
F
Change Change
,062 11,96064
,065 27,531
,070 11,91167
,010
4,288
,125 11,55558
,057 25,906
df1
1
1
1
Sig. F
df2
Change
399
,000
398
,039
397
,000
138
Unstandardized
Coefficients
Model
B
1
2
(Constant)
SAVJESNOST
(Constant)
SAVJESNOST
EMOCIONALNA_STABILNOST
(Constant)
SAVJESNOST
EMOCIONALNA_STABILNOST
INTELEKT
82,922
,486
79,209
,424
,196
62,073
,299
,195
,594
Standardized
Coefficients
Std.
Error
3,533
,093
3,949
,097
,095
5,100
,097
,092
,117
Sig.
23,471
5,247
20,058
4,365
2,071
12,171
3,079
2,123
5,090
,000
,000
,000
,000
,039
,000
,002
,034
,000
Beta
,254
,221
,105
,157
,104
,247
Primijetite da smo u ovom didaktikom primjeru u drugom bloku uveli emocionalnu stabilnost
koja je manje povezana s efikasnou u donoenju karijernih odluka nego intelekt. Razlog za to je
to smo pretpostavili da su rezultati do sada ukazivali na to da emocionalna stabilnost u odnosu
na otvorenost vie doprinosi samoefikasnosti u donoenju karijernih odluka.
Model
R
1
.297a
2
.348b
3
.362c
R
Adjusted
Square R Square
,088
,086
,121
,117
,131
,125
Std.
Error of
the
Estimate
11,80889
11,60636
11,55558
Change Statistics
F
Sig. F
R Square Change
Change df1 df2 Change
,088 38,564
1 399
,000
,033 15,046
1 398
,000
,010
4,505
1 397
,034
139
Model
1
2
Unstandardized
Standardized
Coefficients
Coefficients
Std.
B
Error
Beta
t
Sig.
74,931 4,270
17,549 ,000
,714 ,115
,297 6,210 ,000
65,749 4,818
13,646 ,000
,594 ,117
,247 5,073 ,000
,361 ,093
,189 3,879 ,000
62,073 5,100
12,171 ,000
(Constant)
INTELEKT
(Constant)
INTELEKT
SAVJESNOST
(Constant)
INTELEKT
SAVJESNOST
EMOCIONALNA_STABILNOST
,594
,299
,117
,097
,247
,157
5,090 ,000
3,079 ,002
,195
,092
,104
2,123 ,034
metodu
141
pri emu je R spuriozna korelacija izmeu varijable za koju raunamo multikolinearnost i ostalih
prediktora. Mala toleranca ukazuje na visoku spurioznu korelaciju. Veina programa ima ugraen
algoritam za raunanje tolerance koje je postavljena na 0,01 do 0,0001. R mora biti najmanje 0,99
da bi prediktor bio izbaen iz analize. Toleranca se moe podeavati na stroije i blae kriterije.
142
8.3.1.7.3 Iznimke
Iznimke su rezultati koji su numeriki udaljeni od ostalih. To su, kako kau Cohen, Cohen, West i
Aiken (2002), atipini podaci koji nisu usklaeni s ostatkom podataka i djeluju kao da dolaze iz
druge populacije. Iznimke se pojavljuju iz razliitih razloga. Prva grupa razloga vezana je za
pogreke u radu s podacima. Obino je to zbog pogrenog unosa podatka ili pogrenog kodiranja
podatka, kao i pogrene interpretacije. Na primjer, umjesto upisa 1 mi upiemo 11. Ukoliko nismo
postavili zatitu koja onemoguava unos ovakvih podataka, oni e biti registrirani i uzeti u obzir
kod analiza. Druga grupa su stvarne statistike iznimke koje se pojave zbog pogreke mjerenja, ili
zbog nelinearnog odnosa kojega mi nismo bili svjesni. Iznimke detektiramo pregledom grafova i
statistikim odreivanjem udaljenosti podatka od prosjene predviene vrijednosti.
U jednostavnom bivarijatnom sluaju, iznimke mogu vie ili manje utjecati na poloaj regresijske
crte. Pogledajmo neke didaktike primjere.
Tabela 8-12 Iznimka na crti regresije
Na slici 8-12 vidimo da je jedan ispitanik postigao visok rezultat i na prvoj i na drugoj varijabli,
meutim njegov rezultat ne utjee na poloaj crte regresije. Meutim, na slici 8-13 vidimo da je
ispitanik postigao nizak rezultat na drugoj varijabli i oigledno nije u trendu s ostalim
rezultatima. Ova dva primjera nam pokazuju i razliku meu vanim terminima u definiranju
iznimaka razlika (discrepancy), snaga (leverage) i utjecaj (influence) iznimke. Razlika pokazuje
koliko je iznimka u liniji s drugima, snaga nam govori o tome koliko je iznimka daleko od ostalih
ispitanika, a utjecaj je produkt razlike i snage. U prvom sluaju imamo primjer velike razlike, male
snage i umjerenog utjecaja. U drugom primjeru imamo veliku razliku, umjerenu snagu i umjeren
utjecaj.
to radimo s iznimkama? Prva pomisao bi bila da ih izbriemo iz baze podataka. Meutim prije
donoenja ovako radikalne odluke, trebamo pogledati da li one tvore smislenu grupu ispitanika
koja dijeli karakteristiku i da li ih ima mnogo. Prvo trebamo provjeriti da li smo pravilno unijeli
podatke. Ukoliko jesmo i ukoliko su iznimke sporadini sluajevi, te nemamo objanjenje za
143
njihovo pojavljivanje, moemo ih brisati. Ali ukoliko ih ima vie, onda je potrebno prikupiti jo
podataka kako bismo se uvjerili da su oni zaista iznimke. Ako se pokae da oni tvore smislenu
grupu ispitanika, trebamo ih posebno tretirati u obradama.
varijablama
konvergentna
3. Svaki zadatak u mjerenju je jedna jedinica na koju utjeu crta i metoda. Sadraj zadatka
odreen je crtom koja se mjeri metodom, a koja nije specifina za sam sadraj. Na primjer,
pitanje u upitniku ekstraverzije ima sadraj za koji se pretpostavlja da je interpretacija
ekstraverzije, a metoda je skala od 1 do 5 koja se ne koristi samo za ekstraverziju nego i
za druge konstrukte.
4. Da bismo ispitali diskriminativnu valjanost i procijenili relativni doprinos i crte i metode,
mi u validaciji moramo koristiti vie crta (radi razlikovanja crta) i vie metoda (radi
procjene utjecaja metode).
To nas vodi do formiranja matrice vie crta vie metoda (skr. MTMM od engl. Multi trait multi
method).
Pogledajmo primjer MTMM matrice. U ovoj matrici prikazani su rezultati mjerenja est tipova
profesionalnih interesa prema Hollandovoj teoriji (Holland, 1997). Holland je tipove
profesionalnih interesa vidio kao tipove linosti i naziva ih profesionalnim linostima /
identitetima (vocational personalities). Prema njegovoj teoriji, postoji 6 osnovnih tipova
profesionalnih interesa: realistiki (R), istraivaki (I), artistiki (A), socijalni (S), poduzetniki (S) i
konvencionalni (C). Ovi tipovi u nomolokoj mrei formiraju heksagon. Meusobno su razliiti, ali
izmeu njih postoje veze, i to tako da tipovi koji su blii u heksagonu imaju i vie povezanosti.
Radi ilustracije, dva susjedna tipa tipu R su C i I, dok mu je suprotan tip A s kojim bi trebao imati
najnie korelacije. Ovi tipovi su nae crte. Kako bismo mjerili ove tipove, koristili smo dvije
metode. Jedna je procjenjivanje koliko se ispitanicima sviaju zanimanja koja tipino pripadaju
pojedinim tipovima, a druga je koliko se ispitanicima sviaju odreene aktivnosti koje su, opet,
povezane s odreenim tipovima.
Svianje
Zanimanja
Zanimanja
A
S
Preferencije
A
S
R
0,87
0,57
0,82
0,26
0,54
0,84
0,27
0,49
0,55
0,82
0,46
0,43
0,3
0,62
0,63
0,67
0,43
0,17
0,32
0,63
0,83
0,6
0,4
0,18
0,18
0,34
0,62
0,76
0,36
0,57
0,48
0,41
0,28
0,22
0,41
0,81
0,21
0,45
0,72
0,44
0,22
0,1
0,22
0,66
0,84
0,16
0,4
0,53
0,65
0,36
0,08
0,22
0,59
0,65
0,74
0,38
0,42
0,39
0,52
0,58
0,37
0,47
0,47
0,46
0,74
0,77
0,56
0,38
0,24
0,32
0,48
0,6
0,69
0,46
0,32
0,33
0,58
0,80
146
MTMM matrica nije tipina korelacijska matrica iako su korelacije u njoj najvie zastupljene. U
glavnu dijagonalu se upisuju koeficijenti pouzdanosti i to je razlikuje od tipine korelacijske
matrice (u kojoj su u glavnoj dijagonali jedinice). MTMM matrica ima nekoliko osnovnih dijelova:
1. Dijagonala pouzdanosti u dijagonali pouzdanosti MTMM matrice nalaze se koeficijenti
pouzdanosti
2. Dijagonale konvergentne valjanosti male dijagonale koje povezuju istu crtu mjerenu
razliitim metodama izmeu mjera. Kada imamo vie metoda, tada za svaki par metoda
imamo po jednu dijagonalu konvergentne valjanosti.
3. Trokutovi razliita crta ista metoda trokutovi diskriminativne valjanosti koji sadre
korelacije izmeu razliitih crta mjerenih istom metodom
4. Trokutovi razliita crta razliita metoda trokutovi diskriminativne valjanosti koji sadre
korelacije izmeu razliitih crta mjerenih razliitom metodom. Ne oekujemo potpunu
nezavisnost metoda tako da ove koeficijente itamo u relativnom odnosu s dijagonalom
valjanosti.
Kako itamo MTMM matricu? Ukoliko su testovi dizajnirani da mjere istu crtu, onda bi njihovi
rezultati trebali korelirati visoko, a ukoliko se testni rezultati odnose na druge konstrukte, onda
rezultati ne bi smjeli visoko korelirati. Razmotrimo jo pitanje nezavisnosti mjera. I pouzdanosti i
valjanost kao metrijske karakteristike zahtijevaju da postoji slaganje izmeu mjera. Meutim,
razlika u interpretaciji slaganja izmeu mjera kod pouzdanosti i valjanosti ogleda se u tome to
kod pouzdanosti mjere nisu nezavisne (sjeate se, to su paralelne mjere), dok kod ispitivanja
konvergentne valjanosti govorimo o slaganju nezavisnih mjera. Cronbach i Meehl (1955) kau
kako uspjenost predvianja rezultata na nekoj neovisnoj mjeri daje veu snagu objanjenju
konstruktne valjanosti testnih rezultata nego to je to predvianje nekog slinog konstrukta.
Meutim, nezavisnost mjera nije binarna, to je vie stepen nezavisnosti, tako da i pouzdanost i
valjanost trebamo posmatrati na kontinuumu (to smo ve i spominjali test nije valjan ili
nevaljan). Same metode ne moraju biti potpuno nezavisne (ne trai se od nas da u testovima
imamo potpuno razliite naine bodovanja), tako da se oekuje da postoji jedan dio zajednike
varijance koja dolazi zbog veza izmeu metoda (a ne crta per se).
Konvergentna valjanost oitava se u dijagonalama valjanosti i ukoliko testovi mjere isti konstrukt,
onda oekujemo da u ovim dijagonalama imamo najvie koeficijente korelacije.
Diskriminativnu valjanost oitavamo u trokutovima razliita crta ista metoda i razliita crta
razliita metoda. Ukoliko su konstrukti razliiti, onda bi u trokutovima razliite crte iste metode
trebali dobiti korelacije koje su znaajno nie od onih u dijagonalama valjanosti. Meutim, kako
su to crte mjerene istom metodom, oekujemo da imamo neto vie korelacije nego u
trokutovima razliita crta razliita metoda zbog zajednike varijance metode. U trokutovima
razliita crta razliita metoda oekujemo najnie korelacije u itavoj matrici. Ovdje nam je vaan
i odnos meu korelacijama. Interpretacija koeficijenata u dijagonali valjanosti u apsolutnom
smislu bi imala svoje opravdanje samo u nekom sluaju da su i konstrukti i metode potpuno
neovisne. Tada bismo u trokutovima imali sve nulte korelacije. Ali to se u praksi nikada ne deava.
Zbog toga, tumaenje visine konvergentne valjanosti je vie u duhu relativnog odnosa
koeficijenata dijagonale valjanosti s koeficijentima u trokutovima.
147
Iako se kao najei razlog za procjenu neadekvatne valjanosti uzimaju niske korelacije u
dijagonali valjanosti, testovi mogu proglaeni nevaljanim i zbog visokih korelacija koje imaju sa
drugim mjerenim crtama. Na primjer, ako u trokutovima razliita crta razliita metoda imamo
korelacije sline kao onima u dijagonalama valjanosti ili ako su korelacije u trokutovima razliita
crta ista metoda sline visinama pouzdanosti iz glavne dijagonale, moemo rei da na test nije
dovoljno valjan jer ne razlikuje dovoljno mjerene crte ili je sama metoda znaajno utjecala na
zajedniku varijancu.
Da sumiramo, ono to procjenjujemo u MTMM matrici su relativni odnosi izmeu visina korelacija
u pojedinim elementima, i to:
1. Procjenjujemo prvo da li imamo pouzdane mjere. Ako u glavnoj dijagonali, koja sadri
koeficijente pouzdanosti, imamo niske vrijednosti, onda znamo da je upliv greke u
rezultate bio veliki. Kako je pouzdanost potreban (ali ne i dovoljan) uvjet za valjanost,
svako daljnje tumaenje valjanosti mora biti uzeto s oprezom.
2. Procjenjujemo konvergentnu valjanost tako to pregledamo visine korelacija u malim
dijagonalama valjanosti koje povezuju istu crtu mjerenu razliitim metodama. Ove
korelacije bi trebale biti najvie od svih korelacija u matrici. Da li su korelacije
zadovoljavajue procjenjujemo u odnosu na korelacije u trokutovima.
3. Diskriminativnu valjanost ocjenjujemo preko korelacija razliite crte ista metoda i
razliite crte razliite metode. Korelacije u prvim trokutovima (razliite crte ista
metoda) mogu biti neto vie u odnosu na korelacije u drugom trokutovima (razliite crte
razliite metode) zbog ukljuivanja metodske varijance. Ipak, ni u ovim trokutovima
neemo imati nulte korelacije jer su konstrukti obino povezani u nomolokoj mrei i jer
metode ne moraju biti potpuno nezavisne.
4. MTMM matricu moemo koristiti i za procjenu razliitosti metoda. Na primjer, dvije mjere
bazirane na samoposmatranju nisu razliite metode, dok su mjere objektivnog opaanja i
skala psihosomatskih simptoma razliite metode.
Pogledajmo sada na primjer u tabeli 8-22. Vidimo da neke skale imaju vrlo visoku pouzdanost
(uzimajui u obzir da su skale samoprocjene), dok su neke (kao to je E skala zanimanja) niske
pouzdanosti. U dijagonali valjanosti vidimo da imamo umjerene korelacije meu mjerama istih
crta, dok su najzanimljiviji podaci u trokutovima ista crta razliita metoda. Sjetite se kako smo
rekli da, prema Hollandovoj teoriji, susjedni tipovi visoko koreliraju, a suprotni tipovi nisko
koreliraju. Ako pogledate korelacije izmeu R tipa sa C i I vidjet ete da su one vie od ostalih, a
da je korelacija R i A najnia, to govori u prilog heksagonalnoj strukturi profesionalnih interesa.
tavie, korelacije izmeu R i C su vie nego to su sve korelacije u dijagonali valjanosti. To nam
ukazuje da nismo uspjeli u potpunosti dokazati razliitost konstrukata. Razlog tome mogu biti:
slinost sadraja pitanja, nerazumijevanje pitanja od strane ispitanika, pristranost u uzorku, te niz
drugih faktora koji ukazuju da je potrebno dalje raditi na validaciji ovog upitnika. Iako bismo mogli
mnogo priati o profesionalnim interesima, na zadatak ovdje je da nauimo tumaiti MTMM
matricu tako da se neemo uputati u elaboracije Hollandove teorije. Preporuuje se da sami
pogledate matricu i pokuate jo bolje razumjeti MTMM metodu.
MTMM matrica nam daje vrlo korisne smjernice u evaluaciji konstruktne valjanosti. Pregledom
utjecaja varijance crte i varijance metode na korelacije meu mjerama dobivamo bolji uvid u
148
P1
P1
P2
P3
P4
P5
P6
P2
P3
P4
P5
P6
1
1
U ovoj didaktikoj matrici vidimo da imamo dvije grupe pitanja. Unutar dvije grupe pitanja su u
potpunim korelacijama, dok izmeu grupa meu pitanjima nema korelacija. Moemo
pretpostaviti da prva grupa pitanja mjeri jedan konstrukt, a druga grupa pitanja mjeri drugi
konstrukt. Tri su osnovna pitanja koja sebi postavljamo u vezi s dimenzionalnou testova:
1. Koliko dimenzija mjeri test?
2. Koje je psiholoko znaenje tih dimenzija?
3. Da li su dimenzije povezane, odnosno korelirane?
Da bismo razumjeli odgovore na ova pitanja, da krenemo od strukture bruto rezultata.
metoda ili neka druga sistematski prisutna varijabla (to se u KTT tretira kao pogreka) utjee na
rezultate i ona se u teoriji generalizabilnosti ne vidi kao sluajna pogreka, nego kao sistematski
faktor koji formira pravi rezultat.
Kada razvijemo formulu za pravi rezultat koju smo koristili u pouzdanosti (Xb =Xt + Xe), imajui na
umu da pravi rezultat moe biti posljedica djelovanja vie konstrukata i specifinih faktora,
dobijemo sljedeu formulu pravog rezultata:
Xt = X c + X s
Pri emu je Xc dio pravog rezultata koji se javlja pod djelovanjem glavnih konstrukata ili
zajednikih faktora, a Xs dio pravog rezultata koji nastaje pod djelovanjem specifinih faktora
(npr. metode).
Rekli smo da Xc moe biti formiran pod djelovanjem vie dimenzija. Na primjer, ako imamo
problemni zadatak iz matematike, na uradak na zadatku djeluje numeriki faktor, ali i
razumijevanje verbalnog sadraja. Tako moemo dalje razviti nau formulu pri emu je:
Xc = XA + XB + XC + ... + Xr
Kada sve uvrstimo u poetnu formulu za bruto rezultat, dobijemo da je bruto rezultat jednak:
8-20
= + + + + +
Vidimo da koristimo logiku multiple regresije gdje predviamo opaeni rezultat ispitanika na
osnovu njegove povezanosti s latentnim dimenzijama. Ukoliko dimenzije nisu u korelaciji, tada
su = r (to smo nauili u prethodnim dijelovima) te e onda opaeni rezultat biti jednak:
8-22
= + + + + +
Kod pouzdanosti, varijancu smo podijelili na varijancu bruto rezultata i varijancu pogreke.
Sada, varijancu moemo dodatno podijeliti. Ukupna varijanca standardiziranih rezultata iznosi
1.
150
151
P1
P2
P3
P4
P5
P6
P7
P8
P9
P1
P2
0,65
1,00
P3
0,38
0,42
1,00
P4
0,42
0,50
0,40
1,00
P5
0,42
0,51
0,46
0,60
1,00
P6
0,42
0,48
0,40
0,55
0,59
1,00
P7
0,39
0,41
0,26
0,55
0,44
0,42
1,00
P8
0,46
0,56
0,36
0,55
0,51
0,55
0,51
1,00
P9
0,41
0,48
0,30
0,63
0,49
0,51
0,56
0,67
1,00
P10
0,43
0,51
0,36
0,58
0,57
0,52
0,50
0,57
0,62
P10
Ulaz za faktorsku analizu moe biti matrica bruto rezultata ili korelacijska matrica. Postoji jedna,
pomalo paradoksalna, situacija koju trebamo poznavati da bismo mogli razumjeti razliku izmeu
osnovnih metoda faktorske analize. Kaemo da faktorskom analizom provjeravamo koliko
zajednikih faktora doprinosi objanjavanju varijabli. Zanima nas struktura komunaliteta. Ali, mi
ne znamo koliki je komunalitet manifestne varijable jer ne moemo parcijalizirati varijancu
manifestne varijable (za koju znamo da je ukupno 1 kada je standardizirana i da je sastavljena od
komunaliteta, specificiteta i varijance pogreke, a upisana je u glavnoj dijagonali korelacijske
matrice). Kada u matrici ostavimo jedinice, mi smo, ustvari, ostavili itavu varijancu manifestne
varijable i dopustili da itava bude analizirana. Na kraju analize dobijemo faktore od kojih su neki
zajedniki, a neki nisu, nego su specifini i pogreka. S druge strane, moemo pokuati procijeniti
komunalitet kao spurioznu korelaciju svake manifestne varijable sa svim ostalim varijablama. To
znai da emo u glavnoj dijagonali imati kovarijancu te varijable s ostalim varijablama. U prvom
sluaju, kada u interkorelacijskoj matrici imamo jedinice, matricu zovemo kompletnom
matricom, analiziramo varijancu i metoda ekstrakcije se naziva metoda glavnih komponenti. Cilj
metode glavnih komponenti je da maksimalno ekstrahira varijancu iz seta podataka. U drugom
sluaju, kada u matrici imamo procjene komunaliteta, matricu zovemo reduciranom matricom,
152
a metoda ekstrakcije naziva se metoda zajednikih faktora. Cilj metode zajednikih faktora je da
reproducira korelacijsku matricu s malim brojem ortogonalnih faktora (faktora koji nisu u
korelaciji). Da vidimo jo neke matrice koje e nam biti vane u faktorskoj analizi (tabela preuzeta
iz Tabachnik i Fidell,2007):
Tabela 8-11 Vrste matrica u faktorskoj analizi
Oznaka
R
Z
F
A
Matrica
Korelacijska
matrica
Matrica rezultata
Red matrice
pxp
Nxp
Rotacija
Pravokuta
kosokuta
Pravokuta
kosokuta
Pravokuta
kosokuta
Pravokuta
i
i
i
Kosokuta
pxm
Pravokuta
kosokuta
pxm
kosokuta
mxm
kosokuta
Opis matrice
Matrica opaenih korelacija
meu manifestnim varijablama
Matrica standardiziranih
opaenih rezultata
Matrica standardiziranih
rezultata varijabli na faktorima
Matrica regresijskih
koeficijenata izmeu varijable i
faktora. Ukoliko su faktori
ortogonalni. onda je ovo i
matrica korelacija izmeu
varijabli i faktora
Matrica regresijskih
koeficijenata za odreivanje
faktorskih rezultata iz varijabli
Matrica korelacija izmeu
varijabli i koreliranih faktora
Matrica korelacija meu
faktorima
P1
P2
P3
P4
153
P1
1,00
0,18
0,50
0,07
P2
0,18
1,00
0,02
0,51
P3
0,50
0,02
1,00
-0,07
P4
0,07
0,51
-0,07
1,00
C1
1,75
1,71
1,45
1,51
riF1
0,69
0,67
0,57
0,60
0,69
0,67
0,57
0,57
0,69
0,48
0,47
0,40
0,41
0,67
0,47
0,45
0,39
0,40
0,57
0,41
0,40
0,34
0,36
0,57
0,40
0,39
0,33
0,34
-0,29
0,55
-0,37
0,11
0,11
-0,37
0,67
-0,41
-0,35
0,11
-0,41
0,64
U ovoj matrici imamo negativne znakove to nam u sljedeem koraku predstavlja problem
kod sabiranja korelacija. Negativni znakovi bi nam umanjili ukupnu sumu elemenata.
Stoga je potrebno ovu matricu prezrcaliti ili preslikati tako da redove i kolone nekih
varijabli pomnoimo sa -1. Ako mnoimo varijablu sa -1, to radimo i za red i za kolonu.
U naem sluaju to su varijable 2 i 4. Ove varijable, koje preslikamo ili prezrcalimo imat e
negativnu korelaciju s narednim faktorom (u ovom sluaju drugim faktorom).
154
+
+
-
+
0,52
-0,29
0,11
-0,35
-0,29
0,55
-0,37
0,11
+
0,11
-0,37
0,67
-0,41
-0,35
0,11
-0,41
0,64
Kao rezultat dobit emo sljedeu korelacijsku matricu za raunanje drugog faktora R2:
P1
P2
P3
P4
P1
0,52
0,29
0,11
0,35
P2
0,29
0,55
0,37
0,11
P3
0,11
0,37
0,67
0,41
P4
0,35
0,11
0,41
0,64
C1
1,26
1,31
1,56
1,51
riF1
0,53
0,55
0,66
0,64
S ovom matricom ulazimo u novu iteraciju za raunanje korelacija varijabli s drugim faktorom. U
posljednje dvije kolone prikazane su vrijednosti C i korelacije varijabli s drugim faktorom. Ovaj
postupak ponavljamo sve dok rezidualna matrica ne bude prazna. Osim centroidne metode
postoje i druge metode koje neemo prouavati u ovom priruniku. Centroidnu metodu smo
iskoristili da razumijemo logiku ekstrakcije faktora. Pretpostavimo da smo sada ispraznili nau
poetnu matricu. Nakon to zavrimo s ekstrakcijom faktora, formiramo matricu faktorske
strukture A. Matrica faktorske strukture je matrica regresijskih koeficijenata (ako su faktori
ortogonalni onda korelacija) izmeu varijabli i faktora.
Tabela 8-13 Matrica faktorske strukture
Pitanje
F1
F2
0,69 0,53
0,67 0,55
0,57 0,66
0,60 0,64
Kako je ukupna varijanca koja je analizirana u ovom naem sluaju 4 (varijanca svake varijable je
1, imamo 4 varijable), moemo izraunati proporciju ili postotak objanjene varijance u svim
varijablama s faktorima. Prvi faktor objanjava 1,62/4 = 0,40, odnosno 40 % varijance svih varijabli,
a drugi faktor objanjava 1,43/4 =0,36, odnosno 36 % ukupne varijance manifestnih varijabli.
Kako znamo da je ekstrahirani faktor glavni ili zajedniki? Prema dogovorenom standardu,
ukoliko je karakteristini korijen vei od 1 ( > 1), onda se taj faktor smatra znaajnim. Ovaj kriterij
zove se Kaiserov kriterij. Iako je ovaj kriterij esto kritiziran (jer je arbitraran i ne mora uvijek biti
jedini kriterij za odreivanje koji su faktori zajedniki), u standardnim paketima za obrade
podataka, vrijednost karakteristinog korijena je postavljena na 1, tako da e program, ukoliko
ne intervenirate, sve komponente ija je vrijednosti vea od 1 prepoznati kao zajednike
faktore. Ova vrijednost zaista je esto neadekvatna za odreivanje znaajnosti faktora, posebno
kada se radi o sloenim, multidimenzionalnim mjerama i kod velikih uzoraka. Kako su Costelo i
Osborne (2005) u svom jako korisnom lanku istaknuli ..eksploratorna faktorska analiza je
sloena procedura s malo apsolutnih smjernica i mnogo opcija.
Osim toga, moemo izraunati i komunalitet varijabli kao zbir kvadriranih korelacija jedne
varijable sa svim zajednikim faktorima po principu:
1 2 = 0,692 + 0,532 =0,76
Vidimo da ova dva faktora objanjavaju 0,76 ili 76 % varijance nae prve manifestne varijable
(naeg prvog pitanja).
Communalities
Initial
Extraction
156
zad1
zad2
zad3
zad4
zad5
zad6
zad7
zad8
zad9
zad10
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
.444
.561
.320
.631
.584
.555
.473
.631
.614
.605
Total
5.416
.926
.744
.570
.514
.461
.396
.365
.332
.276
Initial Eigenvalues
% of Variance
Cumulative %
Total
54.162
9.258
7.443
5.697
5.142
4.612
3.958
3.651
3.321
2.755
54.162
63.419
70.863
76.560
81.702
86.314
90.273
93.924
97.245
100.000
5.416
% of Variance
Cumulative %
54.162
54.162
U ovom sluaju, iako je ekstrahirano 10 komponenti, samo jedna komponenta ima karakteristini
korijen vei od 1. To je prva komponenta i njen karakteristini korijen je 5,416. Druga
komponenta ima karakteristini korijen 0,926 i izmeu njih je velika razlika. U drugoj koloni
imamo postotak objanjene varijance u svim varijablama pojedinim komponentama. Prva
157
.666
zad2
.749
zad3
.566
zad4
.794
zad5
.764
zad6
.745
zad7
.687
zad8
.794
zad9
.783
zad10
.778
158
Ako paljivo proitate pitanja, vidjet ete da su prva tri namijenjena da mjere konflikt od posla
prema porodici, a druga tri da mjere konflikt od porodice ka poslu. Korelacijska matrica naih
pitanja izgleda ovako:
Tabela 8-16 Korelacijska matrica est pitanja Upitnika konflikta privatne i poslovne uloge
P1
P2
P3
P4
P5
P6
P1
P2
P3
1,00
0,59
0,39
0,59
1,00
0,46
0,39
0,46
1,00
0,22
0,25
0,36
0,21
0,27
0,31
0,19
0,26
0,32
P4
P5
0,22
0,21
0,25
0,27
0,36
0,31
1,00
0,58
0,58
1,00
0,55
0,70
P6
0,19
0,26
0,32
0,55
0,70
1,00
Iz korelacijske matrice vidimo da prva tri i druga tri pitanja izmeu sebe relativno visoko koreliraju,
dok su izmeu njih nie korelacije. Meutim, to nam nije dovoljna informacija da bismo potvrdili
dvodimenzionalnost upitnika, te emo podatke obraditi tako da emo koristiti faktorsku analizu,
i to analizu zajednikih faktora. Pogledajmo u nastavku rezultate:
159
Communalities
Initial
Extraction
konfliktpp1
.365
.510
konfliktpp2.
.421
.673
konfliktpp3.
.301
.360
konfliktpp4
.402
.478
konfliktpp5
.546
.716
konfliktpp6
.524
.662
Initial Eigenvalues
Factor
1
2
3
4
5
6
Total
2.897
1.320
.611
.480
.392
.300
% of
Variance
48.283
22.000
10.186
7.999
6.538
4.995
Cumulative %
48.283
70.283
80.468
88.467
95.005
100.000
Total
2.480
.918
% of
Variance
41.338
15.308
Cumulative %
41.338
56.646
Rotation
Sums of
Squared
Loadingsa
Total
2.201
1.857
Slika 8-15 Scree plot faktora na Upitniku konflikta privatne i poslovne uloge
160
Tabela 8-19 Matrica faktorske strukture i obrasca Upitnika konflikta privatne i poslovne uloge
Factor Matrixa
Factor
1
2
P1
,516
,493
P2
,618
,540
P3
,560
,217
P4
,650
-,236
P5
,755
-,383
P6
,726
-,368
Extraction Method:
Principal Axis Factoring.
a. 2 factors extracted. 16
iterations required.
Pattern Matrixa
Factor
1
2
P1
-,062
,739
P2
-,031
,833
P3
,206
,481
P4
,659
,068
P5
,859
-,031
P6
,826
-,029
Extraction Method: Principal
Axis Factoring.
Rotation Method: Oblimin with
Kaiser Normalization.
a. Rotation converged in 5
iterations.
Structure Matrix
Factor
1
2
P1
,259
,712
P2
,332
,820
P3
,415
,571
P4
,689
,355
P5
,846
,343
P6
,813
,330
Extraction Method: Principal
Axis Factoring.
Rotation Method: Oblimin with
Kaiser Normalization.
Tabela 8-20 Matrica korelacija faktora na Upitniku konflikta privatne i poslovne uloge
U ovom primjeru koristili smo analizu zajednikih faktora. Analiza karakteristinih korijena
pokazuje da su dva faktora znaajna, te da oni zajedno objanjavaju 70,283 % varijance
161
manifestnih varijabli. Pregledom Scree plota vidimo da je najvei pad izmeu prvog i drugog
faktora, ali da nam Kaiserov kriterij, kombiniran s evidentnim padom izmeu drugog i treeg
faktora omoguava da zakljuimo kako se ovdje radi o dvodimenzionalnoj strukturi koju smo
oekivali po teoretskom modelu.
vidjet ete da se one razlikuju. Na primjer, u matrici faktorskog obrasca sada imamo pitanje 1
koje je u gotovo nultoj korelaciji s prvim faktorom (-0,062) i u visokoj korelaciji s drugim faktorom
(0,739).
Osim pregleda podataka koji se odnose na povezanost varijabli s faktorima, dobili smo podatke i
o povezanosti samih faktora. To je posljednja matrica koju oznaavamo sa . Vidimo da su faktori
korelirani (0,435) iako ne tako visoko da bismo posumnjali u dvodimenzionalnost konstrukta.
163
Preporuujemo lanak u kojem se upravo debatira na temu valjanosti ove skale, a koji je napisao Jaros (2007).
164
dok ne dobijemo dobru usklaenost jer bi to znailo da su vaniji podaci nego teorija (a
mi znamo kako podaci mogu biti optereeni grekom i pristranou).
2. Procjene parametara koji su testirani vrlo bitna informacija je vrijednost svih
parametara koje smo pretpostavili u modelu. U ovom dijelu izvjetaja saznajemo koliki su
regresijski koeficijenti pitanja s latentnim dimenzijama, te kolike su korelacije meu
latentnim dimenzijama.
3. Modifikacijski indikatori osim to procijenimo sve zadane parametre i usklaenost
modela s podacima, program nam ponudi i spisak moguih modifikacija koje bi popravile
model. Na primjer, ukoliko je neko pitanje multifaktorsko, program ponudi da to pitanje
poveemo i sa drugim faktorom kako bismo dobili veu usklaenost. Da li emo neke od
ovih indikatora iskoristiti zavisi od toga da li za njih moemo nai teoretsko opravdanje.
Ukoliko nemamo teoretskog opravdanja, onda je bolje provjeriti da li bi neki od
alternativnih modela bolje opisao podatke (na primjer, definirali smo trodimenzionalni
model, a moda bi uvoenje dodatne dimenzije popravilo usklaenost). Ipak, u donoenju
odluka moramo biti voeni teorijom jer program moe uraditi to god zamislimo, ali da li
je to to smo zamislili i valjano to je pravo pitanje.
4. Nakon to pregledamo sve dobivene rezultate, odluujemo se o respecifikaciji modela i
vraamo se na poetnu taku.
Radi ilustracije pogledajmo jedan primjer malo sloenijeg modela kojim se odreivala faktorska
struktura nekoliko skala individualnih dimenzija koje utjeu na radnike na poslu. U konfirmatornu
faktorsku analizu ukljueno je 7 skala: odanost organizaciji, percepcija ovladavanja poslom,
preferencija za izazovima na poslu, predvidljivost posla, konflikt uloga, ekstrinzina i intrinzina
motivacija.
Na desnoj strani se nalaze pravougaonici i to su pitanja. Svaki pravougaonik je jedno pitanje.
Na desnoj strani su elipse i to su latentne dimenzije. Latentne dimenzije su povezane s pitanjima.
Primijetite smjer strelica izmeu latentnih dimenzija i pitanja one idu od dimenzije prema
pitanju sugerirajui upravo da nije pitanje to koje tvori dimenziju, nego dimenzija tvori odgovor
na pitanje.
U krajnjoj desnoj strani modela nalaze se mali krugovi to su greke mjerenja i ovo je jedna od
najveih prednosti konfirmatorne analize moemo da vidimo greku i da raunamo varijancu
greke kao i njihove kovarijance. Izmeu latentnih varijabli prikazane su veze, odnosno
kovarijance. One su uvijek prikazane strelicama dvostrukog smjera. Nakon zavrenog izrauna u
modelu moemo vidjeti i visinu svih koeficijenata. Na naem primjeru vidimo da sva pitanja imaju
relativno visoke regresijske koeficijente. Takoer vidimo i korelacije meu latentnim
dimenzijama koje ukazuju da su one povezane, ali ipak razliite. Na ovom modelu moemo vidjeti
jo jednu kovarijancu koju ne moemo vidjeti u eksploratornoj FA kovarijancu meu grekama.
To je upravo ono o emu smo priali u teoriji generalizabilnosti nije svaka greka sluajna, jedan
dio greke se javlja i pod utjecajem neke sistematske varijable, kao to je metoda. Konfirmatorna
FA nam omoguava mnogo kvalitetnije analize, ali to ne znai da iskljuuje eksploratornu FA. I
jedna i druga imaju svoje mjesto, samo je vano znati zato slui jedna, a zato druga.
166
q113mvr2
q114mvr2
,81
,87
odanost organizaciji
,85
,62
,70
e115
q67mvr2
e67
e68
e69
,67
,41
q64mvr2
e64
,66
-,35
,57
q65mvr2
e65
q66mvr2
e66
-,19
-,22
,75
dugorocna predvidljivost
,67
,54
konflikt
,75
,63
,81
ekstrinzicna motivacija
,82
,78
e70
q70mvr2
,62
preferencija izazova
,27
e114
q115mvr2
q68mvr2
q69mvr2
ovladavanje poslom
,21
e113
,53
intrinzicna motivacija
,72
q61mvr2
e61
q62mvr2
e62
q108mvr2
e108
q109mvr2
e109
q123mvr2
e123
q125mvr2
e125
q126mvr2
e126
q121mvr2
,82
e121
q124mvr2
e124
q127mvr2
e127
do produciranja odgovora) ili pokreti oiju. Ispitivanje psiholokih procesa moe otkriti razlike u
testnim interpretacijama izmeu grupa ispitanika. Na primjer, na Zungovoj skali depresivnosti
DPR-S (Zung, 1965) u klinikoj populaciji autori smatraju da mjeri jedan faktor. Depresivni
simptomi se pojavljuju i kao ishodi nepovoljne radne klime, tako da ovaj upitnik koriste
organizacijski psiholozi da bi utvrdili prisustvo depresivnih simptoma kod radnika. Ali, na
faktorizaciji upitnika mi smo dobili dva faktora. to bi moglo objasniti ovakav nalaz? Pa upravo
razliiti psiholoki procesi koji se nalaze iza odgovaranja u klinikoj i neklinikoj populaciji. U
klinikoj populaciji osnova odgovaranja na pitanja je depresija kao poremeaj raspoloenja koji
zahvata sve aspekte ivota. U neklinikoj populaciji prema Schonfeldu (1992), skale depresivnih
simptoma mjere dva konstrukta: nespecifini psiholoki stres i kliniku depresiju. Dohrenwend i
autori (prema Schonfeld, 1992) su u svojim istraivanjima pokazali da depresivni simptomi
koreliraju s nizom skala koje mjere druge simptome, i to onoliko koliko im koeficijenti
pouzdanosti doputaju, te u sluaju neklinikih uzoraka skale depresije vjerovatno mjere
konstrukt nazvan nespecifini psiholoki stres ili demoralizacija. Nespecifini stres je vrsta
psiholokog stanja koje bi moglo motivirati osobe bez klasine depresivne simptomatologije da
potrae pomo psihoterapeuta. To su osobe koje imaju problema u psiholokom funkcioniranju,
ali ne zadovoljavaju DSM-IV kriterije za depresiju. Da smo prije studije na neklinikoj populaciji
proveli ispitivanje psiholokih procesa, utvrdili bismo vjerovatno da radnici drukije rezonuju
kada odgovaraju na pitanja koja su se odnosila na nespecifini psiholoki stres. Psiholoki proces
kao dokaz valjanosti nije nuno pripisan ispitanicima. Ukoliko imamo situaciju da sudije
(nastavnici, procjenjivai) ocjenjuju uradak ispitanika, tada nam je vanije da vidimo koji su
psiholoki procesi u pozadini kada procjenjiva ocjenjuje ispitanika.
Psiholoki procesi su vana vrsta dokaza o valjanosti instrumenta kada ispitanici daju odgovore
na pitanja otvorenog tipa, odnosno kada na testovima nema ponuenog odgovora. U testovima
s ponuenim odgovorima ovaj dokaz ne mora biti toliko vaan koliko je vaan sam produkt (taan
odgovor). Ali, i dalje ostaje vano kako je ispitanik razmiljao dok je traio rjeenje, posebno u
sluaju pogrenih odgovora.
169
9 PRISTRANOST U TESTIRANJU
ta ja pristranost? Kakva je razlika izmeu pristranosti i pravednosti? Kako znamo da je
test pristran? ta nije pristranost u testiranju?
Pristranost u testiranju (engl. test bias) predstavlja jedan od fundamentalnih problema o kojem
razmiljamo u svim koracima, poevi od konceptualnih definicija do interpretacije testnih
rezultata i donoenja odluka. Pristranost u testiranju je metrijsko pitanje, suprotno je od
jednakosti tretiranja, a povezano je i s pravednou kao socijalnim konstruktom. Pristran test je
test na kojem ispitanici sistematski dobivaju precijenjene ili potcijenjene bruto rezultate varijable
koju smo namjeravali mjeriti.
Testiranje regruta u SAD-u: Army Alpha i Army Beta kao radikalni primjer pristranosti u testiranju
Kada je izbio Prvi svjetski rat, javila se velika potreba u Sjedinjenim Amerikim Dravama za
regrutacijom vojnika i njihovim pozicioniranjem na razliite poslove u vojsci. Robert Yerks, koji je
1917. bio predsjednik Amerikog drutva psihologa (APA), okupio je vrhunske psihometriare da
pripreme test mentalnih sposobnosti za vojsku. Autori su pripremili tri testa Army Alpha, Army
Beta i test za individualnu primjenu. Army Alpha je bio verbalni test, a Army Beta slikovni. Regruti
su bili testirani tako to se prvo provjeravalo jesu li pismeni. Ako su bili pismeni, radili bi Army
Alphu. Ukoliko bi postigli loe rezultate, uradili bi Army Betu. Ukoliko bi i tu pokazali loe rezultate,
ili bi na individualno testiranje mentalnih sposobnosti (s nekom od verzija Binet-Simonove skale).
Nepismeni kandidati su radili Army Betu. Testiranje je provedeno na oko 1 750 000 regruta.
Rezultati testiranja nisu objavljeni do 1921. kada je izala knjiga Psyschology Examining in the
United States Army iji je editor bio sam Yerks (Yerks, 1921). Testiranja su raena u prepunim
prostorijama slabog osvjetljenja i s mnogo buke (Gould, 1981, str. 194-232). Edwin Garrigues
Boring, koji je kasnije postao poznati psiholog, u to vrijeme Yerksov podreeni, izabrao je sam
160 000 ispitanika iz itave baze prema naslijeenim osobinama (rasa, zemlja porijekla...). Na
osnovu rezultata Army Alphe, Army Bete i individualnog testiranja (ne zaboravite da je jako mali
broj Afroamerikanaca tada bio opismenjen i u uzorku su bile velike razlike u proporciji ispitanika)
izvreno je usporeivanje inteligencije izmeu grupa. Tri glavna zakljuka su bila (kako ih Gould
opisuje iz Yerksove knjige):
1. Prosjena mentalna dob mukaraca bijelaca bila je malo iznad nivoa morona (na nivou
13-godinjaka). Terman je ranije postavio standard na 16 godina, ali nova brojka je
postala poetna taka tadanjih eugenista koji su kukali nad sunovratom nacije i
inteligencije uslijed nekontroliranog uzgoja siromanih i slaboumnih i irenja krvi
crnaca uslijed mijeanja rasa te preplavljivanje inteligentnog domaeg stanovnitva
imigrantskim talogom koji dolazi iz june i istone Evrope. Yerks (1921) je ak dao i
objanjenje za ovaj nevjerovatni rezultat od tri godine razlike u prosjenoj inteligenciji koju
je predloio Terman i koju je on izraunao. Rekao je da je Terman svoje rezultate bazirao
na malom uzorku probranih ispitanika (srednjokolaca i zaposlenika), dok je njegov uzorak
mnogo vei.
2. Evropski imigranti se razlikuju prema zemlji porijekla. Prosjean graanin svake zemlje je
moron. Tamniji ljudi june Evrope i slavenskog porijekla iz istone Evrope su manje
170
inteligentni od svijetlih ljudi zapadne i sjeverne Evrope. Nordijska nadmonost nije nikakva
ultranacionalistika predrasuda. Prosjean Rus ima mentalnu dob 11,34 godine, Italijan
11,01, a Poljak 10,74.
3. Crnci su na dnu skale prema mentalnoj dobi od 10,41 godinu.
(Gould, 1981, str. 227)
Reakcije na ovaj izvjetaj pokazuju da su osvijeteni psiholozi i tada promiljali o pristranosti. Prvo,
pitanja u Army Alpha bila su potpuno zasiena znanjima koja nisu bila svima dostupna, posebno
ne imigrantima razliitih obrazovnih iskustava. Neka od pitanja odnosila su se na igrae bejzbola
i tipinu ameriku hranu. Army Beta nije bila nita bolja. Poetna pitanja bila su lagana (npr. da
se docrta nedostajui dio tijela ovjeku ili ivotinji), ali tea pitanja su se odnosila na stvari s
kojima veina regruta nije imala iskustvo (npr. mrea na teniskom igralitu ili lopta u ruci igraa
bejzbola). Testovi su bili vremenski ogranieni, ali je ova informacija data samo regrutima koji su
polagali Army Alpha test. Regruti koji su odmah bili klasificirani za Army Beta test nisu imali
informaciju o vremenskom ogranienju. Mjesta testiranja jako su varirala u uvjetima u kojima se
radio test i svako mjesto je donekle mijenjalo pravila ko polae koji test. Sam nain kako je Boring
standardizirao i usporeivao rezultate unio je dodatni element pristranosti.2 Kada se sve sumira,
ovo je bilo isto gubljenje vremena. Ali ova studija dala je krila tadanjim zagovornicima
hereditarne teorije, posebno protestantima anglosaksonskog porijekla za zagovaranje uvoenja
restrikcija imigracije iz pojedinih zemalja Evrope. Tako je 1924. godine u SAD-u izglasan Akt o
restrikciji koji je doveo do toga da je samo malom postotku ljudi iz june i istone Evrope (2 %)
bilo dozvoljeno da imigriraju u SAD naspram visokih procenata imigranata iz sjeverozapadne
Evrope i Velike Britanije.
Za zavretak prie o testiranju regruta jedna trivija: da li znate da je jedan od Yerksovih
pomonika, Carl C. Brigham, postao sekretar Odbora za prijemne ispite (College Entrance
Examination Board) i da je prema modelu Army testova razvio Scholastic Aptitude Test (poznat
kao SAT) koji se danas primjenjuje u SAD-u kao jednoobrazni test za sve srednjokolce za prijeme
na fakultete?
Danas se nadamo da se ovakva pristranost ne moe desiti zahvaljujui nizu rigoroznih kontrola
koje moraju proi nacrti istraivanja. Pristranost u testiranju vie nije ovako otvorena. Meutim,
zamislimo sljedeu situaciju elimo ispitati koliko djeca u treem razredu osnovne kole poznaju
neke geografske pojmove. Jedno od pitanja u testu odnosi se na rijeke koje protiu kroz velike
gradove:
Za vie o ovom mjerenju, ali i drugim mjerenjima u psihologiji koja su nas nauila kako ne mjeriti, preporuujemo
itanje knjige Stevena Jaya Goulda (1981) The Mismeasure of Man.
171
Tip pristranosti
1. Konstruktna pristranost
2. Pristranost metode
a. Pristranost uzorka
b. Pristranost procedure testiranja
c. Pristranost instrumenta
3. Pristranost pitanja
Izvori pristranosti
Parcijalno preklapanje definicije konstrukta izmeu grupa
Razliitost ponaanja povezanih s konstruktom
Neadekvatno uzorkovanje svih relevantnih ponaanja (npr.
kratki instrumenti)
Neadekvatna pokrivenost domena konstrukta
Nekompatibilnost uzorka (razlike u obrazovanju, motivaciji...)
Razlike u uvjetima administriranja fizike i socijalne razlike
Nejasne instrukcije za ispitanike ili za ispitivae
Razliit stepen obuenosti ispitivaa
Efekat opaaa
Problemi u komunikaciji izmeu ispitivaa i ispitanika
Razliita upoznatost sa stimulusom
Razliita upoznatost s procedurama odgovaranja
Razliiti stilovi odgovaranja
Neadekvatni prevodi ili nejasna pitanja
Faktori uma (pitanje potie jo neke faktore)
Kulturalne specifinosti u pitanju
stanovnici zapadne civilizacije ne poznaju na taj nain. Obraz je potovanje u zajednici i osnova je
uvezanosti s drutvom. Gubitak potivanja je velika prijetnja odnosima i vrlo je teko povratiti
obraz jednom kada se izgubi. U studijama vrijednosti u Kini (Connection, 1987) rezultati su
pokazali da se kod Kineza izdvaja faktor nazvan Konfuijanski radni dinamizam koji je visoko
korelirao s ekonomskim rastom, a nije bio pokriven zapadnim konceptom vrijednosnog sistema.
U razliitim grupama i kulturama nisu sva ponaanja jednako vana i relevantna za ispitivanje
konstrukta. Na primjer, pitanje u skali Autonomije na poslu u Upitniku psihosocijalnih faktora na
radnom mjestu glasi: Da li moete sami odrediti kada ete doi na posao? Kako je ova skala
pripremljena u skandinavskim dravama, gdje je fleksibilno radno vrijeme odavno opcija za
radnike, ovo je vana estica i njen rezultat je visoko povezan s faktorom Autonomija na poslu,
te dobro predvia zadovoljstvo na poslu. Meutim, u naim uvjetima, gdje veina radnika ne
moe birati kada e doi na posao, ova estica ne mora imati jasnu faktorsku strukturu i biti
povezana sa drugim esticama kojima se mjeri Autonomija.
Konstruktna pristranost je posljedica i neadekvatnog uzorkovanja ponaanja povezanih s
konstruktom. Kada su konstrukti vrlo varijabilni i zahvataju veliki broj domena, trebamo mnogo
pitanja da bismo postigli reprezentativnost domena i ponaanja. Desi se da zbog ekonominosti
u upitnicima primijetimo nereprezentativnost uzoraka ponaanja. Ponekad, nakon prikupljanja
podataka, moramo izbaciti neka pitanja upravo zbog konstruktne pristranosti.
Pronaite i vi primjer konstruktne pristranosti nauit ete i psihometriju i kroskulturalnu
psihologiju.
173
Njegova oekivanja i ponaanje mijenjaju odgovore ispitanika. Na primjer, niz studija je pokazalo
da su ispitanici spremniji pokazati pozitivan stav prema nekoj grupi kada ih intervjuira neko ko
dolazi iz te grupe (teorija priklanjanja).
Posljednji, ali ne i manje vaan, izvor pristranosti u proceduri testiranja je komunikacija izmeu
ispitivaa i ispitanika. Ispitanici ne moraju poznavati znaenje rijei koje koristi ispitiva. Na
primjer, ako ispitiva pita ispitanika: Da li ste anksiozni? ispitanik ne mora znati tu rije. Ali,
anksioznost mu moe zvuati kao neki poremeaj. Kako on sebe ne vidi poremeenim, na
pitanje odgovara: Nikada, ali ne zato to on zaista nije nikada anksiozan, nego zato jer nije
razumio rije i pripisao joj je znaenje prema svojoj preferenciji. Ovo je jo vei izvor pristranosti
u pisanim testovima (bilo papir-olovka bilo elektronski) kada ispitanik nema priliku da pita to
znai neka rije ili fraza.
Metodska pristranost moe imati ozbiljne posljedice po valjanost istraivanja jer vodi ka promjeni
prosjenih rezultata.
kako izbjei konstruktnu pristranost do toga kako adekvatno pripremiti pitanja u upitniku koja bi
najbolje opisala sam fenomen (npr. kako prevesti pitanje I feel entitled to more of everything).
moemo jednako interpretirati konstruktnu valjanost ili kada ispitanici postiu razliite rezultate
na pitanjima. Shodno tome, metode identifikacije pristranosti testa odnose se ili na analizu
pitanja ili na analizu unutarnje strukture testa, ali i na pitanje povezanosti s drugim varijablama
(u smislu provjere prediktivne pristranosti).
Za provjeru konstruktne pristranosti na nivou pitanja i na nivou unutarnje strukture testa imamo
na raspolaganju najmanje 4 metode, od kojih smo veinu ranije spomenuli.
1.
2.
3.
4.
9.4.2 Rangiranje
Jedna jednostavna i lagana metoda je rangiranje pitanja prema indeksima teine, te
usporeivanje rang-liste pitanja izmeu dvije grupe. Ukoliko se rangovi pitanja razlikuju izmeu
grupa, mogue je da imamo posla s pristranou pitanja. Za ustanovljavanje slinosti rangova
koristimo Spearmanov rho ()koeficijent korelacije. Ukoliko ustanovimo da je koeficijent
korelacije nezadovoljavajui, potrebno je provesti dodatne analize da bismo utvrdili izvore
pristranosti.
179
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61
Latentna karakteristika
dvije grupe. Ovo pitanje razliito funkcionira, odnosno ima diferencijalnu funkciju kod ena i
mukaraca. Ovaj obrazac pristranosti, kada je trend razlike jednak du cijele krivulje zadatka,
zovemo uniformna pristranost.
U sluaju kada postoji drukiji obrazac razlika izmeu grupa, pristranost zovemo neuniformnom
pristranou. Na slici 9-3 ene u podruju niih rezultata imaju veu vjerovatnou zaokruivanja
jedinice, ali kasnije pitanja postaju tea, odnosno za ene su tea nego za mukarce.
Slika 9-3 Diferencijalna krivulja pitanja za mukarce i ene neuniformna pristranost
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61
Latentna karakteristika
dobit e i poziciju. Meutim, jednom kada osvijestimo pitanje pristranosti u testiranju i vidimo
koliko je izvora pristranosti i kako nije u redu koristiti iste kriterije u donoenju odluka, onda nam
postane jasno kako pristranost kao metrijska karakteristika mora biti uzeta ozbiljno jer je
povezana s nepravednou.
U prethodnim poglavljima govorili smo o regresijskoj analizi kao osnovi predvianja rezultata.
Ako pretpostavimo jednostavni sluaj regresije gdje na osnovu rezultata u jednoj varijabli
predviamo rezultat u drugoj varijabli, onda znamo da je Y = a + bX.
Postoji nekoliko mogunosti razlikovanja ili pristranosti testiranja pristranost intercepta,
pristranost nagiba i pristranost intercept x nagib.
zene
muskarci
4
2
0
Ovo se naziva pristranost intercepta. Zamislimo da je prediktor neka objektivna mjera uinka
mukaraca i ena u timskom radu, a da je kriterij procjena nadreenog o kvaliteti njihovog rada
u timu. Vidimo da mukarac i ena koji imaju isti uinak imaju razliitu procjenu supervizora i ta
se razlika zadrava itavom regresijskom linijom. ene i mukarci imaju isti trend poveanja
ocjene supervizora, ali ene imaju sistematski niu ocjenu u svakoj taki poveanja uinka.
182
zene
muskarci
4
2
0
Zamislimo sada istu situaciju prediktor je objektivna mjera uinka u timskom radu, a kriterij je
procjena supervizora. Sada oni koji su objektivno najloiji bivaju podjednako procijenjeni od
nadreenog, ali to je objektivni uradak bolji, to mukarci dobivaju sve bolje ocjene u odnosu na
ene.
183
zene
muskarci
4
2
0
Nakon to smo identificirali postojanje pristranosti, trebamo nai rjeenje za problem. Rjeenja
je mnogo, spomenut emo samo neka.
upitnik. Ukoliko postoje velike razlike meu grupama, verzije upitnika mogu sadravati i
specifina pitanja, ali se poreenje grupa radi na osnovu zajednikih karakteristika.
Za nas je jako bitno to uraditi kada se neki fenomen ispituje prvi put, odnosno kada fenomen jo
uvijek nije dovoljno prepoznat kod ire populacije ili kada test koristimo prvi put. U ovim
sluajevima treba provesti pilot ispitivanje s ciljem provjeravanja shvatanja fenomena i njegove
interpretacije, te razumljivosti pitanja u instrumentu. U ovoj fazi provjeravamo i psiholoke
procese ukljuene u odgovaranje tako to zamolimo ispitanike da razmiljaju naglas, odnosno
da naglas govore sve to im pada na pamet dok odgovaraju. Analizom snimaka dolazimo do
informacija da li su psiholoki procesi ukljueni u odgovaranje kompatibilni s teoretskim
pretpostavkama na kojima je konstruiran test.
Provjeravanje pristranosti na nivou pitanja ukljuuje lingvistike, psiholoke i psihometrijske
provjere o kojima smo mnogo govorili. Ukoliko se pokae da je pitanje pristrano, ono mora biti
preformulirano ili zamijenjeno adekvatnim pitanjem. U test se mogu dodati specifina pitanja,
koja se u priruniku za koritenje testa oznaavaju kao dodatna pitanja i koja se daju na
raspolaganje ispitivaima ako im trebaju.
Ako se pokae da postoji pristranost u predvianju rezultata na kriterijskoj mjeri, onda donoenje
odluka mora uzeti u obzir razlike u povezanosti mjera. Na primjer, ukoliko se pokae da postoji
razlika izmeu ena i mukaraca u povezanosti objektivne mjere postignua i procjene
supervizora, sve daljnje odluke od nagraivanja do otputanja moraju uzimati u obzir ovu
razliku i ne smije se dopustiti razmiljanje po principu: Svi su radili isto, pa ko bude bolji . Oni
nisu bolji, nego je test bio pristran.
tretmanom, tada oekujemo razlike. Izmeu grupa koje nisu bile pod tretmanom ne oekujemo
razlike bez obzira na to kojoj kulturi ili prostoru pripadaju. Danas znamo da ovaj koncept
jednakosti jednostavno nije opstojiv. Ako nita, imamo dovoljno dokaza da se grupe razlikuju
prema psihomotornim i senzornim sposobnostima. Takoer, imamo dovoljno dokaza da se
razlike u kolskim postignuima ne mogu pripisati samo pristranosti testiranja, nego kvaliteti
obrazovnog procesa i varijablama porodinog konteksta. Pogreka jednakosti dosta je esta u
tretiranju inteligencije, jer je politiki i socijalno korektno smatrati da je distribucija inteligencije
jednaka za sve grupe. Pristranost je i najea kritika testova inteligencije. Za razumjeti je zato
je ova pogreka tako snano inkorporirana u tretiranje pristranosti testova inteligencije. U
dananjem svijetu, kada su predrasude i netrpeljivost prema etnikim grupama jako izraeni,
znanstvena pria o pogreki jednakosti mogla bi lako biti zloupotrebljena u svrhe
segregacionistikih politika. Pogreka jednakosti i potreba da budemo socijalno osvijeteni
dovodi i do toga da vjerujemo kako treba imati i zajednike forme testova za razliite grupe. Na
primjer, profesionalni interesi mukaraca i ena jesu isti, ali se podruja njihovog manifestiranja
razlikuju i samo zanimanje ne mora imati isto znaenje za mukarce i ene. Ali, zbog koncepta
ravnopravnosti, u mjerenju insistiramo na jednakosti iako smo svjesni razlika.
Prema pogreki jednakosti, izmjerene razlike meu grupama su indikator pristranosti, a ne razlika
meu grupama u mjerenoj osobini, pa je, prema ovome, nemogue potvrditi ili odbaciti hipotezu
o razlikama. Ali znanost ne funkcionira na ovaj nain. Znanost jeste znanost zato to se hipoteze
mogu provjeravati. Stoga je ova hipoteza o jednakosti znanstveno beskorisna, koliko god bila
drutveno i politiki promovirana. Pitanje razlika je znanstveno pitanje, a pitanje jednakosti i
ravnopravnosti je drutveno i politiko pitanje.
rasnim grupama. Kod nas bi ovo mogla biti kritika koritenja testova na romskoj populaciji, a
norme su pripremane na neromskoj populaciji. Ovdje takoer trebamo promisliti da li je test
pristran ili nije. Prije nego koristimo test na populaciji na kojoj nije normiran, moramo procijeniti
da li je taj test odgovarajui za njih. Mi ionako moramo odrediti pouzdanost i valjanost testa na
toj populaciji. Ne trebamo unaprijed rei da je test neiskoristiv jer za njega nemamo norme. U
procesu standardizacije, dva aspekta su najvanija: 1) odabir pitanja i 2) skaliranje pitanja. Za
pristranost je vaan odabir pitanja. Odabir pitanja za test baziran je na provjeri kvalitete pitanja,
njihovih teina, koeficijenata korelacije izmeu pitanja, te korelacija s ukupnim uratkom ili nekim
drugim kriterijem. Sve metrijske karakteristike testa zavise od kvalitete pitanja u testu. Ukoliko
procedura odabira pitanja za zavrnu formu zaista pokae da za razliite grupe imamo i razliita
pitanja, onda postoji osnova za tvrdnju da test moe biti pristran, ali prije statistike provjere
pristranosti ne moemo nita tvrditi. Ukoliko test jeste pristran, tada nam reskaliranje nee
znaajno pomoi. ta to znai? Ako bismo odluili da rezultatima nove grupe samo dodamo neku
konstantu, na pojavnoj razini dobit emo ujednaavanje s normativnom grupom. Ali ono to smo
uradili jeste da smo transformirali rezultate.
U samom procesu standardizacije postavlja se pitanje da li je dovoljno samo ukljuiti odreeni
broj ispitanika iz manjinske grupe u normativni uzorak? Na primjer, da li je dovoljno samo ukljuiti
odreeni broj romske djece u Bosni i Hercegovini za normiranje testa? Vrlo lako bismo na ovo
pitanje dali potvrdan odgovor, ali nam ni ovo ne garantira da e test biti nepristran, posebno ako
je njihov procent u ukupnom uzorku mali. Statistika moe pokazati i da su kriteriji za odabir
pitanja razliiti za grupe u normativnom uzorku, ali ovo neemo saznati ukoliko statistike
procedure ne provedemo odvojeno za grupe. Ispravan postupak standardizacije podrazumijevao
bi ukljuivanje jednakog broja ispitanika iz svake grupe ili barem dovoljno velik uzorak manjinske
grupe da se mogu provesti statistike analize, a tek u finalnom normiranju (odreivanju
standardiziranih skorova) za itav uzorak moemo kombinirati grupe u proporcijama
zastupljenosti kao u opoj populaciji.
Namjera standardizacije unutar grupa nema za cilj izjednaavanje aritmetikih sredina, nego
postizanje sline pouzdanosti, unutarnje strukture, dimenzionalnosti i raspona teine pitanja pri
emu rangovi pitanja po teini trebaju biti isti u svakoj grupi.
Dakle, pristranost testa mora biti jedna od naih primarnih briga, ba kao i sve druge metrijske
karakteristike. Pri tome moramo voditi rauna da pristranost testa ne smije biti optereena
pretpostavkama koje onemoguavaju znanstveni pristup ispitivanju psiholokih karakteristika.
187
Za kraj...
Ve dugo razmiljam ko je izvrstan psiholog. Da li je to osoba koja je proitala sve to se moglo
proitati iz svog podruja? Da li je to osoba koja je topla i nesebina? Osoba koja je ubjedljiva,
elokventna..? Upoznala sam mnogo psihologa, neki su djelovali toplo, neki hladno, bili su puni
znanja ili puni prazne prie... ali ono to sam zakljuila o izvrsnim psiholozima je da se oni niemu
ne ude. Izvrsni psiholozi koriste se mjerenjima i teorijama da bi razumjeli i prestali se uditi. Tek
kada se prestanemo uditi, moemo razumjeti. A razumjeti moemo samo ako mjerimo paljivo,
strpljivo i kritiki. Izvrsni psiholozi su otvoreni za sve perspektive i sve interpretacije. I nikada ne
prestaju da se dive ljudima. Mjerenja nam pomau da se uvijek i iznova divimo ljudima i da ih
razumijemo. Nadam se da e ovaj skromni prirunik doprinijeti vaem razvoju kao psihologa koji
razumije da nema apsolutne istine i da je ljudska vrsta velianstvena u svojoj razliitosti koju
otkrivamo upravo kroz mjerenja.
A great many people think they are thinking
when they are merely rearranging their predjudices
William James, 1842-1910
188
10 LITERATURA
AERA, APA, NCME. (2006). Standardi za pedagoko i psiholoko testiranje. Jastrebarsko: Naklada
Slap.
Allen , M. J., Yen, W. M. (1979). Introduction to Measurement Theory. Brooks/Cole Pub.
Bennet, G. K., Seashore, H. G., Wesman, A. G. (2006). Diferencijalni testovi sposobnosti (DAT) za
selekciju Baterija opih sposobnosti (BOS). Jastrebarsko: Naklada Slap.
Biggs, J. (1996). Enhancing teaching through constructive alignment. Higher Education(32), 1-18.
Bracken, B. A., Barona, A. (1991). State of the art procedures for translating,validating and using
psychoeducational tests in cross-cultural assessment. School Psychology International, 12,
119-132.
Brown, R. A. (2005). The Paradox of Japanese Self-Esteem. Preuzeto od
http://www.bunkyo.ac.jp/
Brown, T. A. (2006). Confirmatory Factor Analysis for Applied Research (1st izd.). The Guilford
Press.
Browne, M. (2000). Psychometrics. Journal of American Statistical Association, 95, 450-661.
Bucik, V. (1997). Osnove psiholokega testiranja. Ljubljana: Filozofska fakulteta Univerze v
Ljubljani.
Byrne, B. M. (2010). Structural Equation Modeling with AMOS:Basic Concepts, Applications, and
Programming. New York, NY: Routledge Taylor & Francis Group.
Campbell, D. T., Fiske, D. W. (1959). Convergent and discriminant validation by the multitraitmultimethod matrix. Psychological Bulletin, 56(2), 81-105.
Carlson, D. S., Kacmar, M. K., Williams, L. J. (2000). Construction and Initial Validation of a
Multidimensional Measure of WorkFamily Conflict. Journal of Vocational Behaviour(56),
249276.
Cattell, R. B., Cattell, K. A., Cattell, H. E. (2000). 16 faktora linosti 16PF. Naklada Slap.
Cheung, F. M., Leung, K., Fan, R. M., Song, W. Z., Zhang, J. X., Chang, J. P. (1996). Development of
the Chinese personality assessment inventory. Journal of Cross-Cultural Psycholgy, 18,
143-164.
Cohen, J., Cohen, P., West, S. G., Aiken, L. S. (2002). Applied Multiple Regression/Correlation
Analysis for Behavioral Sciences (3rd izd.). Routledge.
Connection, C. C. (1987). Chinese values and the search for culture-free dimensions of culture.
Journal of Cross-Cultural Psychology, 18, 143-164.
Costello, A. B., Osborne, J. W. (2005). Best practices in exloratory factor analysis: Four
recommentadions for getting the most from your analysis. Practical Assesment, Research
and Evaluation, 10(7), 1-9.
Cronbach , L. J., Gleser, G. C., Nanda, H., Rajaratnam, N. (1972). The dependability of behavioural
measurements: Theory of generalizability for scores and profiles. New York: Willey .
Cronbach, L. J. (1951). Coefficient alpha and internal structure of tests. Psychometrika(4), 297334.
Cronbach, L. J. (1971). Test Validation. U R. L. Thorndike (Ur.), Educational Measurement (str.
443-507).
189
Cronbach, L. J. (1988). Five perspectives on the validity argument. U H. Wainer, & H. I. Braun (Ur.),
Test validity (str. 3-18). NJ: Hillsdale.
Cronbach, L. J. (1990). Essentials of Psychological Testing (5th izd.). New York: HarperCollins
Publishers Inc.
Cronbach, L. J., & Meehl, P. E. (1955). Construct validity in psychological tests. Psychological
Bulletin, 52(4), 281-302.
Cronbach, L. J., Shavelson, R. J. (2004). My Current Thoughts on Coefficient Alpha and Successor
Procedures. Educational and Psychological Measurement, 64, 391-418.
Ebel, R. L. (1965). Measuring educational achievement. Prentice-Hall education series .
Ekstrom, J. (2009). The phi-cefficient, the tetrahoric correlation coefficient and the Pearson Yule
debate. Preuzeto od statistics.ucla.edu
Fajgelj, S. (2003). Psihometrija: metod i teorija psiholokog mjerenja. Beograd: Centar za
primjenjenu psihologiju.
Ferguson, G. A. (1949). On the theory of test discrimination. Psychometrika(14), 61-68.
Finn, S. E., Tonsager, M. E. (1997). Information-gathering and therapeutic models of assesment:
Complementary paradigms. Psychological Assesment, 9(4), 374-385.
Fisher, R. A. (1915). Frequency distribution of the values of the correlation coefficient in samples
of an indefinetely large population. BIometrika, 4(10), 507-521.
Fulgosi, A. (1988). Faktorska analiza. Zagreb: kolska knjiga.
Furr , M. R., Bacharach, V. R. (2013). Psychometrics: An Introduction. SAGE Publications.
Ghiselli, E. E., Campbell, J. P., Zedeck, S. (1981). Measurment theory for the behavioral sciences.
San Francisco: W.H.Freeman.
Gould, S. J. (1981). The Mismeasure of Man. New York: W.W.Norton.
Greenhaus, J. H., Beutell, N. J. (1985). Sources of conflict between work and family roles.
Academy of Management Review, 10(1), 76-88.
Gregory, R. J. (1992). Psychological testing; History, principles and applications. Boston: Allyn &
Bacon.
Guilford, J. P. (1965). Fundamental Statistics in psychology and education. New York: McGrawHill.
Holland, J. L. (1997). Making vocational choices: A theory of vocational personalities and work
environments (3rd izd.). Odessa: Psychological Assesment Resources.
Hoyt, C. J. (1941). Test reliability estimated by analysis of variance. Psychometrika, 6, 153-160.
Hubbard, D. W. (2014). How to Measure Anything: Finding the Value of "Intangibles" in Business.
Hoboken, New Jersey: John Wiley and Sons, Inc.
Janovi, J. (17. 11 2012). Osnovne trigonometrijske funkcije. Preuzeto od On-line uionica:
https://profesorka.wordpress.com
Jaros, S. (2007). Meyer and Allen Model of Organizational Commitment: Measurement Issues.
The Icfai Journal of Organizational Behavior, VI(4), 7-25.
Jensen, A. R. (1980). Bias in Mental Testing. New York: The Free Press A Division of Macmillan
Publishing Co., Inc.
Kuder, G. F., & Richardson, M. W. (1937). The theory of the estimation of reliability.
Psychometrika(2), 151-160.
Leahey, T. H. (2001). The History of Modern Psychology. Prentice Hall PTR.
190
Lord, F. M., Novick, M. R. (1968). Statistical Theories of Mental Test Scores. Addison-Wesley Pub.
Co.
Lord, F. M., Novick, M. R. (2008). Statistical Theories of Mental Test Scores. Information Age
Publishing.
Marcoulides, G. A. (1996). Estimating variance komponents in generalizability theory: The
covariance structure analysis approach. Structural Eqation Modeling(3), 290-299.
Maslach, C., Jackson, S. E. (1981). The measurement of experienced burnout. Journal of
occupational behaviour, 2, 99-113.
McDonald, R. P. (1999). Test Theory: A Unified Treatment. Mahwah, New Jersey: Lawrence
Erlbaum Assoc.
Messick, S. (1989). Validity. U R. L. Linn (Ur.), Educational Measurement (3rd izd., str. 13-103).
New York: Macmillan.
Meyer, J. P., Allen, N. J. (1997). Commitment in the workplace: Theory,research, and application .
Thousand Oaks, CA: SAGE Publications.
Norman, G. R. (2008). Discrimination and reliability: equal partners? Health and Quality of Life
Outcomes, 6(81).
Novick, M. (1966). The axioms and principal results of classical test theory. Journal of
Mathematical Psychology, 3, 1-18.
Nunnally, J. C., Bernstein, I. H. (1994). Psychometric Theory (III izd.). New York: McGraw-Hill Series
in Psychology.
Plumlee, L. B. (1952). The effect of difficulty and chance success on item test correlation and
on test reliability. Psychometrika, 69-86.
Podsakoff, P. M., MacKenzie, S. B., Podsakoff, N. P. (2013). Sources of Method Bias in Social
Science Research and recommendations on how to control It. Annual Review of
Psychology(63), 539-569.
Reese, T. W. (1943). The Application of the Theory of Physical Measurement to the Measurement
of psychological Magnitudes, sith Three Experimental Examples. Psychological
MOnographs, 55:3(251), 6-20.
Rencher, A. C., Christensen, W. F. (2012). Methods of Multivarate Analysis (3rd izd.). Hoboken ,
New Jersey: John Wiley & Sons.
Savickas, M. L., Porfeli, E. J. (2012). The Career Adapt-Abilities Scale: Construction, reliability, and
measurement equivalence across 13 countries. Journal of Vocational Behaviour, 80, 661673.
Schmitt, N. (1996). Uses and Abuses of Coefficient Alpha. Psychological Assesment, 8(4), 350-353.
Schmitt, N., Kuljanin, G. (2008). Measurement invariance: Review of practice and implications.
Human Resource Management Review, 18, 210-222.
Schonfeld, I. S. (1992). Assesing Stress in Teachers: Depressive Symptoms Scales and Neutral SelfReports of the Work Environment. U J. Campbell Quick, L. R. Murphy, & J. J. Hurrell (Ur.),
Stress and Well-Being at Work: Assesment and Interventions for Occupational Mental
Health (str. 270-285).
Shavelson, R. J., Webb, N. M. (1991). Generalizability Theory: A Primer. SAGE Publication.
Smith, P., Whetton, C. (1999). Testovi opih sposobnosti TOS. Jastrebarsko: Naklada Slap.
Stevens, S. (1946). On the Theory of Scales of Measurement. Science, 677-680.
191
192
194
Knjiga pod naslovom Osnove psihometrije za studente psihologije predstavlja vrlo vaan
doprinos promovisanju i unapreenju istraivake djelatnosti. Imajui u vidu da sva istraivanja
u drutvenim znanostima imaju potrebu za razvijanjem i usavravanjem mjernih instrumenata na
osnovu kojih se donose procjene i generiu zakljuci, jasno je kolika je potreba za zanatskim
vjetinama koje se postavljaju pred psihologe i strunjake srodnih oblasti. Autorica Husremovi
svojim predstavljanjem i razradom psihometrijskih koncepata direktno ukazuje na takvu potrebu.
Pored toga, autorica daje i vrlo jasnu sugestiju kojim strategijama i postupcima je potrebno
ovladati da bi bilo mogue odgovoriti na opte psihometrijske kriterije.
Prirunik se sastoji od 188 stranica koje su podijeljene u devet sekcija, a koje se grubo mogu
razvrstati u dvije cjeline. Prvom se itaoca nastoji uvesti u oblast psihometrije i predstaviti
osnovne pojmove i naine zakljuivanja, koristei pojmove poznate iz ranijih statistikometodolokih kolegija. U njima se koristei saznanja deskriptivne statistike i statistike
zakljuivanja, predstavljaju i upoznaju koncepti mjerenja u psihologiji, psiholoki test kao mjerni
instrument i osnovni psihometrijski postulati. Glavna odlika prvog dijela je vrlo precizno
opisivanje i razraivanje koncepata pri kome autorica uspijeva u dva vrlo vana zadatka. Kao prvo
da koristei ranije steena znanja rasplai studente i ukae na mogunost neproblematinog
bavljenja psihometrijom i statistikom. Drugo koristei ranija saznanja studenata omoguava
povezivanje matematiko-statistikih aspekata drutvenih nauka sa psiholokim konceptima za
ije su se izuavanje studenti opredijelili. Jezik koji pri tome autorica koristi je vrlo razumljiv i ne
ostavlja prostora nedoumicama. Na ovakav nain, prva cjelina knjige daje odlinu podlogu za
konkretnije psihometrijske analize sadrane u dijelu koji slijedi. Druga cjelina se sastoji od sekcija
koje u uem smislu spadaju u psihometrijske karakteristike testa: analiza uinaka na razliitim
testovima kao mjera razmatranih psiholokih pojava, pouzdanost, valjanost i diskriminativnost.
Sva etiri poglavlja odlikuju se vrlo jasnim i preciznim definicijama psihometrijskih karakteristika
i njihovih aspekata. Predstavljanje psihometrijskih karakteristika testova i statistikih parametara
se direktno nadovezuje na osnove date u prvoj cjelini knjige, tako da italac ima priliku vraati se
na osnovne pojmove i postulate na kojima se psihometrija zasniva i ije je poznavanje potrebno.
195
196
Biografija
Denana Husremovi roena je 14. januara 1971. u Zenici gdje je zavrila osnovnu kolu i
gimnaziju. Prije 1992. studirala je na Medicinskom fakultetu u Sarajevu. U periodu od 1992. do
1995. radila je na projektima psihosocijalne pomoi izbjeglicama i raseljenim licima i to iskustvo
je uvelike odredilo njen daljnji karijerni put. Godine 1997. upisala je studij psihologije na Odsjeku
za psihologiju gdje je diplomirala 2001. na temu iz podruja profesionalne selekcije, a 2006. je
magistrirala na temu Validacijska studija upitnika profesionalnih interesa za uenike osnovnih
kola. Doktorirala je 14. januara 2011. pod mentorstvom prof. dr. Valentina Bucika na temu
Model odnosa psihosocijalnih faktora na radnom mjestu i njihovog utjecaja na dobrobit radnika.
Za vrijeme studija boravila je na usavravanju na Institutu za psihologiju Ludvig Maksimilijan
Univerziteta u Minhenu. U toku postdiplomskog studija boravila je mjesec dana na naunostrunom usavravanju na Institutu za psihologiju Univerziteta u Geteborgu. Godine 2013. bila je
stipendista US State Departmenta i kao JFDP stipendista bila na kolovanju na Michigan State
University, SAD. 2014. kao stipendista Britanske Ambasade boravila je na usavravanju iz
podruja upravljanja i javnog zagovaranja na Queen Mary University u Londonu. Od oktobra 2001.
zaposlena je na Odsjeku za psihologiju Filozofskog fakulteta u Sarajevu. Osim rada na matinom
fakultetu, Denana Husremovi predaje na Likovnoj akademiji predmet Ergonomija. Predava je
na postdiplomskim studijama pri Centru za interdisciplinarne studije Univerziteta u Sarajevu na
predmetu Metodologija drutvenih istraivanja. Glavna podruja interesiranja Denane
Husremovi su individualni i grupni fenomeni vezani za obrazovanje, rad, radne uvjete i razvoj
karijere, te povezivanje istraivanja s javnim politikama u podruju obrazovanja i karijere. Bavi se
evaluacijom projekata kojima je cilj unapreenje civilnog drutva i kvalitete ivota graana.
Predsjednica je Drutva psihologa u Federaciji Bosne i Hercegovine i lanica Upravnog odbora
Fonda otvoreno drutvo u Bosni i Hercegovini. Njena vizija je graditi vlastite kompetencije kako
bi pomogla studentima u njihovom razvoju, te djelovati kao znanstvenik u podizanju kvaliteta
obrazovanja i rada graana Bosne i Hercegovine.
197