Вы находитесь на странице: 1из 27

1.

Multivarijaciona statistika analiza

Faktorska analiza
Faktorska analiza predstavlja jednu od najpopularnijih multivarijacionih tehnika koja ima dva cilja: 1. 2. Identifikacija i razumevanje osnovne ideje, odnosno zajednikih karakteristika za vie varijabli. Smanjivanje broja varijabli u analizi kada ih je previe, pri emu se neke od njih preklapaju jer imaju slino znaenje i ponaanje.

Faktorska analiza je tehnika meuzavisnosti jer trai grupu varijabli koje su sline u smislu da se zajedno pomeraju i zbog toga imaju veliku meuzavisnost. Kada jedna varijabla ima veliku vrednost, onda i ostale varijable u grupi imaju veliku vrednost. U marketing istraivanjima ova tehnika vrlo esto slui za analiziranje rejtinga proizvoda ili karakteristika brenda, stavova i slino. Kod tehnika meuzavisnosti ne postoji podela na zavisne i nezavisne varijable jer su sve zapravo nezavisne. Ovim tehnikama se zapravo trai model odnosa izmeu varijabli koji ima smisla sa aspekta problema istraivanja. Tehnike meuzavisnosti su zapravo heuristiki, aproksimativni metodi kojima se traga za razumnim, smislenim, optimalnim reenjima. Za efikasnu primenu faktorske analize, pa i drugih multivarijacionih tehnika meuzavisnosti, potrebno je da postoji minimalna koliina redundancije varijabli, odnosno da se varijable barem malo preklapaju u svom znaenju. Zahvaljujui toj redundantnosti mogue je otkriti ablon u ponaanju varijabli, odnosno osnovnu ideju (faktor) kojom su proete. Sa druge strane, kod multivarijacionih tehnika zavisnosti, gde postoji jedna zavisna i vie nezavisnih varijabli, redundantnost nije uopte poeljna jer moe da utie na visinu regresionog koeficijenta svake nezavisne variable pojedinano u modelu. Drugim reima, dolazi do multikolinearnosti pa se ne vidi jasno koliko koja nezavisna varijabla ima uticaja na zavisnu varijablu. Kada se pravi anketa, esto dolazi do redundantnosti izmeu postavljenih pitanja. Kada se dizajnira upitnik, istraiva nikada ne moe biti siguran da je pokrio pravu temu u potpunosti sa pitanjima koja je odabrao. Zbog toga se esto u upitnik uvrtava vie pitanja koja se na isti ili slian nain odnose na temu istraivanja. Na primer, u istraivanju na tritu deije hrane, upitnik moe da sadri najmanje 15 pitanja koja pokrivaju za nijansu razliite aspekte iste teme: deiju hranu. U ovom kontekstu, jedan od glavnih ciljeva faktorske analize je da trai grupu slinih iskaza od strane respondenata jer oni izraavaju istu osnovnu ideju na naine koji s e razlikuju u nijansama. Mi elimo da identifikujemo tu osnovnu ideju i da je izmerimo. Te osnovne ideje se nazivaju faktorima. Faktori se ne mogu identifikovati i izmeriti direktno. Oni se mogu otkriti preko odnosa izmeu varijabli koje ih svojim ponaanjem ispoljavaju. Poto se faktori statistiki izdvajaju, svi faktori su inicijalno meusobno nepovezani (ortogonalni). Ovo pojednostavljuje razumevanje irokog spektra varijabli koje opisuju neku kategoriju iz sektora usluga ili proizvodnje. Takoe se stvara okvir za dalju analizu podataka.

1. Multivarijaciona statistika analiza

Iako faktori inicijalno nisu povezani, to ne znai da se to odnosi i na pojedine, originalne iskaze respondenata. Jedan iskaz respondenta moe u sebi da sadri vie faktora. Takvi iskazi su faktorski kompleksni. Sami po sebi, ovi iskazi nee jasno definisati ni jedan faktor, ali mogu da doprinesu u opisivanju faktora od kojih se sastoje. Identifikovani faktori reprezentuju osnovne ideje odnosno komponente koje su bitne, na primer, potroaima prilikom vrednovanja nekog proizvoda. Za istraivaa je mnogo lake da se fokusira na nekoliko najvanijih karakteristika proizvoda koje reprezentuju faktori nego na sve mogue karakteristike koje su posmatrane. Faktorska analiza na taj nain prua dobar osnov za razumevanje najvanijih, sutinskih dimenzija ili ideja vezanih za posmatranu pojavu. Faktorska analiza ima i svoja ogranienja koja se esto navode u literaturi (Hair, Black, Babin, & Anderson, 2010): Poto postoji mnogo tehnika kojima moe da se izvede faktorska analiza, ne postoji konsenzus koja od njih je najbolja. Subjektivni aspekt je veoma izraen (koliko faktora, koja rotacija, kolika statistika znaajnost faktorskih optereenja) to dovodi do velikog razmimoilaenja u stavovima istraivaa. Problem pouzdanosti je prisutan.

Racionalizacija preko faktorske analize


Drugi glavni cilj u faktorskoj analizi je da se smanji redundancija ili preklapanje varijabli, odnosno pitanja u anketi, da bi se smanjili trokovi i optereenje respondenata u buduim, slinim istraivanjima. Kada se otkrije grupisanje varijabli uz pomo faktorske analize, mogue je uraditi jednu od sledeih intervencija: 1. 2. 3. 4. 5. Eliminisanje jedne ili vie varijabli (pitanja u anketi) u svakoj grupi. Kombinovanje dva ili vie iskaza sa slinim znaenjem u jedan iskaz. Izbor po jedne varijable iz svake grupe koja najbolje karakterie odreeni faktor i koristiti je kao marker varijablu odnosno surogat. Korienje jednog faktor skora koji predstavlja prosek svih varijabli vezanih za dati faktor. Kombinacija gore nabrojanog.

Faktorska analiza se esto koristi da bi se racionalizovao broj pitanja koji se nalaze u anketama. Nakon racionalizacije dogaa se da se u istraivanju koriste identifikovani faktori a ne originalne varijable. Rezultati faktorske analize u mnogome zavise od samog istraivaa, jer e analiza otkriti obrasce ponaanja bilo kojih varijabli koje istraiva ukljui u model. Ukoliko se odlui za itav niz varijabli koje su vezane za jednu ideju, a kod drugih ideja postoji znat no manje varijabli, definisae se jedan faktor sa velikom vrednou. Zbog toga dizajniranje upitnika bitno utie na rezultate faktorske analize. Cilj faktorske analize je da pronae grupu povezanih varijabli, ali ne i da utvrdi vanost tog grupisanja.

1. Multivarijaciona statistika analiza Primer: Restorani brze hrane

U jednom gradu izvrena je anketa u kojoj su respondenti ocenjivali restorane brze hrane. Cilj studije je bio da se utvrdi relativna vanost pojedinih karakteristika restorana tog tipa. Oko 400 respondenata je anketirano i svaki od njih je morao da oceni 23 razliite karakteristike ocenom od 1 do 10, pri emu je 1 bila najloija ocena a 10 najbolja. Kao dodatak, traena je i ukupna ocena za svaki lanac brze hrane, takoe na skali od 1 do 10. Nakon ankete uraena je faktorska analiza da bi se grupisale karakteristike (osnovne ideje) koje su najslinije. Nakon to su napravljene grupe odnosno odreeni faktori ( tabela), potrebno je svakom faktoru dati odgovarajui naziv tako da povezuje sve karakteristike koje se nalaze u datoj grupi. Faktorsko optereenje (factor loading) ukazuje na relativnu vanost svake karakteristike u definisanju faktora. To je zapravo koeficijent korelacije izmeu svake karakteristike (varijable, pitanja) i samog faktora. to je vea korelacija, data karakteristik a bolje opisuje faktor. Ova korelacija moe biti i pozitivna i negativna. Ako je korelacija pozitivna, onda pokazuje u kojoj meri odreena varijabla doprinosti tom faktoru, a ako je negativna, pokazuje koliko varijable ne uestvuje u datom faktoru. U ovo primeru, faktor 1 ima najvee optereenje kod karakteristike Koriste visoko kvalitetne sastojke u hrani (0,78), zatim Njihova hrana zaista ima dobar ukus (0,7 2) itd. Zbog navedenih karakteristika kod prvog faktora, faktoru je dodeljen naziv Hrana. Ovaj naziv je dodeljen arbitrarno i mogui su i drugi odgovarajui nazivi. Kod drugog faktora najvee prisustvo je kod karakteristika Unutranjost uvek izgleda lepo (0,7 2) i Osoblje je uredno i isto (0,69) itd. Usled toga, logian naziv za faktor 2 je Objekat jer se ovaj faktor odnosi na objekat sam po sebi i njegov izgled.

Tabela: Ocenjivanje restorana brze hrane glavna pitanja Faktor 1. faktor Hrana Koriste visoko kvalitetne sastojke u hrani. Njihova hrana zaista ima dobar ukus. Uvek mogu da pronaem u meniju neto to mi se svia. Imaju konstantan kvalitet hrane. Hrana se sprema po narudbi. Ovo je mesto od poverenja. Porcije su odgovarajue. 2. faktor Objekat Unutranjost uvek izgleda lepo. Osoblje je uredno i isto. Imaju puno mesta za parking. Toaleti su isti. Zgrade su atraktivne. 0.72 0.69 0.68 0.60 0.58 0.78 0.72 0.69 0.59 0.59 0.59 0.53 Faktorsko optereenje (Factor Loading)

1. Multivarijaciona statistika analiza

Nikada ne ostaju bez jela iz menija. Nikada nisu otvoreni do kasno. Oseam se prijatno pored drugih gostiju. 3. faktor Okruenje Moe biti brzo usluen. Zaposleni su ljubazni. Mesto je uvek uredno i isto. Dobio sam pravu vrednost za svoj novac. 4. faktor Meni Povremeno imaju nova jela. esto imaju specijalnu ponudu uz popust. Meni prua irok izbor. Postoji mnogo odgovarajuih lokacija.

0.55 0.53 0.52

0.77 0.65 0.58 0.57

0.77 0.74 0.59 0.48

Kada se dobijeni koeficijent za prvu karakteristiku (0,78) podigne na kvadrat, dobija se da je oko 61% varijacija u oceni zajedniko sa faktorom. Ovako mali koeficijent determinacije je dobijen zato to su mnoga pitanja u anketi izbaena jo prilikom dizajniranja upitnika zbog utede u resursima. To znai da su mnoge slinosti i redundantnosti izmeu pitanja ranije eliminisane. Vee optereenje faktora bi moglo lako da se dobije dodavanjem novih pitanja koja su slina ve postojeim. Faktor 3 je mnogo tei za interpretaciju. Karakteristike nisu logiki povezane i ne ine celinu. Ipak, faktorska analiza ukazuje da se ove karakteristike pomeraju zajedno u ocenjivanju. To znai kada respondent da relativno visoku ocenu jednoj karakteristici iz grupe, i ostale karakteristike iz grupe imaju tendenciju ka visokoj oceni. Zbog toga nije bilo jednostavno dodeliti pravi naziv faktoru. Na kraju je izbor pao na naziv Okruenje. etvrtom faktoru je bilo lake dati ime jer se karakteristike odnose uglavnom na meni restorana. Zbog toga je dodeljen naziv Meni. Izbor imena za faktore je izuzetno bitan jer je kasnije prilikom donoenja bilo kakvih odluka fokus upravo na nazivima. To je ponekad lake kada postoje i pozitivno i negativno optereenje faktora jer nam negativni govore ta dati faktor ne predstavlja . Na osnovu definisanih faktora stvorena je globalna slika o restoranima brze hrane koju strateki menadment mora da uvai. Pored toga, 23 karakteristike su smanjene na svega 4 glavne varijable (faktore) koje mogu biti upotrebljene za dodatnu analizu podataka. Iako ova etiri faktora ne pokrivaju sve to su pokrivale 23 karakteristike, ipak pokrivaju vei deo varijacija.

Primer: Auto-dileri 140 kupaca automobila zamoljeno je da oceni auto-dilere koje su posetili na osnovu 20 datih karakteristika. Faktorska analiza je dala vrlo jasne rezultate na osnovu ankete.

1. Multivarijaciona statistika analiza

Tabela: Ocenjivanje restorana brze hrane glavna pitanja Faktor 1. Lini pristup Jasno su mi odgovarali na pitanja. Diler kojem se moe verovati. Potrude se da shvate moje potrebe. Objasne uslove prodaje. Prodavci su ljubazni i kulturni. Nisu izbegavali moja pitanja. Dobro servisno odeljenje. 2. Izbor robe Mnogi modeli ili tipovi su na zalihama. Mnogo boja i opcija. Otvoreno uvee ili subotama radi servisa. 3. Uslovi prodaje Dobre kamate. Dobra cena za razmenu. Cene su vrlo konkurentne. 4. Objekti Dovoljno prostora za parking. Atraktivna izlobena sala. 5. Karakteristike vozila. Poreenja sa drugim markama. Vie od jedne marke vozila. Ukazano na mnoge osobine vozila. 6. Nema pritiska Nisu navalentni. Zovu kasnije da provere da li sam zadovoljan. 0.90 -0.48 0.79 0.64 0.61 0.75 0.69 0.83 0.73 0.66 0.90 0.87 0.63 0.90 0.86 0.79 0.76 0.75 0.59 0.57 Faktorsko optereenje (Factor Loading)

Identifikovano je est faktora na osnovu 20 karakteristika. Ovim verovatno problem istraivanja nije u potpunosti pokriven. Faktorska analiza ne moe da ukae na to ta nedostaje u nizu karakteristika. Jedan od naina da se proveri pokrivenost je da se uradi viestruka regresiona analiza gde bi zavisna varijabla bila ukupna ocena auto-dilera i da se izrauna koeficijent determinacije. Ako je on nizak (recimo ispod 70%), moe se rei da odreene karakteristike, odnosno odreena pitanja treba dodati u anketu.

1. Multivarijaciona statistika analiza

Nekada je jedno od pitanja u anketi ponueno da se da opta ocena o posmatranoj pojavi pored svih ostalih pojedinanih karakteristika i onda se ta varijabla takoe ukljuuje u faktorsku analizu. U tim sluajevima esto se deava da takva varijabla nema visoko faktorsko optereenje ni kod jednog faktora nego je podjednako rasprena na vie faktora sa malim faktorskim optereenjem. Ponekad se deava da gotovo sve varijable imaju visoko faktorsko optereenje za prvi faktor. Taj sluaj se javlja, na primer, kada respondenti treba da ocene veliki broj performansi nekog proizvoda koji je za njih zapravo nov i nedovoljno poznat. Tada se deava da respondenti daju odgovore na osnovu nekog opteg utiska. Ova pojava se naziva halo efekat i postoji vie naina da se on izbegne. Jedno reenje je da standardizuju odgovori za s vakog respondenta posebno, a drugi je eliminisanje halo efekta uz pomo parcijalne korelacije. Vie o ovim tehnikama moe se nai u Myers i Mullet (2003).

Izbor varijabli za analizu i veliina uzorka


Bez obzira koji je krajnji cilj faktorske analize, mora se voditi rauna o tome kakve se varijable koriste u postupku. Izbor varijabli i njihove karakteristike imaju direktnog uticaja na konani ishod analize. Na primer, ako se istrauje imid neke prodavnice, i ako se u analizu ne ukljui ni jedna varijabla koja je vezana za osoblje koje radi u prodavnici, onda faktorska analiza nee moi da identifikuje tu dimenziju. Prema tome, veoma je vano ukljuiti varijable koje pokrivaju sve vane dimenzije odreenog predmeta istraivanja. Mora se imati u vidu da e faktorska analiza uvek, bez obzira na to kakvi su podaci, kao rezultat izraunati faktore. Zbog toga treba voditi rauna da se ne desi sluaj GIGO (garbage in-garbage out), odnosno da e se na osnovu beskorisnih ulaznih podataka dobiti i beskorisni faktori. Ukoliko analitiar misli da e ubacivanjem ogromnog broja varijabli faktorska analiza biti u stanju da tu umu raisti i ponudi smisleno reenje onda je on na pogrenom putu. Kvalitet dobijenih fak tora je u direktnoj vezi sa konceptualnim znaajem varijabli ukljuenih u analizu. Prilikom odabira varijabli dva pitanja se moraju postaviti: Koji tip varijabli moe da se analizira? i Koliko varijabli treda ukupno da bude?. Kad je u pitanju tip varijabli treba imati na umu da je za faktorsku analizu bitno da moe da se izrauna koeficijent korelacije. Metrike varijable se mogu lako izmeriti, dok su nemetrike problematine jer ne moe da se koristi isti tip korelacije kao kod metrikih. Iako postoje specijalni metodi za izraunavanje korelacije izmeu nemetrikih varijabli, najracionalniji pristup jeste da se takve varijable izbegavaju. Ako ve nemetrika varijabla mora da bude uvrtena, jedan pristup je da se izraunaju kodirane varijable (dummy variables) koje su kodirane sa 0, 1 itd. i koje na taj nain reprezentuju nemetrike varijable. Ako su sve varijable u bazi kodirane, onda je bolje koristiti posebnu vrstu faktorske analize, kao to je Boolean analiza. Analitiar treba da se trudi da smanji broj varijabli ali takoe i da zadri razuman broj varijabli po faktoru. Ako analiza ima za cilj da objasni odreenu strukturu, potrebno je ukljuiti nekoliko varijabli koje mogu da reprezentuju odreeni faktor barem pet. Znaaj faktorske analize je u

1. Multivarijaciona statistika analiza

pronalaenju ablona unutar grupe varijabli i mala je korist od faktora koji se zasniva na jednoj varijabli. to se tie veliine uzorka, nije preporuljivo analizirati uzorak koji ima manje od 50 jedinica i poeljno je da uzorak ima barem 100 jedinica. Generalno je pravilo da postoji barem pet puta vie jedinica nego to ima varijabli u bazi, a najbolje bi bilo da je taj odnos 10:1. U sluajevima kada je taj odnos manji od 5:1, potrebno je rezultate objanjavati sa velikom rezervom.

Vrste faktora
Postoje dve vrste faktora u faktorskoj analizi: zajedniki i specifini faktori. Zajedniki faktori su oni ije varijacije su podeljene izmeu dve ili vie varijabli iz skupa varijabli. Specifini faktori su oni ije su varijacije vezane za pojedinane varijable i te varijacije nisu obuhvaene zajednikim faktorima. Skoro svaka varijabla ima makar malu koliinu specifine varijanse. Faktorska analiza identifikuje samo zajednike faktore. Bitno je znati da specifini faktori nekad mogu biti od veeg znaaja u nekom istraivanju od zajednikih. Specifini faktori se mogu izvui na povrinu dodavanjem novih pitanja u anketi. Varijable koje imaju malo zajednikog sa drugim varijablama i imaju malo faktorsko optereenje (manje od 0,30) prema svim zajednikim faktorima nazivaju se esto nezavisnim varijablama. esto se deava da se previdi vanost takvih varijabli i da se one iskljue iz interpretacije rezultata to moe da bude velika greka.

Vrste faktorske analize


U osnovi postoje dva pristupa u otkrivanju faktora: preko analize glavnih komponenti i faktorska analiza u uem smislu (common factor analysis). Ukratko, analiza glavnih komponenti identifikuje sve izvore varijacija u skupu varijabli, ukljuujui zajednike i specifine faktore. Faktorska analiza pokuava da otkrije i objasni samo zajednike varijacije koji su zastupljene kod dve ili vie varijabli. Kod analize glavnih komponenti 40 varijabli koje se analiziraju bie zamenjene sa 40 glavnih komponenti, s tim to e samo nekoliko glavnih komponenti imati veliko prisustvo u varijabilitetu podataka pa e samo one biti interesantne. Zbog toga se analiza glavnih komponenti smatra pre svega tehnikom za redukciju obima podataka u kojoj je cilj dobiti minimalni broj faktora koji imaju maksimalni udeo u ukupnoj varijansi originalnih varijabli. Faktorska analiza u uem smislu (common factor analysis) slui da se podstakne razumevanje i znaenje posmatrane pojave. Osnovni cilj faktorske analize jeste da se smanji broj povezanih, preklapajuih varijabli na manji broj nepovezanih komponenti koje bi se mogle efikasnije koristiti u daljoj analizi. Poto je faktorska analiza u uem smislu sloenija, postoji tendencija u svetu da se mnogo vie primenjuje analiza preko glavnih komponenti. U svakom sluaju, empirijski rezultati pokazuju da se rezultati dve vrste analize znaajno podudaraju ako broj varijabli prelazi 30 ili komunalitet prelazi 0,60 za vei broj varijabli.

1. Multivarijaciona statistika analiza

Postoji jo jedna podela, i to na R faktorsku analizu i Q faktorsku analizu. R faktorska analiza podrazume otkrivanje latentnih dimenzija u skupu varijabli, odnosno slu i za redukciju broja varijabli u modelu. Q faktorska analiza ima isti zadatak kao i klaster analiza, a to je da grupie jedinice posmatranja prema svojoj slinosti u grupe ili klase. Razlika izmeu klaster analize i Q analize je u tome to se u klaster analizi posmatraju stvarne udaljenosti izmeu jedinica posmatranja i spajaju se najblii parovi, dok kod se kod Q analize posmatraju sline strukture kovarijansi. Na primer, u tabeli se vide etiri jedinice posmatranja i tri varijable. Varijable Jedinica posmatranja V1 A B C D 8 9 4 3 V2 8 9 4 3 V3 12 8 6 2

Claster analiza bi zbog blizine taaka u prostoru zajedno grupisala jedinice A i B u jednu grupu a C i D u drugu, dok bi Q faktorska analiza grupisala zajedno jedinice A i C u jednu a B i D u drugu grupu jer se pomeraju zajedno.

Model faktorske analize


Razlika izmeu analize glavnih komponenti i faktorske analize je u tome to se faktorska analiza zasniva na matematikom modelu sa faktorima koji su dobijeni kao standardizovane glavne komponente. Poetak razvoja faktorske analize se vezuje za radove arlsa Spirmana (Charles Spearman), s poetka XX veka. Opti faktorski model ima sledei oblik:
Xi ai1 F 1 ai 2 F 2 ... aim F m ei

gde su: X vrednost varijable (skor faktora za varijablu) sa aritmetikom sredinom nula i varijansom jedan, i redni broj varijable, F faktori koji su meusobno nezavisni, m redni broj faktora, a faktorsko optereenje (konstanta), e specifini faktor vezan samo za datu varijablu.

1. Multivarijaciona statistika analiza Varijansa varijable Xi je pri tome:

Var X i

1 ai21Var F1

ai 2 Var F 2

2 ... aim Var F m

Var ei

2 2 2 ai1 ai 2 ... aim Var ei

2 pri emu ai21 ai22 ... aim predstavlja komunalitet varijable Xi (deo varijanse koji je povezan sa zajednikim faktorima), a Var(ei) je specifina varijansa varijable Xi (deo varijanse koji nije povezan sa zajednikim faktorima). Takoe je dokazano da je korelacija izmeu varijabli Xi i Xj:

r ij

ai1 a j1 ai 2 a j 2 ... aim a jm

Prema tome, dva faktorska skora mogu biti jako povezana ako imaju visoko optereenje za iste faktore. Poto komunalitet ne moe da bude vei od 1, mora biti zadovoljen uslov:
1 aij 1.

Postupak faktorske analize


Tipina faktorska analiza se izvodi u nekoliko koraka: 1. 2. 3. 4. 5. 6. Izraunavanje kompletne tabele koeficijenata korelacije izmeu svih originalnih varijabli. Izraunavanje faktorskog optereenja (factor loading) iz matrice koeficijenata korelacije. Rotacija zajednikih faktora radi vee razumljivosti. Evaluacija i eventualno redefinisanje modela. Interpretacija zajednikih faktora, ukljuujui i izbor adekvatnog naziva. Izraunavanje faktor skorova, da bi svaki zajedniki faktor bio predstavljen jednim, vaganim indeksim brojem.

U nastavku, termin faktor e se zapravo odnositi na zajednike faktore. Tabela koeficijenata korelacije U faktorskoj analizi trai se obrazac odnosa izmeu velikog broja varijabli. To znai da moramo poeti analizu sa pregledom korelacionih odnosa originalnih varijabli. Najee se koristi Pirsonov koeficijent proste korelacije koji pokazuje jainu i smer veze izmeu dve varijable. Dobijena tabela koeficijenata korelacije moe da doprinese boljoj identifikaciji, imenovanju i razumevanju faktora. Ukoliko istraiva uri, esto se preskae ovaj korak to moe da se odrazi na kvalitet cele analize. Neki raunarski programi automatski izraunavaju tabelu koeficijenata korelacije, dok se kod nekih posebno mora traiti ova tabela. Ona moe da bude korisna pri razumevanju i davanju imena faktorima, posebno kod manje vanih faktora. Za izraunavanje Pirsonovog koeficijenta proste korelacije potrebno je da obe varijable imaju vrednosti sa intervalne ili racio skale, dok se u sluaju ordinarne skale primenjuje specijalna verzija faktorske analize. Preporuuje se da se vrednosti sa nominalne skale analiziraju jedino ako varijabla

1. Multivarijaciona statistika analiza

10

ima samo dva modaliteta (na primer, obeleje je vlasnitvo automobila, a modalitet i su ima i nema odnosno 1 i 0). Analitiar mora da se uveri da u korelacionoj matrici ima dovoljno visokih koeficijenata korelacije da bi imalo smisla primeniti faktorsku analizu. Ako su svi koeficijenti niski, ili su svi jednaki (to znai da nije mogue grupisati varijable), pitanje je da li treba raditi faktorsku analizu. Ako ne postoji znaajan broj koeficijenata korelacije koji su vei od 0,30, onda faktorsku analizu ne treba primenjivati. Korelacija izmeu varijabli se moe analizirati i preko parcijalnih koeficijenata korelacije izmeu varijabli. Parcijalna korelacija je korelacija koja je neobjanjena kada se uzmu u obzir uticaji ostalih varijabli. Ako postoje znaajni faktori u strukturi podataka, onda bi parcijalni koeficijenti trebali biti mali, jer se varijabla moe objasniti preko uea varijabli u faktoru. Ako su parcijalni koeficijenti veliki, onda ne treba raditi faktorsku analizu. Bartlett-ov test sferinosti je jo jedan nain da se analizira korelaciona matrica. Ovaj test analizira postojanje statistike znaajnosti odnosno da li postoji korelacija barem izmeu nekih varijabli. Treba imati u vidu da sa poveanjem uzorka Bartlett-ov test postaje sve osetljiviji na otkrivanje korelacije. MSA (measure of sampling adequacy) je jo jedan nain da se kvantifikuje stepen korelacije izmeu varijabli i opravdanost faktorske analize. Indeks se kree u granicama od 0 do 1. to je MSA blii jedinici, to je lake predvideti odreen varijablu uz pomo ostalih varijabli. MSA se posmatra prema sledeoj skali: preko 0,80 vrlo jaka korelacija izmeu 0,70 i 0,80 jaka izmeu 0,60 i 0,70 srednja izmeu 0,50 i 0,60 slaba ispod 0,50 neprihvatljiva. MSA moe da se povea u sledeim sluajevima: poveanjem veliine uzorka porastom prosene korelacije poveanjem broja varijabli smanjivanjem broja faktora. Opti MSA mora da bude iznad 0,50 pre nego to se primeni faktorska analiza. Ako opti MSA padne ispod 0,50 onda specifine MSA vrednosti varijabli mogu da ukau na one varijable koje treba iskljuiti iz analize. Poto je mogue izraunati specifine MSA za svaku varijablu posebno, mogue je iskljuiti varijablu sa najniim specifinim M SA i onda ponovo uraditi faktorsku analizu. Ovaj postupak potrebno je ponavljati sve dok sve preostale varijable imaju MSA iznad 0,50.

1. Multivarijaciona statistika analiza Izraunavanje faktorskog optereenja (zajednikih faktora)

11

Potrebno je izvui zajednike faktore koji se nalaze u tabel i koeficijenata korelacije. Ovaj korak se obino izvodi uz pomo analize glavnih komponenti. Analiza glavnih komponenti pronalazi grupe varijabli koje imaju visoke koeficijente u okviru grupe a male u odnosu na druge grupe. Ova analiza e izvui onoliko g lavnih komponenti koliko ima i varijabli, zato to ona obuhvata i zajednike i specifine varijacije podataka. Panja istraivaa se zadrava na nekoliko prvih glavnih komponenti koje imaju najvei uticaj (najvee faktorsko optereenje) i obuhvataju najvei deo varijabiliteta podataka. Tih nekoliko glavnih komponenti predstavljaju faktore. Mnogi statistiki programi nude opciju da se umesto faktorske analize na osnovu glavnih komponenti uradi analiza tako da se izvuku samo zajedniki faktori a ne svi koji su mogui. Ono to se eli postii je da faktorsko optereenje ili bude blizu nule, to znai da nije povezano sa datom varijablom ili da bude znatno udaljeno od nule, to bi znailo da je data varijabla znatno povezana sa faktorom. Ukoliko varijabla ima ve liko faktorsko optereenje samo za jedan faktor a za ostale ne, onda je lako identifikovati taj faktor. Metod dakle polazi od modela glavnih komponenti, gde e glavnih komponenti biti isto onoliko koliko ima i originalnih varijabli. Glavne komponente su zapravo linearna kombinacija originalnih varijabli:
Z1 Z2 b11 X 1 b12 X 2 ... b1 p X p b21 X 1 b22 X 2 ... b2 p X p

...
Zp b p1 X 1 b p 2 X 2 ... b pp X p

gde su vrednosti bij ajgenvektori korelacione matrice. Sledi ortogonalna transformacija za dobijanje vrednosti varijabli. Inverzna linearna kombinacija glasi:
X1 X2 b11 Z 1 b21 Z 2 ... b p1 Z p b12 Z 1 b22 Z 2 ... b p 2 Z p

...
Xp b1 p Z 1 b2 p Z 2 ... b pp Z p

Za faktorsku analizu zadrava se samo m komponenti od ukupnog broja komponenti p:

X 1 b11 Z 1 b21 Z 2 ... bm1 Z m e1

X2
...

b12 Z 1 b22 Z 2 ... bm 2 Z m e2

1. Multivarijaciona statistika analiza


b1 p Z 1 b2 p Z 2 ... bmp Z m e p

12

Xp

gde je ei linearna kombinacija ostalih, izostavljenih glavnih komponenti, od Zm+1 do Zp. Sada treba transformisati preostale glavne komponente da imaju jedininu varijansu. Za dobijanje faktorskih jednaina potrebno je Zi podeliti sa standardnom devijacijom, odgovarajue ajgenvrednosti u korelacionoj matrici:
X1 X2
1

, koja je kvadratni koren

b11 F 1 b12 F 1

b21 F 2 ... b22 F 2 ...

bm1 F m e1 bm 2 F m e2

...
Xp
1

b1 p F1

b2 p F 2 ...

bmp F m e p

gde je F i Z i i . Iz datog se vidi da su nerotirani faktori zapravo vrednosti glavnih komponenti poto su transformisani tako da imaju varijansu jednaku jedinici. Nerotirani faktorski model onda glasi:

X1 X2
...
Xp

a11 F 1 a12 F 2 ... a1m F m e1 a21 F 1 a22 F 2 ... a 2 m F m e2

a p1 F 1 a p 2 F 2 ... a pm F m e p
j

pri emu je aij

b ji .

Rotacija faktora Nakon analize glavnih komponenti, faktorska analiza poinje da rotira komponente. Cilj je da se redefinie i pojasni znaenje svakog faktora. Postupak se svodi na preraspodelu uticaja faktora sa prve glavne komponente na ostale, tako da je ukupna varijansa koja je objanjena preko faktora ravnomernije rasporeena izmeu komponenti. U koordinatnom sistemu, glavne komponente su predstavljene kao prave linije koje prolaze kroz ishodite i izmeu varijabli koje se nalaze u vidu taaka u prostoru. Ako su varijable u jaoj korelacionoj vezi, nalaze se blizu jedna drugoj. Prave linije (glavne komponente) prolaze kroz grupu bliskih varijabli. Te prave linije zapravo predstavljaju faktore koji se trae. Prave linije komponenti su meusobno pod uglom od 90 stepeni jer komponente nisu meusobno zavisne. Najpoznatija rotacija je varimax rotacija koja maksimizira sumu varijansi kvadrata faktorskih optereenja. Nakon varimax rotacije, ili neke druge, faktorski mo del ima oblik:

1. Multivarijaciona statistika analiza

13

X1 X2
...

g11 F1 * g12 F 2 * ... g1m F m * e1 g 21 F1 * g 22 F 2 * ... g 2m F m * e2

Xp

g p1 F1 * g p 2 F 2 * ... g pm F m * e p

gde F i * predstavlja novi, i-ti faktor. Primer: Rotacija faktora na primeru vonih sokova Nakon ankete koja je sprovedena meu potroaima dobijeni su podaci o 14 razliitih osobina vonih sokova. Uraena je analiza glavnih komponenti i dobijene su etiri glavne komponente koje su prikazane u tabeli. Najvea optereenja prve komponente su 0,93; 0,92; 0,90 itd. Ovo su vrlo velika optereenja i treba u mnogome da nam pomognu prilikom davanja imena prvoj komponenti. Problem je to ima previe varijabli (osobina vonih sokova) kod kojih je optereenje veliko, pa to ini interpretaciju komplikovano m. Takoe, kod druge glavne komponente, najvee optereenje je 0, 35, a kod tree 0,30. Potrebno je pronai nain za redistribuiranje ovih optereenja da bi se postigla interpretacija koja ima smisla za sve faktore. To se postie rotiranjem osa u koordinat nom sistemu koje predstavljaju komponente oko skupa originalnih podataka. U ovom konkretnom sluaju, rotiraju se etiri komponente kroz varimaks rotaciju i to na sledei nain: Sve ose ostaju pod pravim uglom (90), jedna u odnosu na drugu. Svaka par komponenti obuhvata maksimalan broj taaka (varijabli) u prostoru izmeu njih. Varijanse faktorskih optereenja izmeu svih varijabli, na svakoj osi, su maksimizirane (odatle i naziv varimaks, to za posledicu ima nekoliko visoko varijabilnih optereenja i mnogo malih, ak negativnih).

Tabela: Faktorsko optereenje pre i posle rotacije


Osobine vonih sokova 1.Prijatan ukus 2.Iskriav ukus 3.Zreo ukus Glavne komponente pre rotacije 1 0.84 0.93 0.76 2 -0.001 -0.02 -0.11 3 -0.29 -0.02 -0.28 4 0.14 -0.1 0.1 Faktori posle Varimax rotacije Komunalitet 1 -0.62 0.48 -0.70 2 0.38 0.43 0.26 3 0.36 -0.53 0.38 4 0.34 0.38 0.36 0.76 0.84 0.83

1. Multivarijaciona statistika analiza

14

4.Bogat ukus 5.Zadovoljavajui ukus 6.iv ukus 7.Ukus pravog voa 8.Dubok, originalni ukus 9.Ukus tek isceenog voa 10.Topao ukus 11.ist i jasan ukus 12.Sladak ukus 13.Sve ukus 14.Ukupan utisak Objanjena varijansa u % Kumulativno varijansa u %

0.91 0.78 0.93 0.90 0.78 0.85 0.86 0.89 0.86 0.84 0.92 75.2 75.2

0.16 -0.002 0.12 -0.04 0.35 -0.28 0.25 0.11 -0.29 -0.27 0.04 2.4 77.6

-0.001 -0.20 -0.02 0.04 0.11 0.24 0.22 -0.05 0.04 0.19 0.08 3.1 80.7

-0.11 0.21 -0.16 -0.21 0.16 -0.09 0.17 0.10 0.27 0.12 -0.23 2.5 83.2

0.45 -0.74 0.50 0.42 0.31 0.23 0.28 0.52 0.43 0.33 0.38 23.6 23.6

-0.53 0.38 0.43 0.38 -0.74 0.24 -0.75 -0.55 0.28 0.32 0.43 20.2 43.8

0.54 0.30 -0.59 -0.64 0.27 0.52 0.33 0.36 0.16 0.36 -0.65 21.3 65.1

0.29 0.32 0.35 0.37 0.22 -0.62 0.39 0.36 -0.67 -0.70 0.34 19.0 84.1

0.86 0.88 0.91 0.84 0.78 0.81 0.86 0.79 0.77 0.81 0.85 -

Pod nazivom varimaks rotacija u tabeli se nalaze faktorska optereenja za svaku varijablu posle rotacije. Sada je prikladnije koristiti termin faktor umesto komponenta. Uoava se da su visoka optereenja kod prve komponente pre rotacije uglavnom nestala kod prvog faktora. Sada je lake utvrditi ta je zapravo faktor 1 i ta nije. Visoka optereenja, ako su pozitivna, govore ta faktor jeste, a negativna ta nije. Procenat ukupne varijacije (objanjena varijansa) se dramatino menja. Pre rotacije, prva komponenta je objanjavala 75,2% od ukupne varijacije, sledea 2,4% itd. Nakon rotacije postignuta je ravnomernost u objanjenoj varijansi izmeu faktora (od 23,6% do 19,0%) to govori o redistribuciji faktorskog optereenja. Negativna optereenja su se pojavila kod sva etiri faktora posle rotacije. Ona ukazuju na to to faktor ne predstavlja. Zbog naina na koji se rotacija izvodi, faktoru se dodeljuje ime na osnovu najveeg optereenja i to bez obzira na predznak. Najvee faktorsko optereenje ukazuje na varijable koje imaju najjau korelaciju sa datim faktorom. Poslednja kolona tabele pokazuje komunalitet svake varijable. Komunalitet je proporcija varijanse varijable koja je zajednika sa svim ostalim varijablama zajedno. Izraunava se tako to se sab eru kvadrati faktorskih optereenja varijable. Na primer, za varijablu Prijatan ukus, komunalitet iznosi: (0,62)2+0,382+0,362+0,322=0,76.

1. Multivarijaciona statistika analiza

15

To pokazuje da je 76% od ukupne varijacije varijable Prijatan ukus obuhvaeno sa etiri zajednika faktora. Isto tako, 24% varijacija se odnosi na specifinost same varijable plus odreeni iznos greke u merenju (e). Za 14 varijabli vonih sokova komunalitet se kree od 76% do 91%. To znai da su prilino visoki i da mogu da obuhvat barem jedan faktor i da neke imaj u umereno optereenje za dva faktora. Ne postoji isto nezavisna varijabla u analizi. U pretposlednjem redu tabele nalazi se objanjena varijabla u procentima. Ona moe da poslui kao zavisna varijabla u viestrukoj regresionoj analizi sa ostalim varijablama ili faktorima kao nezavisnim da bi se ocenila relativna vanost faktora. Problem multikolinearnosti koji se javlja kod regresije moe da se rei korienjem faktora kao nezavisnih varijabli umesto originalnih varijabli jer su oni, po definiciji, u potpunosti nezavisni. Uoava se da je komunalitet za svaku varijablu u zbiru isti pre i posle rotacije. To znai da se od ukupne varijanse kod bilo koje varijable nije nita izgubilo u procesu rotacije. To je zato to se u toku postupka same varijable ne pomeraju. Njihova lokacija u prostoru je odreena meusobnim odnosima sa drugim varijablama. Prilikom rotacije osa koje predstavljaju faktore, za koliko se jedna varijabla priblii osi, za toliko se druga udalji. Koliko faktora treba rotirati? Iako glavnih k omponenti ima onoliko koliko ima i varijabli, najvei procenat varijacija podataka je objanjen sa svega nekoliko prvih komponenti. Zbog toga su u primeru sa vonim sokovima odabrane etiri komponente za rotaciju. Ostale komponente bi samo doprinele konfuziji i teoj interpretaciji. Poto su varijable gotovo uvek standardizovane pre analize, nas interesuju one komponente koje imaju varijansu veu od 1 jer u sebi sadre vee varijacije nego pojedinane varijable. Ovo je samo jedan od nekoliko naina. U praksi se preporuuje da se uradi vie naina za izbor broja faktora pre donoenja konane odluke. Zbog toga u e nastavku biti dat njihov detaljniji opis. Ortogonalna i kosa rotacija Kod ortogonalne rotacije, ose koje predstavljaju faktore ostaju pod pravim uglom i pre i posle rotacije. Kao posledica toga, faktori su uvek u potpunosti nepovezani. Ovo je tradicionalni pristup koji se prvi pojavio. Neki analitiari su kasnije zastupali stav da podaci govore sami za sebe i da se zanemari ogranienje o ortogonalnosti faktora. U tom sluaju ose same zauzimaju najbolju poziciju bez obzira na poloaj ostalih. Rotacija ove vrste se zove kosa rotacija (oblique rotation) jer vie ne vai pravilo o pravouglom odnosu linija faktora . Mnogi programski paketi ovaj oblik rotacije nude kao opciju. Primeri za ortogonalnu i kosu rotaciju dati su na slikama. Na slici uoava se da su sve tri ose ostale pod pravim uglom nakon rotacije. Na slici , meutim, nakon rotacije ose zauzimaju drugaiji poloaj koji nije pod 90.

1. Multivarijaciona statistika analiza

16

Faktor 2

+
Faktor 3

90 90 90

+
Faktor 1

Slika: Ortogonalna rotacija faktora


Faktor 2

+ Faktor 3 +
Faktor 1

Slika: Kosa rotacija faktora

Razliiti programi pruaju razliite opcije za kosu rotaciju. Na primer, analitiar moe da odabere ciljnu varijablu i program e smestiti ose kroz nju. Ova varijabla oko sebe okuplja ostale bliske varijable dajui im visoko faktorsko optereenje. Postoji i takozvana Prokrustova rotacija kod koje se prvo izvede ortogonalna rotacija, a zatim se ose rotiraju dok osa ne proe kroz bilo koju varijablu koja ima najvee faktorsko optereenje za svaki ortogonalni faktor. Kosa rotacija moe da prui jasnije razumevanje strukture faktora. Ukoliko ortogonalna rotacija nije dovoljno ravnomerno rasporedila faktorska optereenja na faktore, moe se pribei kosoj rotaciji koja e to efikasnije izvesti.

1. Multivarijaciona statistika analiza

17

Nedostatak kose rotacije je taj to se izmeu faktora javlja zavisnost (kolinearnost) pa se dobijeni rezultati ne mogu kvalitetno upotrebiti u viestrukoj regresionoj analizi. Ipak kosa rotacija nee imati uticaja na prognostiku mo regresionog modela. Ukoliko se za regresionu analizu koriste ortogonalni faktori, onda je problem multikolinearnosti potpuno reen. to je vei broj or togonalnih varijabli, regresioni model je efikasniji. Poto rotirani faktor u kosoj rotaciji vie nisu pod uglom od 90 stepeni, oni se mogu tretirati kao nove originalne varijable na kojima moe da se uradi drugostepena faktorska analiza. Metod rotacije koji se najee koristi je takozvana varimax rotacija. Ona se bazira na pretp ostavci da razumljivost datog faktora moe da se izmeri varijansom faktorskih optereenja. Ako je ta varijansa velika onda vrednosti faktorskih optereenja tee da budu ili blizu nule ili blizu jedinice. Varimax rotacija maksimizira sumu tih varijasni za s ve faktore. Ova rotacija moe da se radi bez ili sa prethodnom normalizacijom faktorskih optereenja (Kaiser normalizacija). Kriterijumi za odreivanje broja faktora U odluivanju koliko e faktora biti uzeto u obzir, analitiar mora da kombinuje konceptu alna znanja (Koliko faktora treba da bude u datoj strukturi?) sa empirijskim dokazima (Koji je racionalan broj faktora koji se mogu objasniti?). Analitiar polazi od unapred postavljenih kriterijuma, kao to je opti broj faktora plus opti prag praktine znaajnosti (procenat objanjenosti varijanse koji je unapred postavljen). Ovi kriterijumi se kombinuju sa empirijskim rezultatima. Tehnika za tano odreivanje broja faktora nije razvijena. Najei metod koji se primenjuje jeste kriterijum latentnog kore na (latent root criterion). Prema ovom kriterijumu u obzir se uzimaju samo oni faktori koji imaju ajgenvrednost veu od 1. Faktori koji imaju manju ajgenvrednost od 1 se smatraju nebitnim jer objanjavaju manje varijabiliteta nego to ga objanjavaju same varijable. Ovaj metod je najbolji kada je broj varijabli izmeu 20 i 50. Ako ima manje od 20 varijabli, postoji tendencija da se izabere premalo faktora, a ako je broj varijabli vei od 50, tendencija je da se izabere previe faktora. A priori kriterijum polazi od unapred definisanog broj faktora koji se eli i raunaru se prosto da instrukcija da se dati broj faktora izvue. Kriterijum procenta objanjene ukupne varijanse. Polazi se od toga da se odredi procenat ukupne varijanse za koji se eli da bude objanjen i kada se taj procenat dostigne, tada se utvrdi koliko je faktora potrebno da bi se to dostiglo. Ne postoji vrsto pravilo koji je to procenat objanjene ukupne varijanse dovoljan, nego se ide od sluaja do sluaja. U prirodnim naukama obino se zahteva vei procenat (barem 95%), dok kod drutvenih nauka, gde je informacija manje precizna, esto se analitiari zadovoljavaju i sa 60% od ukupno objanjene ukupne varijanse. Scree test je grafiki metod za odreivanje broja komponenti za rotaciju. Na linijskom dijagramu se predstavljaju ajgenvrednosti komponenti poevi od najvee. Trai se mesto na kojem linija naglo menja pravac i do te take se broje komponente koje e biti ukljuene u analizu. Na slici je prikazan jedan takav grafikon gde se uoava nagli prelom linije kod druge komponente, to znai da e za rotaciju biti izdvojena samo dva faktora koji zajedno objanjavaju 82,95% varijacija .

1. Multivarijaciona statistika analiza

18

Eigenvalues of correlation matrix Active variables only 4.0 72.32% 3.5 3.0 2.5
Eigenvalue

2.0 1.5 1.0 10.63% 0.5 0.0 -0.5 0.0 7.73%

6.03%

3.29%

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

5.5

6.0

Eigenvalue number

Slika: Grafiki prikaz ajgenvrednosti za primenu Scree metoda Prilikom konanog izbora faktora treba voditi rauna o tome da broj faktora bude adekvatan. Iako su faktori nezavisni, negativne posledice se javljaju i kad je izabrano previe i kad je izabrano premalo faktora. Ako je izabrano premalo faktora, onda se ne objanjava prava struktura i vane dimenzije nee biti otkrivene. Ako se zadri preveliki broj faktora, interpretacija postaje komplikovana kada se rezultati rotiraju. Po analogiji, izbor broja faktora je neto kao fokusiranje mikroskopa. (Hair, Black, Babin, & Anderson, 2010). Evaluacija i eventualno redefinisanje modela Analitiar mora da evaluira dobijeno reenje. Ukoliko reenje nije adekvatno ili dovoljno zadovoljavajue, mogue je da se javi potreba za redefinisanjem celog modela i to upotrebom sledeih koraka: iskljuivanje jedne ili vie varijabli iz analize upotreba drugaijeg metoda za rotiranje faktora radi bolje interpretacije izvlaenje drugaijeg broja faktora u analizi upotreba drugaijeg modela za definisanje faktora putem deljenja varijanse. Potrebno je videti da li su faktorska optereenja dovoljno znaajna. Faktorska optereenja je potrebno posmatrati na sledei nain:

1. Multivarijaciona statistika analiza

19

Ako su optereenja u intervalu od 0,30 do 0,40 onda oni ispunjavaju minimalne zahteve za uee u interpretaciji date strukture podataka. Optereenja preko 0,50 se smatraju praktino signifikantnim. Optereenja preko 0,70 se smatraju indikativnim za jednu dobro definisanu strukturu i oni su pravi cilj faktorske analize. Pored navedene skale, postoji i k riterijum za statistiku znaajnost faktorskih optereenja uz verovatnou 95%, odnosno koliko treba da bude velik uzorak da bi se odreeni nivo faktorskog optereenja smatrao znaajnim (tabela). Tabela: Identifikacija statistiki znaajnih faktorskih optereenja na osnovu veliine uzorka Faktorsko optereenje 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 Potrebna veliina uzorka da bi se postigla znaajnost 350 250 200 150 120 100 85 70 60 50

Izvor: Hair et al. (Multivariate Data Analysis - A Global Perspective, 2010) Broj varijabli koje se posmatraju takoe je bitan za donoenje odluke o tome koja su faktorska optereenja znaajna. Kako se broj analiziranih varijabli poveava, prihvatljivi nivo statistike znaajnosti opada. Prilagoavanje broju varijabli postaje sve vanije kako se analiza pomera od prvog ka poslednjem faktoru. Jednom kada su definisana sva statistiki znaajna optereenja, potrebno je potraiti varijable koje nisu adekvatno zastupljene dobijenim faktorskim reenjem. Prvo se potrae sve one varijable koje nemaju ni jedno znaajno faktorsko optereenje. Drugi pristup je da se ispita komunalitet svake varijable, koji reprezentuje zapravo koliinu varijanse koja je obuhvaena faktorskim reenjem za svaku varijablu. Na primer, analitiar moe da odredi da barem jedna polovina varijanse svake

1. Multivarijaciona statistika analiza

20

varijable mora da bude uzeta u obzir. Prema tome, ona varijabla koja ima komunalitet manji od 0,50 nema dovoljno dobro objanjenje u modelu. Kada su istraena faktorska optereenja i komunalitet, mogu da se jave sledei problemi: varijabla nema znaajno faktorsko optereenje komunalitet varijable je nizak, bez obzira to je faktorsko optereenje znaajno varijabla ima unakrsno faktorsko optereenje, odnosno ista varijabla ima znaajna faktorska optereenja za vie faktora (cross-loadings). Potrebno je preduzeti odreene mere, koje mogu da se kombinuju (Hair, Black, Babin, & Anderson, 2010): Ignorisati problematine varijable i interpretirati faktore takve kakvi su. Ovo je opravdano ako je cilj redukcija podataka, ali mora se imati na umu da su odreene varijable loe reprezentovane u faktorskoj strukturi. Razmisliti o eventualnom brisanju varijable iz analize, to zavisi od opteg doprinosa u celokupnom istraivanju i u komunalitetu date varijable. Nakon toga se izrauje novo faktorsko reenje bez te varijable. Brisanje variable se esto radi i u sluaju unakrsnog faktorskog optereenja. Uraditi neku drugu vrstu rotacije, moda i kosu rotaciju ako je do tada koriena samo ortogonalna rotacija. Smanjiti ili poveati broj faktora da bi se videlo da li e onda problematina varijabla biti bolje reprezentovana. Promena vrste faktorske analize (analiza glavnih komponenti vs. faktorska analiza u uem smislu) da bi se videlo da li e se znaajnije promeniti faktorska struktura. Interpretacija rotiranih faktora Kao finalna faza istraiva posmatra faktorska optereenja nakon rotacije (ako je ona bila uopte potrebna) i eventualnog redefinisanja modela. Da bi se dodelili adekvantni nazivi faktorima posmatraju se faktorska opereenja za svaku varijablu sa ciljem da se odredi njena uloga i doprinos u definisanje strukture faktora. Predznaci faktorskih optereenjsa se interpretiraju kao kod bilo kog drugog koeficijenta korelacije, to znai da su kod pozitivnih faktorskih optereenja faktor i varijabla pozitivno povezani a u suprotnom sluaju negativno. Kod ortogonalnih reenja faktori su nezavisni to znai da se negativno ili pozitivno faktorsko optereenje kod jednog faktora ne povezuje ni na koji nain sa drugim faktorima. U primeru sa vonim sokovima, sledei korak je da se daju imena faktorima. Imena faktora uvek zavise od najveeg i najmanjeg (negativnog) faktorskog optereenja. Na primer, u tabeli, pod varimaks rotacijom, za faktor 1, najvea optereenja su za Zadovoljavajui ukus (-0,74), Zreo ukus (-0,70) i Prijatan ukus (-0,63), svi sa negativnim optereenjem. To zapravo znai da ako je odreena vrsta vonog soka visoko ocenjena po jednoj od ovih osobina, verovatno e biti visoko ocenjena i po ostalim osobinama i obrnuto. Pored toga, najvea pozitivna optereenja kod faktora 1 su ist i jasan ukus (0,52), iv ukus (0,50), Iskriav ukus (0,48) i Bogat ukus (0,45). To

1. Multivarijaciona statistika analiza

21

zapravo znai da voni sok koja ima ist, iv, iskriav i bogat ukus obino nema zadovoljavajui, zreo i prijatan ukus. Istraiva je za prvi faktor izabrao ime Zadovoljavajui ukus na osnovu najveeg, negativnog faktorskog optereenja. Faktor 2 je dobio ime Toplina ukusa, faktor 3 Ukus pravog voa i faktor 4 Sveina. Primer: Zaposlenost u evropskim zemljama Faktorska analiza je primenjena na podacima o zaposlenosti u evropskim zemljama. Korelaciona matrica kao i ajgenvrednosti i ajgenvektori za ovu seriju su izraunati kod analize glavnih komponenti. Poto ima ukupno etiri ajgenvrednosti vee od jedan, primenuje se grubo pravilo da bude i etiri faktora u modelu. Izraunata su faktorska optereenja za etiri faktora i devet varijabli:

X 1 0,90 F 1 0,03 F 2 0,34 F 3 0,02 F 4 e1


X2 0,66 F 1 0,00 F 2 0,63 F 3 0,12 F 4 e1

(0,93) (0,85) (0,91) (0,46) (0,92) (0,79) (0,87) (0,88) (0,87)

X3
X4

0,43 F 1 0,58 F 2 0,61 F 3 0,06 F 4 e1


0,56 F 1 0,15 F 2 0,36 F 3 0,02 F 4 e1

X5
X6

0,39 F 1 0,33 F 2 0,09 F 3 0,81 F 4 e1


0,67 F 1 0,55 F 2 0,08 F 3 0,17 F 4 e1

X7
X8

0,23 F 1 0,74 F 2 0,12 F 3 0,50 F 4 e1


0,76 F 1 0,07 F 2 0,44 F 3 0,33 F 4 e1

X9

0,36 F 1 0,69 F 2 0,50 F 3 0,04 F 4 e1

Vrednosti u zagradama predstavljaju komunalitet. Na primer, komunalitet za varijablu X 1 (AGR, poljoprivreda, umarstvo i ribarstvo) se izaunava na sledei nain:

0,90

0,03

0,34

0,02

0,93

Komunaliteti su veliki za sve varijable osim za X4 (PS, proizvodnja elektrine energije, gasa i vode). To znai da je vei deo varijabiliteta podataka osam varijabli obuhvaeno zajednikim faktorima. Faktorska optereenja koja su vea od 0,50, bez obzira na predznak, predstavljaju velika i umerena optereenja koja pokazuju kako je varijabla povezana sa faktorom. Oigledno je da je varijablia X 1 gotovo u potpunosti odreena faktorom 1, X2 je meavina faktora 2 i faktora 3, X3 je odreen faktorima 1 i 2 itd. Nepovoljno je to su pet od devet varijabli jako povezane sa dva faktora. Rotacija faktora e moda pruiti bolje reenje. Primenjena je varimax rotacija sa Kaiser-ovom normalizacijom. Dobijen je sledei model:

X1

0,85 F 1 0,10 F 2 0,27 F 3 0,36 F 4 e1

1. Multivarijaciona statistika analiza

22

X2 X3 X4 X5 X6 X7 X8 X9

0,11 F 1 0,30 F 2 0,86 F 3 0,10 F 4 e1 0,03 F 1 0,32 F 2 0,89 F 3 0,09 F 4 e1 0,19 F 1 0,04 F 2 0,64 F 3 0,14 F 4 e1 0,02 F 1 0,08 F 2 0,04 F 3 0,95 F 4 e1 0,35 F 1 0,48 F 2 0,15 F 3 0,65 F 4 e1 0,08 F 1 0,93 F 2 0,00 F 3 0,01 F 4 e1 0,91 F 1 0,17 F 2 0,12 F 3 0,04 F 4 e1 0,73 F 1 0,57 F 2 0,03 F 3 0,14 F 4 e1

Komunalitet je nepromenjen a faktori su i dalje nepovezani. Reenje je neto bolje jer je samo varijabla X9 povezana neto vie sa dva faktora. U sledeem koraku potrebno je dati nazive faktorima, to podrazumeva odreeni stepen inovativnosti. Faktor 1 ima visoko pozitivno optereenje za varijablu X1 (AGR poljoprivreda, umarstvo i ribarstvo), gde je optereenje 0,85 i visoka negativna optereenja za varijable X 8 (SPS drutvene i line usluge), sa optereenjem 0,91 i X9 (TC - transport i komunikacije), sa optereenjem 0,73. To znai da se meri stepen u kojem su ljudi zaposleni u poljoprivredi pre nego u dravnoj upravi i komunikacijama. Naziv faktora 1 je zbog toga ruralna industrija pre nego drutveni servis i komunikacije. Faktor 2 ima negativno optereenje za X7 (FIN finansije), i to 0,93 i dovoljno visoko pozitivno optereenje za X9 (TC - transport i komunikacije) od 0,57. Usled toga je dobio naziv nedostatak finansija. Faktor 3 ima visoko pozitivno optereenje za X2 (MIN rudarstvo) od 0,86 i negativna optereenja za X3 (MAN preraivaka industrija) od 0,89 i X4 (PS - Proizvodnja elektrine energije, gasa i vode) od 0,64. Naziv ovog faktora je rudarstvo pre nego proizvodnja. Faktor 4 ima visoka pozitivna optereenja za varijable X 5 (CON graevinarstvo) od 0,95 i X6 (SER usluge) od 0,65. Logino je da naziv bude graevinarstvo i usluge. Na osnovu jednaina izraunavaju se faktorski skorovi za svaku varijablu pojedinano. Rezultati su dati u tabeli. Tabela: Rotirani skorovi faktora
Zemlja Belgium Denmark France Germany Faktor 1 0.97 0.89 0.56 -0.05 Faktor 2 0.56 0.47 0.78 0.57 Faktor 3 0.10 0.03 0.15 0.47 Faktor 4 0.47 0.67 0.25 -0.58

1. Multivarijaciona statistika analiza

23

Ireland Greece Italy Luxembourg Netherlands Portugal Spain U.K. Austria Finland Iceland Norway Sweden Switzerland Albania Bulgaria Czech/Slovak Rep. Hungary Poland Romania USSR (form.) Yugoslavia (form.) Cyprus Gibraltar Malta Turkey

-0.48 -0.28 -0.25 0.46 1.36 -0.66 -0.24 0.50 -0.18 0.78 0.18 1.36 1.20 -0.12 -3.16 -0.47 0.26 1.05 -0.97 -1.11 -0.08 -0.13 -0.46 0.05 1.18 -2.15

-0.19 0.60 0.13 0.36 1.56 0.45 0.11 1.14 -0.05 0.20 0.04 0.17 0.52 0.67 1.82 -1.56 -1.45 -1.70 -0.71 -1.73 -2.09 -1.48 0.32 1.05 -0.49 -0.07

0.23 0.36 -0.17 -0.02 0.03 0.37 0.09 0.35 0.71 0.21 0.06 -0.20 -0.04 -0.01 -1.76 0.57 -3.12 -2.82 0.37 1.69 0.11 1.70 -0.03 -0.08 0.79 -0.15

-0.02 -0.03 -1.00 -0.92 2.08 -0.64 -0.93 0.04 -0.56 0.52 -0.46 0.41 0.74 -0.65 1.79 0.65 -0.44 0.14 0.42 0.81 -0.14 -0.17 -1.08 -3.26 1.31 0.56

Na osnovu analize faktorskih skorova uoava se da je vrednost faktora 1 visoka u Albaniji i Turskoj, to znai da je tamo akcent na ruralnoj industriji pre nego na drutvenom servisu i komunikacijama. Bugarska, Maarska, Rumunija i bivi SSSR imaju malo zaposlenih u finansijama, dok Holandija i Albanija imaju velik broj zaposlen u toj oblasti. Ovo je uoljivo na osnovu faktora 2. Faktor 3 stavlja u kontrast Albaniju i bivu ehoslovaku sa jedne strane i Rumuniju i bivu Jugoslaviju sa druge strane zbog broja zaposlenih u rudarstvu. Faktor 4 stavlja u kontrast Gibraltar, sa velikim brojem zaposlenih u graevinarstvu i uslugama, naspram Holandije i Albanije gde je obrnut sluaj. Moda bi bilo racionalno i izvodljivo nastaviti analizu sa manjim brojem faktora i drugaijim metodima faktorske analize. Razliiti softverski paketi mogu da daju ajgenvektore sa suprotnim predznacima. Takoe, obrnuti predznaci mogu da se pojave prilikom rotacije faktora, tako da faktorska optereenja idu u suprotnom smeru od onog koji je naveden u ovom primeru. U takvom sluaju potrebno je obrnuti i interpretaciju.

1. Multivarijaciona statistika analiza Faktor skorovi

24

Jednom kada je broj originalnih varijabli smanjen na odreeni broj faktora, mogue je izraunati faktor skorove. Oni zapravo predstavljaju rezultate za svaku jedinicu posmatranja po pojedinim faktorima. Skup faktor skorova ini novi, redukovani set podataka. Oni predstavljaju visinu individualnih skorova koji su povezani sa visinom faktorskog optereenja. Odnosno, visoka vrednost varijable u pogledu faktorskog optereenja e rezultovati i viso kim faktor skorom. U sluaju sa vonim sokovima, umesto 14 varijabli sada imamo 4 varijable koje na najbolji nain odslikavaju stav ispitanika prema vonim sokovima. Postoje sluajevi kada faktor skorove nije poeljno izraunavati: Kada struktura faktora nije dovoljno jasna i kada se neki faktori ne mogu dobro interpretirati. Kada veliki broj varijabli ima mali komunalitet, to znai malu varijaciju zajednikih faktora. Kada je potrebna velika preciznost u analizi. Tada je bolje primeniti neku od multivarijacionih tehnika zavisnosti, ako je mogue.

Upotreba faktorske analize sa drugim multivarijacionim tehnikama


Poto faktorska analiza obezbeuje uvid u meusobni odnos varijabli i otkriva skrivenu strukturu podataka, ona predstavlja dobru poetnu osnovu za druge multivarijacione tehnike. Faktorska analiza omoguuje analitiaru jasno razumevanje oko toga koje varijable imaju najvaniji uticaj i koliki je njihov broj. Na primer, u zavisnosti od dobijenih rezultata moe se uraditi sledee: Varijable koje su visoko korelisane i pripadaju istom faktoru verovatno imaju iste karakteristike kada su u pitanju statistiki znaajne razlike izmeu grupa u multivarijacionoj analizi varijanse ili u diskriminacionoj analizi. Visoko korelisane varijable, unutar istog faktora, imaju uticaj na stepwise proceduru viestruke regresije i diskriminacione analize prilikom dodavanja novih varijabli i poveavanja moi predvianja modela. Ako je jedna varijabla vezana za neki faktor ve uvrtena u model, onda je malo verovatno da e sledea varijabla koja je vezana za isti faktor biti uvrtena u model jer e mo predvianja celog modela biti neznatno uveana. To ne znai da druge varijable istog faktora nisu bitne ili da imaju manji uticaj, ali njihov efekat je ve reprezentovan preko prve varijable koja je uvrtena. Faktorska analiza prua empirijsku osnovu za evaluaciju strukture varijabli i uticaj te strukture na interpretaciju rezultata dobijenih nekom drugom multivarijacionom tehnikom. Ako je cilj, naprotiv, da se identifikuju odgo varajue varijable za primenu u nekoj drugoj analizi, onda e neka od tehnika redukcije biti primenjena. Postoje dve opcije: Izbor varijable sa najveih faktorskim optereenjem kao surogat koji e reprezentovati odreeni faktor odnosno dimenziju.

1. Multivarijaciona statistika analiza

25

Zamena originalnog seta varijabli sa potpuno novim, redukovanim setom varijabli koje su kreirane uz pomo sumirane skale ili faktor skorova. O sumiranim skalama vie informacija moe da se nae u Hair et al. (2010). Bilo koja od pomenutih opcija kreira nove varijable koje bi, na primer, mogle da se koriste kao nezavisne varijable u diskriminacionoj analizi, kao zavisne varijable u multivarijacionoj analizi varijanse ili kao klaster varijable u klaster analizi. U svakom sluaju, ako je cilj to vea jednostavnost, onda se favorizuje reenje sa surogat varijablama, ako se eli replikacija u drugim studijama, favorizuje se sumirana skala, a ako je akcenat na ortogonalnosti, onda se biraju faktor skorovi. Sa empirijskog stanovita postoji velika slinost izmeu sumirane skale i faktor skorova. Ipak, vrlo esto su rezultati faktorske analize sami sebi cilj, kada je dovoljno da se identifikuje logika kombinacija varijabli i bolje razumevanje njihovog meusobnog odnosa.

Faktorska analiza u statistikom paketu STATISTICA


Koraci za izvoenje analize u programu su sledei:

Pokretanje analize: StatisticsMultivariate Exploratory Technique Factor Analysis Dobija se poetni meni za analizu.

Definisanje tipa podataka koji se analizira: Input file: Izabrati Raw Data ako su u pitanju sirovi podaci ili Correlation Matrix ako su u pitanju koeficijenti korelacije koji su ranije izraunati.

Definisanje varijabli: QuickVariables Otvara se prozor sa spiskom varijabli od kojih treba odabrati one koje e biti uvrtene u analizu. OK Dobija se drugi glavni meni sa opcijama Quick, Advanced i Descriptives Odreivanje broja faktora i minimalne ajgenvrednosti:

1. Multivarijaciona statistika analiza Quick Maximum no. of factors (upisati eljeni broj faktora) Quick Minimum eigenvalue (ostaviti neka bude 1)

26

Izbor metoda faktorske analize i metoda analize glavnih komponenti: AdvancedExtraction Method (odabrati Principal Components) AdvancedPrincipal factor analysis (ostaviti sve neobeleeno) I u ovom modulu se moe definisati broj faktora i minimalna ajgenvrednost. Izraunavanje korelacione matrice: DescriptivesReview correlations, means, standard deviations QuickCorrelations U modulu Descriptives se nalazi jo nekoliko opcija koje mogu biti od koristi prilikom analize . Izraunavanje ajgenvrednosti: QuickOKEigenvalues Izraunavanje faktorskih optereenja: Quick OKQuick (ili Loadings) Summary: Factor loadings Grafiki prikaz faktorskih optereenja: Quick OK Quick (ili Loadings) Plot of factor loadings, 2D

Rotacija podataka: QuickOK Quick (ili Loadings) Factor rotation (izabrati vrstu rotacije iz padajueg menija) Scree metod odreivanja broja faktora: QuickOKExplained varianceScree plot Izraunavanje komunaliteta: QuickOKExplained varianceCommunalities

1. Multivarijaciona statistika analiza Izraunavanje faktorskih skorova: QuickOKScoresFactor scores

27

Literatura
Hair, J., Black, W., Babin, B., & Anderson, R. (2010). Multivariate Data Analysis - A Global Perspective. New Jersey: Pearsib. Manly, B. F. (2005). Multivariate Statistical Methods - A primer (3rd Edition izd.). New York: Chapman & Hall/CRC. Myers, J. H., & Mullet, G. M. (2003). Managerial Applications of Multivariate Analysis in Marketing. Chicago: American Marketing Association.

Вам также может понравиться