Вы находитесь на странице: 1из 6

Suport L6L7 Analiza factoriala (AF) i analiza path

Obiectivul metodei: a) economia, sextrag un num r de factori redus i b) interpretabilitatea (s ajung la satura ii mari pentru acela i indicator numai ntr-un singur factor. Realizarea celor dou obiective se face prin algoritmi specifici de extragere a factorilor pentru economie (prin PCA, PAF, ML etc) si de rotire a lor pentru interpretabilitate (VARIMAX, OBLIMIN, QUARTIMAX, EQUAMAX etc.). O structura factoriala este cu atat mai simpla cu cat are mai putini factori/variabile latente/dimensiuni.

Introducerea metodei prin inputuri i output-uri esen iale


Intrebare: cum se grupeazn mentalul colectiv opiniile referitoare la problemele actuale ale Romaniei?. Cum poate fi redus un set de 11 indicatori de agenda public la cateva dimensiuni? Date de intrare n AF : matricea coeficien ilor de corela ie Bravais-Pearson ntre to i itemii care urmeaz a fi redusi la dimensiuni sau factori Output esential:matricea rotita a factorilor FACTORI SAU VARIABILE LATENTE. Sensul factorului este dat de itemii cu satura ie maxima. Este rezultat de interpretare
Rotated Component Matrix(a) variabila nume variabila apret5 amunca5 apensii5 alocuinta5 asanat5 ainstloc5 ainstc5 aeduc5 ainfract5 acorupt5 ajust5 Component 1 calitatea 2 3 vietii institutii coruptie ,805 ,765 ,715 ,646 ,591 ,113 ,121 ,281 ,198 ,340 ,155 ,076 ,082 ,080 ,305 ,300 ,895 ,888 ,673 ,177 ,146 ,290 ,187 ,098 ,334 ,116 ,301 ,162 ,211 ,215 ,820 ,771 ,766

preturi locurile de munca pensiile locuinte sanatatea institutiile locale institutiile centrale educatie infractionalitatea coruptia justitia

Coeficienti de satura ie (loadings) echivalentul coeficien ilor beta din regresia multipl . Masoara intensitatea influen ei factorului asupra indicatorului . Ex de citire: cresterea cu o abatere standard pe scala factorului 1 este insotita de cre terea cu 0.805 abateri standard pe scala item-ului referitor la perceptia gravitatii problemei

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a Rotation converged in 5 iterations. KMO=0.86 indica un potential foarte bun de factorializare a datelor (veyi mai departe detalii de despre KMO).

DS/draft2/11/7/2006

Introducerea metodei prin AF confirmatorie


Doua tipuri de factorial exploratorie, far model teoretic i confirmatorie, cu model teoretic asociat. Datele de intrare pentru um model didactic, simplificat fata de cel din tabelul anterior o matrice de corela ii de tipul 4*4. Ingrijorarile fata de preturi si locurile de munca sunt mai puternic legate intre ele decat cu cele referitoare la functionarea institutiilor centrale sal locale.
Date de intrare, o matrice de corela ii de tipul 4*4 Correlation Matrix Correlation amunca5 apret5 ainstc5 ainstloc5 Sig. (1-tailed) amunca5 apret5 ainstc5 ainstloc5 ,000 ,000 ,000 ,000 ,000 amunca5 1,000 ,528 ,215 ,194 apret5 ,528 1,000 ,236 ,222 ,000 ainstc5 ,215 ,236 1,000 ,816 ,000 ,000 ,000 ainstloc5 ,194 ,222 ,816 1,000 ,000 ,000 ,000

Un model factorial confirmatoriu: exisitdoutipuri de ingrijor ri majore, legate de calitatea vietii si de institu ii. Cele doutipuri de ngrijor ri sunt correlate pozitiv ntre ele.
Coeficient path (beta): cre terea cu o unitate standard pe scala factorului ngrijor ri asupra calit ii vie ii este nso it , n medie, de cre terea ngrijor rii referitoare la pre uri cu 0.77 abateri standard
,48
amunca5 U1

,69

CALIT.VIETII explica 48% din varia ia indicelui amunca5

CALIT.VIETII

,77
apret5

,59
U2

,33 ,75
ainstloc5

,87

U3

INSTITUTII

,94
ainstc5

,88
U4

Figura 1.Diagrama path a unui model factorial de tip confirmatoriu (cu model teoretic pre-existent).

Chi-square = ,477, Degrees of freedom = 1, Probability level = ,490, Model construit cu Amos 6
. Modelul prezentat face parte din seria modelelor de ecuatii structurale (structural equation models SEM) caracterizate prin faptul c opereazsimultan cu mai multe variabile dependente. Rezolvarea unor astfel de modele se face i prin soft-uri de tip AMOS sau LISREL (Linear Structural Equations Models).

DS/draft2/11/7/2006

AF exploratorie, fara model teoretic, varianta ortogonala, cu fatori independenti


In AF exploratorie de tip PCA (analiza componentelor principale), fatorii sunt independenti (ortogonali) iar saturatiile sunt calculate pentru relatiile intre toate perechile indicatori-factori. Cercetatorul nu mai are posibilitatea, precum in analiza confirmatorie as predetermine num rul de factori si rela iile dintre variabilele manifeste si factori.

Figura 2. Reprezentarea rela iilor dintre factori i variabile pentru modelul bifactorial, extragere PCA, rotire VARIMAX Valori KMO mai mici de 0.50 indic date inadecvate pentru AF.KMO=suma patratelor corelatiilor dintre variabile/(suma patratelor corelatiilor+suma patratelor corelatiilor partiale din matrice). KMO indica valori ridicate ale corelatiilor partiale, semn de comunalitate redusa in matricea de date. KMO=0.55 indica o adecvare redusa a datelor pentru factorializare.

KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square df Sig. ,556 2987,411 6 ,000

Toate cele patru variabile din model au un indice KMO mai mare de 0.50, asa cum rezulta din valorile marcate cu a in matricea de mai jos.
Anti-image Matrices amunca5 ainstloc5 ainstc5 loc.munca apret5 preturi instit.locale instit.centrale ,712 -,356 -,004 -,029 -,356 ,704 -,020 -,026 -,004 -,020 ,334 -,267 -,029 -,026 -,267 ,330 ,586 a -,502 -,007 -,060 -,502 ,599 a -,042 -,054 -,007 -,042 ,537 a -,804 -,060 -,054 -,804 ,540 a

Anti-image Covariance amunca5 loc.munca apret5 preturi ainstloc5 instit.locale ainstc5 instit.centrale Anti-image Correlation amunca5 loc.munca apret5 preturi ainstloc5 instit.locale ainstc5 instit.centrale a. Measures of Sampling Adequacy(MSA)

DS/draft2/11/7/2006

Communalities amunca5 apret5 ainstc5 ainstloc5 Initial 1,000 1,000 1,000 1,000 Extraction ,768 ,760 ,907 ,909

Comunalitatile -echivalente ca semnificatie cu determinatia mltipla din regresia mltipla. Cei di factori principali explica 77% din variatia itemului de ingrijorare fata de munca. Itemii cu valoare redusa a comunalit ii sunt candidati la excludere din model

Extraction Method: Principal Component Analysis.

Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Total % of VarianceCumulative % Total % of VarianceCumulative % Total % of VarianceCumulative % 2,129 53,216 53,216 2,129 53,216 53,216 1,811 45,280 45,280 1,216 30,392 83,608 1,216 30,392 83,608 1,533 38,328 83,608 ,472 11,788 95,397 ,184 4,603 100,000

Component 1 2 3 4

Extraction Method: Principal Component Analysis.

Matricea factorilor dupa extragere, fara rotire


a Component Matrix

ainstc5 ainstloc5 amunca5 apret5

Component 1 2 ,842 -,445 ,831 -,467 ,591 ,647 ,616 ,617

Valoare proprie a factorului, ponderea variatiei variabilelor explicata de factor, data de suma patratului saturatiilor din factor. Factorul 1 explic , dup rotire, 45% (=1.811*100/4) din variatia datelor. Variatia totala n matricea de date este egala cu numarul de variabile pentru ca fiecare dintre acestea sunt standardizate, implicit, cu scorul z si, in consecinta au varianta egala cu 1. Impreuna, cei doi factori explic 83.6% din varia ia matricei de date.

Extraction Method: Principal Component Analysis. a. 2 components extracted.

Matricea factorilor duprotire


a Rotated Component Matrix

ainstc5 instit.centrale ainstloc5 instit.locale amunca5 loc.munca apret5 preturi

Component 1 2 ,943 ,137 ,946 ,113 ,096 ,871 ,134 ,862

Factorul 1 este definit de ngrijorarea fat de func ionarea institu iilor, itemii cu satura ii maxime n factor

Factorul 2 este definit de ngrijorarea fat de ob inerea locurilor de munc i fata de preturi

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations.

DS/draft2/11/7/2006

Matricea scorurilor factoriale


Component Score Coefficient Matrix Component 1 2 ,535 -,063 ,542 -,080 -,089 ,594 -,066 ,581
Cresterea cu o abatere standard pe scala ingrijor rii fa de func ionarea institu iilor centrale duce la cre terea ngrijor rii fa de institu ii cu 0.53 abateri standard.

ainstc5 instit.centrale ainstloc5 instit.locale amunca5 loc.munca apret5 preturi

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.

Scorurile factoriale permit construrea unor indici de reducere a unei multimi de variabile la una de tip sintetic. Pe exemplu dat, solutia ortogonal , cu factori independenti, este aplicata legitim, deoarece in factorial de tip oblic (prin rotire OBLIMIN) corelatia dintre cei doi factori este de 0.26, ceea ce inseamna o determinatie simpla mai mica de 10%. Sintaxa comenzii pentru exemplu prezentat FACTOR /VARIABLES amunca5 apret5 ainstloc5 ainstc5 /MISSING LISTWISE /ANALYSIS amunca5 apret5 ainstloc5 ainstc5 /PRINT INITIAL KMO AIC EXTRACTION ROTATION FSCORE /FORMAT SORT /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PC /CRITERIA ITERATE(25) /ROTATION VARIMAX /METHOD=CORRELATION .

Condi ii de aplicare a AF, probleme de interpretare acelea i ca si la regresia mltipla Variabile . o num r relativ egal de variabile pe factor. til as se lucreze cu metoda stepwise in selectia variabilelor si cu pornnire de la setul de itemi pentru care asocierile sunt clar interpretabile. o numarul de cazuri/variabila, cel pu in 5 iar numarul total de cazuri cel pu in 200 (vezi detalii in Garson) o cel pu in trei variabile pe factor (Thurstone) o variabile care au saturatii apropiate in factori diferiti trebuie eliminate ca factor de zgomot in matricea factoriala Datele de intrare. o KMO as fie mai mar de 0.60. datele nu sunt factorializabile daca valoarea KMO este mai mica de 0.50. Pentru KMO acceptabil se studiaza valorile de variabila ale indicelui aflate pe diagonala matricei de corelatii anti-imagine. o Cumularea unor esantioane diferite pentru factorializare se poate face numai daca acestea au, independent, structura factorial asemanatoare (Garson) Semnificatie . o Factorii trebuie sa aiba validitate intuitiva (face validity). til as fie folositi mai multi judecatori pentru a defini factorii. o Varianta PCA nu are test de semnificatie. Extrageri de tipul ML, GLS etc. au asociate teste de semnificatie o Rotirea prin VARIMAX maximizeaza varia iile pe coloana, ntre saturatiile aceluiasi factor iar QUARTIMAX maximizeaza varia iile interfactoriale pentru

DS/draft2/11/7/2006

aceasi variabil . Prima metoda sporeste interpretabilitatea factorilor iar cea de-a doua sporeste interpretabilitatea variabilelor functie de factori. EQUAMAX este o metoda intermediara intre QUARTIMAX si VARIMAX. OBLIMIN se adopta pentru ipoteza factorilor corelati (factorial oblica) dar si pentru a testa independenta lor, ca etapa premergatoare in adoptarea factorialei ortogonale.

Variante importante de AF: R grupare de variabile i Q- grupare de cazuri

Referin e Pentru introducere n AF, vezi David Garson


http://www2.chass.ncsu.edu/garson/pa765/factor.htm , Dumitru Sandu, Analiza factorial , n Catalin Zamfir, Laz r

Vlasceanu (coord) Dictionar de sociologie, Bucuresti :Babel, 1993 . Pentru detalii de interpretare n analiza factorial pe o tem specific vezi Dumitru Sandu , Agenda publica n Romania de azi, n Barometrul de Opinie Public . Mai 2006. Percep ii despre mass-media , FSD, 2006. Pentru o aplicatie a analizei path , vezi Dumitru Sandu Sociologia tranzitiei. Valori i tipuri sociale n Romnia , Bucuresti:Staff, 1996, cap.7

DS/draft2/11/7/2006

Вам также может понравиться