Академический Документы
Профессиональный Документы
Культура Документы
53
natural
a a variabilelor suplimentare. Alte criterii de aproximare
pot , totusi,
P 2
utile. n locul metodei celor mai mici p
atrate min
ei (norma "L
2 ") se
P
poate utiliza, de exemplu, metoda celor mai mici valori absolute min f jei jg
(norma "L1 ") care induce distanta city-block (pentru contributii la acest
punct de vedere se recomand
a, printre altele, [18] ).
ntr-un spirit putin diferit, [45] enunta un algoritm pentru a aproxima
(n sensul celor mai mici p
atrate, adic
a n L2 ) o matrice de distante de tip Lp
cu o matrice de disimilaritate dat
a.
Pentru a studia anumite tabele de contingenta, n speta tabele
P p de schimb,
p 2
[19] propun utilizarea distantei lui Hellinger : d2 (x; y) =
xi
yi
(analiza vectoriala sferica ).
n ne, f
ar
a a schimba nici metrica nici criteriul de aproximare, se pot
aproxima alte suprafete dect hiperplanele. Astfel, n cazul analizei n componente principale normate care este, n spatiul Rn ; analiza punctelor situate
pe o sfer
a, [25] propune aproximarea unei hipersfere.
1.2.7
Exemplu
Descrierea datelor
n scopul studiului relatiilor dintre 10 tipuri de activit
ati umane si al
clasic
arii acestora, s-au cules date privind obiceiurile zilnice a 28 de grupuri de
indivizi de ambele sexe. Valorile din tabelul A.1. (Anex
a) reprezint
a num
arul
de ore din 100 de zile alocat pentru un anume tip de activitate. Datele vor
analizate utiliznd tehnica analizei n componente principale.
Pentru acest set de date se identic
a:
variabilele active:
WRK = carier
a
TRSP = transport
HH = activit
ati casnice
CHD = copii
SHP = cump
ar
aturi
CARE = ngrijire personal
a
MEAL = hran
a
variabilele suplimentare:
SLP = odihn
a
TV = televizor
LSR = distractie
GEN
prima liter
a
a doua liter
a
a treia liter
a
E=angajat
U=neangajat
M=c
as
atorit
S=nec
as
atorit
M=b
arbat
W=femeie
U=USA
W=Vest
E=Est
Y=Iugoslavia
Efectuarea analizei
si interpretarea rezultatelor
Aplicarea metodei de analiz
a n componente principale n cadrul programului STATISTICA presupune parcurgerea mai multor pasi.
Pentru nceput se selecteaz
a din bara de meniu tipul de analiz
a utilizat
- Statistics, Multivariate Exporatory Techniques, Principal Components and
Classication Analysis.
n fereastra de dialog ap
arut
a (g. 1.2.8.) butonul Variables permite
selectarea variabilelor active, suplimentare, de identicare a indivizilor activi
si de etichetare, conform specicatiilor de mai sus. Se opteaz
a pentru analiza
bazat
a pe corelatii (analiza pe tabelul centrat redus) si pentru lucrul cu estimatorul nedeplasat al dispersiei, SS=(N 1). Valorile lips
a din tabelul de date se
trateaz
a prin metoda Mean Substitution (nlocuirea cu media corespunz
atoare
variabilei respective).
55
57
Urm
atorul pas n cadrul ACP este determinarea dimensiunii spatiului de
proiectie, unde relatiile dintre variabile vor mai usor de observat. Pentru
aceasta examin
am valorile proprii rezultate n urma diagonaliz
arii matricei
corelatiilor dintre variabilele active. Tabelul 1.2.8., obtinut din submeniul
Variables, Eigenvalues, contine valorile proprii ordonate descresc
ator, indic
a
procentul de inertie explicat
a de factorul asociat ec
arei valori proprii precum
si procentul cumulat de inertie explicat
a.
tabelul 1.2.8. Valori proprii
coordonatele proiectiilor variabilelor pe cei doi factori principali (Variables, Factor coordinates of variables).
contributiile variabilelor la inertia factorilor (Variables, Contributions).
Cu ct un punct este mai dep
artat de origine cu att are o contributie
mai ridicat
a. Evident, nu se pot calcula contributii n cazul elementelor
suplimentare deoarece acestea nu particip
a efectiv la analiz
a.
cosinusurile p
atrate, ce dau calitatea reprezent
arii variabilelor pe ecare
factor (Variables, Communalities). Cu ct cosinusurile p
atrate sunt mai
apropiate de 1 cu att proiectiile punctelor sunt mai aproape de pozitiile
acestora n spatiul initial, deci informatia este mai bine conservat
a n
noul spatiu.
59
61
axe principale: (A) femeile care isi petrec majoritatea timpului n cas
a si (B)
femeile care si petrec majoritatea timpului n exterior. Pentru o interpretare
mai detaliat
a se opteaz
a pentru reprezentarea punctelor nsotite de etichete
(optiunea Case Names din submeniul Cases).