Вы находитесь на странице: 1из 7

Facultatea de Marketing, anul II, 2014-2015, ASE

Problema rezolvata - ANOVA

Conf. univ. dr. Mihaela Covrig

Analiza dispersionala (ANOVA) - Problema rezolvata


Problema 1, pag. 147-149 din Teorie si practica econometrie, V. Voineagu, E, Titan, R.
Serban, S. Ghita, D. Todose, C. Boboc, D. Pele, Ed. Meteor Press, 2007, Bucuresti
Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer
tinerilor angajai de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n
studiu un numr de 20 de companii productoare de tehnologie de vrf i a nregistrat timpul
scurs de la angajarea iniial a unui salariat n firm pn la prima promovare a acestuia.
Firmele au fost grupate dup mrime, iar datele nregistrate sunt:
Mrimea firmelor
Mici
Medii
Mari

Numr de sptmni de la angajare pn la prima promovare


30; 26; 30; 32; 38; 24; 32; 28;
34; 32; 25; 36; 33
47; 41; 43; 48; 40; 49; 40.

Se cere s se determine, folosind testul F de analiz dispersional, dac variaia


timpului scurs pn la prima promovare este influenat semnificativ de mrimea firmei (nivel
de semnificatie 5%).
Rezolvare:
o Populatia statistica este multimea companiilor producatoare de tehnologie de varf.
o Unitatea statistica este o companie (firma).
o Caracteristicile urmarite sunt:
X

- variabila ce arata marimea unei firme;


- variabila nenumerica avand r=3 categorii sau variante: firme mici, firme mijlocii si
firme mari: aceste categorii ale variabilei X vor determina impartirea populatiei
statistice in r =3 grupe si anume:
Grupa 1 (grupa firmelor mici),
Grupa 2 (grupa firmelor mijlocii),
Grupa 3 (grupa firmelor mari);
- astfel, variabila X, marimea firmei, se mai numeste si factor de grupare.

si
Y

- variabila ce arata durata de timp, in saptamani, de la angajare la prima promovare a


unui salariat al unei firme producatoare de tehnologie de varf;
- variabila numerica de interes.

o Fie Y1 ~ N 1 , 12 variabila ce arata durata de timp, in saptamani, de la angajare la prima


promovare a unui salariat al unei firme mici Grupa 1, unde 1 este media variabilei la
nivelul intregii grupe.
Din Grupa 1 (grupa firmelor mici) se selecteaza un subesantion de volum n1 = 8 firme
pentru care se inregistreaza valorile variabilei Y1:
{ y1,1 = 30 , y1, 2 = 26 , y1, 3 = 30 , y1, 4 = 32 ,

y1, 5 = 38 , y 1, 6 = 24 , y1, 7 = 32 , y1, 8 = y1, n1 = 28 }


Media de selectie de grupa este y1 =

y1,1 + y1, 2 + ... + y1,n1

iar dispersia de selectie de grupa este


(y1,1 y1 )2 + (y1,2 y1 )2 + ... + y1,n1 y1
s12 =
n1 1

n1

)2

240
= 30 saptamani,
8

= 18,2857 .

Facultatea de Marketing, anul II, 2014-2015, ASE


Problema rezolvata - ANOVA

Conf. univ. dr. Mihaela Covrig

o Fie Y2 ~ N ( 2 , 22 ) variabila ce arata durata de timp, in saptamani, de la angajare la prima


promovare pentru un salariat al unei firme mijlocii Grupa 2, unde 2 este media
variabilei la nivelul intregii grupe.
Din Grupa 2 (grupa firmelor mijlocii) se selecteaza un subesantion de volum n 2 = 5 firme
pentru care se inregistreaza valorile variabilei Y2:
{ y 2 ,1 = 34 , y 2 , 2 = 32 , y 2 ,3 = 25, y 2 , 4 = 36 , y 2 ,5 = y 2 ,n2 = 33} .
y 2,1 + y 2, 2 + ... + y 2,n2

Media de selectie de grupa este y 2 =

n2

iar dispersia de selectie de grupa este


(y 2,1 y 2 )2 + (y 2,2 y 2 )2 + ... + y 2,n2 y 2
2
s2 =
n2 1

)2

160
= 32 saptamani,
5

= 17,5 .

o Fie Y3 ~ N 3 , 32 variabila ce arata durata de timp, in saptamani, de la angajare la prima


promovarepentru un salariat al unei firme mari Grupa 3, unde 3 este media variabilei
la nivelul intregii grupe.
Din Grupa 3 (grupa firmelor mari) se selecteaza un subesantion de volum n3 = 7 firme
pentru care se inregistreaza valorile variabilei Y3:
{ y3,1 = 47, y3,2 = 41, y3,3 = 43, y3,4 = 48, y3,5 = 40, y3,6 = 49, y3,7 = y3,n2 = 40 } .
y 3,1 + y 3, 2 + ... + y 3,n3

Media de selectie de grupa este y 3 =

n3

iar dispersia de selectie de grupa este


(y3,1 y3 )2 + (y3,2 y3 )2 + ... + y3,n3 y3
2
s3 =
n3 1

308
= 44 saptamani,
7

= 15,3333 .

o Media totala la nivelul intregului esantion de volum n = n1 + n2 + n3 = 20 firme este


y n + y 2 n2 + y 3 n3 30 8 + 32 5 + 44 7
y= 1 1
=
n1 + n2 + n3
20
y = 35,4 saptamani.

Presupunem ca dispersiile celor trei grupe sunt egale, 12 = 22 = 32 .

o Ipotezele statistice sunt:


H 0 : 1 = 2 = 3 (factorul de grupare marimea companiei nu influenteaza semnificativ
variatia duratei de timp pana la prima promovare a unui salariat)
H 1 : k , l {1,2,3}, k l astfel incat k l (cel putin doua medii sunt semnificativ
diferite, adica factorul de grupare marimea companiei influenteaza
semnificativ variatia duratei de timp pana la prima promovare a unui
salariat)

Facultatea de Marketing, anul II, 2014-2015, ASE


Problema rezolvata - ANOVA

Conf. univ. dr. Mihaela Covrig

o Statistica testului este


SSB
MSB
F=
= r 1 Fisher(r 1= 2, n r =17 ) .
MSW SSW
nr

o Pe baza datelor de selectie calculam:


Variatia dintre grupe
SSB = ( y1 y )2 n1 + ( y 2 y )2 n2 + ( y 3 y )2 n3 =

= (30 35,4 )2 8 + (32 35,4 )2 5 + (44 35,4)2 7


SSB = 808,8
Variatia din interiorul grupelor
SSW = (n1 1) s12 + (n2 1) s 22 + (n3 1) s32

= (8 1) 18,2857 + (5 1) 17,5 + (7 1) 15,3333


SSW = 290
Variatia totala
SST = SSB + SSW

= 808,8 + 290
SST = 1098,8
Dispersia factoriala corectata (cu gradele de libertate r 1 = 2 )
SSB 808,8
MSB =
=
r 1
2
MSB = 404,4
Dispersia reziduala corectata (cu gradele de libertate n r = 17 )
SSW 290
MSW =
=
nr
17
MSW = 17,0588
Valoarea calculata a statisticii testului este
MSB
404,4
Fcalc =
=
MSW 17,0588
Fcalc = 23,7062

o Nivelul de semnificatie al testului este = 0,05 ,


iar valoarea critica a testului este Fcritic = F ; r 1, nr = F0,05; 2,17 = 3,59 ,
deci regiunea critica este Rc = (Fcritic ;+ ) = (3,59; + ) .
Observatie: Valoarea critica a testului Fisher se poate obtine in excel 2010 astfel:
Fcritic = F; r-1,n-r = F.INV.RT(, r-1, n-r)
o Cum Fcalc > Fcritic Fcalc Rc , respingem ipoteza nula H0 si acceptam ipoteza
alternativa H1, concluzionand ca la un nivel de semnificatie de 5% si pe baza acestor date
de selectie, marimea companiei influenteaza semnificativ variatia duratei de timp pana la
prima promovare pentru un salariat.

Facultatea de Marketing, anul II, 2014-2015, ASE


Problema rezolvata - ANOVA

Conf. univ. dr. Mihaela Covrig

Fig.1. Regiunea critica a testului F

o Calculele pot fi organizate in urmatorul tabel ANOVA


Source
of variation
(Sursa variatiei)

SS
(sum
of squares
(suma
patratelor)

df degrees
of freedom
(gradele de
libertate)

Between groups
(Factorul
de grupare X)

SSB = 404,4

r-1 = 3

Within Groups
(Reziduala)

SSW = 290

n-r = 17

SST=SSB+SSW
= 1098,8

n-1 = 19

Total

MS mean of
sum
of squares
(dispersiile
corectate)
SSB
MSB =
r 1
= 404,4
SSW
MSW =
nr
=17,0588

Fcritic

MSB
MSW
=23,0762

Fcritic=F0,05; 2, 17
=3,59

Fcalc =

Facultatea de Marketing, anul II, 2014-2015, ASE


Problema rezolvata - ANOVA

Conf. univ. dr. Mihaela Covrig

Problema poate fi rezolvata in Excel dupa cum urmeaza:


 Intr-o foaie de lucru se introduc datele din cele trei subesantioane pe coloane, asa cum
se arata in Figura 1;
 In Excel 2003, din meniul principal Tools, submeniul Data Analysis, se alege Anova:
Single Factor;
 In Excel 2007, din meniul principal Data, submeniul Data Analysis, se alege Anova:
Single Factor;

Figura 1. Introducerea datelor si alegerea Anova: Single Factor


din submeniul Data Analysis.

 Fereastra de dialog este prezentata in Figura 2.

Figura 2. Fereastra de dialog pentru Anova: Single Factor.


5

Facultatea de Marketing, anul II, 2014-2015, ASE


Problema rezolvata - ANOVA

Conf. univ. dr. Mihaela Covrig

 Output-ul consta din doua tabele: primul contine rezultatele obtinute in urma
prelucrarii datelor din fiecare grupa, iar cel de-al doilea este tabelul ANOVA.
Anova: Single Factor
SUMMARY
Groups

Count ( ni )

Sum

Average ( y i )

Variance ( si )

30 = y1

18.2857 = s1

32 = y 2

17.5 = s 2

44 = y 3

15.3333 = s3

Grupa 1
(firme mici)

8 = n1

240 =

Grupa 2
(firme mijlocii)

5 = n2

160 =

Grupa 3
(firme mari)

7 = n3

308 =

y1 j
j =1

y2 j
j =1

y3 j

j =1

ANOVA
Source of
Variation
Between Groups
Within Groups

Total

SS

df

MS

808.8=SSB

2=r-1

404.4=MSB

290=SSW

17=n-r

17.0588=MSW

1098.8=SST

19=n-1

P-value

23.7062=Fcalc

1.21E-05

F crit
3.59

Observatii:
P-value, adica nivelul de semnificatie observat sau calculat, este cel mai mic nivel fixat de
semnificatie al testului pentru care ipoteza nula H 0 poate fi respinsa, adica aria subsgraficului
densitatii repartitiei Fisher la dreapta lui Fcalc, vezi, Figura 1
Daca este nivelul sau pragul de semnificatie al testului, atunci regula de decizie este:
daca P-value > , adica Fcalc < Fcritic,
atunci nu exista suficiente motive sa
respingen ipoteza nula H0, adica factorul
de grupare nu influenteaza semnificativ
variatia variabilei numerice de interes;
daca P-value < , adica Fcalc > Fcritic,
atunci se respinge ipoteza nula H0 si,
prin urmare, se accepta ipoteza
alternativa H1, adica rezultatul este
semnificativ statistic, ceea ce inseamna
ca factorul de grupare influenteaza
semnificativ variatia lui Y.
In cazul nostru, nivelul de semnificatie al testului este =0,05,
iar P-value = 1,21E-5 = 1,21 x 10-5 = 0,0000121,
deci P-value < , prin urmare respingem H0 si acceptam H1.
6

Facultatea de Marketing, anul II, 2014-2015, ASE


Problema rezolvata - ANOVA

Conf. univ. dr. Mihaela Covrig

Observatii:
In Excel 2007, submeniul Data Analysis se instaleaza astfel:
- intr-o foie obisnuita de lucru, dati click pe Office Button (cerculetul stanga sus)
- click pe Excel Options
- apoi click pe Add Ins
- selectati cu un singur click Analisys Toolpack din partea deapta a ferestrei de la Add Ins
si apoi click GO
- apare o noua fereastra in care bifati Analysis ToolPack si de asemenea Analysis
ToolPack VBA, iar apoi click pe OK
- se instaleaza aceasta optiune si va aparea ca submeniul Data Analysis din meniul principal
Data.
In Excel 2003, submeniul Data Analysis se instaleaza astfel:
- intr-o foie obisnuita de lucru, din meniul principal Tools, alegeti Add Ins
- apare o fereastra in care bifati Analysis ToolPack si de asemenea Analysis ToolPack
VBA, iar apoi click pe OK
- se instaleaza aceasta optiune si va aparea ca submeniul Data Analysis din meniul principal
Tools.

Вам также может понравиться