Вы находитесь на странице: 1из 47

1

Analisis
Varian
(ANOVA)
Definisi

Analisis Varian (ANOVA)
Analisis Varian adalah suatu ujian statistik
untuk membandingkan min bagi lebih dua
kumpulan dalam satu atau lebih
pembolehubah tak bersandar ( faktor).
Analisis varians kadang-kadang disebut
sebagai Ujian F (F-Test) .
Definisi

Analisis Varian (ANOVA)
Dalam ujian ANOVA setiap data mestilah
mempunyai sekurang-kurangnya dua skor iaitu
skor untuk faktor dan skor untuk pembolehubah
bersandar.(dependent variable).
Faktor membahagikan individu kepada dua atau
lebih aras, manakala pembolehubah bersandar
akan membezakan individu dalam satu dimensi
tertentu.
contoh
Untuk menentukan keberkesanan tiga kaedah
mengajar sains.
Kaedah mengajar sains pemboleh ubah tak
bersandar ( faktor).
Ketiga tiga kaedah mengajar sains dipanggil
aras atau rawatan. (treatment).
Skor selepas ujian pembolehubah bersandar


Kaedah 1 Kaedah 2 Kaedah 3
Pelajar 1
skor skor

skor

Pelajar 2
skor

skor

skor




Apa yang ANOVA terangkan pada
kita?
Hipotesis Nol:
- Seperti ujian -T, ANOVA menguji hipotesis
nol iaitu min bagi beberapa kumpulan adalah
sama.
Hipotesis alternatif:
- Sekurang-kurangnya satu min adalah berbeza.

Kaedah ANOVA menggunakan
taburan-F.
1. Taburan-F tidak bersimetri; ia
condong (skewed) ke kanan.
2.Nilai nilai bagi F boleh jadi 0 atau
positif, ia tidak boleh negatif.
3.Terdapat perbezaan bentuk graf
taburan-F bergantung kepada darjah
kebebasan bagi pengangka dan
penyebut.
Konsep Hala dalam ANOVA
ANOVA sehala kajian yang menggunakan
satu faktor sahaja atau satu pembolehubah
tak bersandar.
ANOVA dua hala kajian yang menggunakan
dua faktor tak bersandar .
ANOVA tiga hala kajian yang mempunyai
tiga faktor untuk dikaji bagi mencari
perbezaan minnya.
ANOVA SATU HALA-Andaian
Pemerhatian adalah diambil dari
populasi bertaburan normal.
Pemerhatian mewakili sampel rawak
dari populasi.
Varian populasi adalah normal.
Sampel berbeza diambil dari populasi
yang dikategorikan sebagai satu hala.





ANOVA - Hipotesis
H
0
:
1
=
2
=
3
= =
k

(min bagi beberapa kumpulan adalah sama)

H
1
: Sekurang-kurangnya satu min
adalah berbeza dari yang lain.


Peraturan ujian

(Jika menggunakan nilai p ):
Jika nilai P s o, tolak hipotesis nol.
Jika nilai P > o , Tidak menolak hipotesis
nol.
Tolak H
0
jika F
kira
> F
jadual
(jika menggunakan taburan-F)

Menguji hipotesis menggunakan ANOVA
satu hala adalah dilakukan dengan
memisahkan jumlah varian bagi data
kepada dua varian berikut:
1. Varian yang dihasilkan oleh rawatan (lajur)
SS(Treatment)(SSB)- jumlah kuasa dua
rawatan
2. Ralat varian, atau bahagian dari jumlah
varian yang tidak dapat diterangkan oleh
rawatan. SSE (SSW)- jumlah kuasa dua
ralat
ANOVA Formula Pengiraan
Ujian statistik bagi ANOVA satu hala
F =
varian antara sampel ( SSB )/ DF
varian dalam sampel(SSW)/DF
Nilai kritikal bagi F
Darjah kebebasan bagi bilangan k sampel
dengan saiz sampel n yang sama.
Pengangka ( numerator) df = k -1
penyebut(denominator) df = k(n -1)

Pengiraan menggunakan saiz sampel yang
berbeza

F = =
Varian dalam sampel

Varian antara sampel

En
i
(x
i
- x)
2
k -1
E(n
i
- 1)s
i
E(n
i
- 1)
Di mana x = min keseluruhan
k = bilangan paras rawatan
n
i
= bilangan pemerhatian di dalam paras rawatan
x
i
= min kumpulan dalam paras rawatan
s
i
= nilai varian dalam paras rawatan.
2
2
Komponen utama bagi kaedah
ANOVA
Dalam ANOVA satu hala,SS(treatment) ialah jumlah
kuasa dua rawatan di kenali juga sebagai SS(factor).
Oleh kerana ia adalah ukuran variasi antara min sampel ia
juga di sebut sebagai SST atau SSB
SST/SS= n
1
(x
1
- x)
2
+ n
2
(x
2
- x)
2
+ .. n
k
(x
k
- x)
2

= En
i
(x
i
- x)
2
Komponen utama bagi kaedah
ANOVA
SS(error) atau jumlah kuasa dua ralat adalah variasi
di dalam sampel bagi suatu populasi.Ia dikenali sebagai
SSW atau SSE

SSE/SSW = (n
1
-1)s
1

+ (n
2
-1)s
2

+ (n
3
-1)s
3
. . . n
k
(x
k
-1)s
i

= E(n
i
- 1)s
i
2
2
2
2
2
Komponen utama bagi kaedah
ANOVA
SS(total) = SS(treatment) + SS(error)


Jumlah kuasa dua = Jumlah kuasadua rawatan
+
Jumlah kuasa dua ralat
SS(total) = SST + SSE
atau
SS(total) = SSB + SSW
Komponen utama bagi kaedah
ANOVA
( )


=
N
X
X
2
2
SS(Total)
( )
N
X
n
T
i
2
2

= SSB
B SS ) Total ( SS W SS =
Di mana :

N - Jumlah keseluruhan pemerhatian .
T
i
- Jumlah pemerhatian pada setiap paras rawatan.
n - bilangan pemerhatian pada setiap paras rawatan.
Kuasadua min (MS)
MST =
SST
k - 1
MST adalah kuasadua min bagi
rawatan , didapati seperti berikut:
Kuasadua min (MS)
MSE adalah kuasadua min bagi ralat
diperolehi menggunkan rumus:
MS (total) =
SS (total)
N - 1
MSE =
SSE
N - k
F =
Ujian Statistik bagi ANOVA dengan
saiz sampel berbeza.
Pengangka /Numerator df = k -1
Penyebut/Denominator df = N - k
MST
MSE
Jadual ANOVA
Source of Sum Of Degree of Mean Squares
Variation Squares Freedom
Treatments SST k 1 MST = SST/(k-1)

Error SSE N k MSE =SSE/(N-k)

Total SS(Total) N-1


Contoh 1
Jadual ini menunjukkan jumlah tahunan yang dibelanjakan untuk
membaca (dalam $) bagi sampel rawak daripada pelanggan Amerika dari
empat daerah. Pada o = 0.10, bolehkah anda membuat kesimpulan
bahawa purata tahunan yang dibelanjakan adalah berbeza?
West
223
184
221
269
199
171
South
103
143
164
119
99
Midwest
246
169
246
158
167
76
214
Northeast
308
58
141
109
220
144
316 108
204
1. Tuliskan hipotesis nol dan hipotesis alternatif
H
0
:
1
=
2
=
3
=
4
( semua min populasi adalah sama.)
H
1
: Sekurang-kurangnya satu daripada min adalah
berbeza.
3. Tentukan taburan bagi sampel
Taburan F dengan d.f.
N
= k 1= 4 1= 3,
d.f.
D
= N k = 27 - 4 =23
4. Carikan nilai genting
(find the critical value)
2. Nyatakan paras keertian
o= 0.10
F
3,23
= 2.53
6. Kirakan statistik ujian.

MSE
MST
F =
West
223
184
221
269
199
171
South
103
143
164
119
99
Midwest
246
169
246
158
167
76 214
Northeast
308
58
141
109
220
144
316 108 204
185.14
9839.48
177.00
4049.6
135.71
1741.24
210.14
1020.81
177
27
4779
= = x
Kirakan min dan varian bagi setiap sampel.
=
=
2
s
x
Kirakan min keseluruhan.
x
33 . 6695
3
20086
1
= =

=
k
SST
MST
20086
( )
2
x x n SST
i i
E =
min n

1 185.14 7 66.26 463.8
2 177.00 6 0.00 0.0
3 135.71 7 1704.86 11934.0
4 210.14 7 1098.26 7687.8

( )
2
x x
i
( )
2
x x n
i i



( )
2
1
i i
s n SSE E =
n s
2


1 7 9839.48 59036.9
2 6 4049.60 20248.0
3 7 1741.24 10447.4
4 7 1020.81 6124.9
( )
2
1
i i
s n
95823.2
23 . 4166
4 27
2 . 95823
=

=

=
k N
SSE
MSE
669 . 1
23 . 4166
33 . 6955
= = F
7. Nyatakan keputusan anda
8. Tafsirkan jawapan anda
0.10
0 1 2 3 4 5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Disebabkan F
calc
= 1.669 lebih kecil dpd F
table
= 2.53,
atau tidak terletak pada rantau tolakkan,
gagal untuk menolak hipotesis nol..
Tidak cukup bukti untuk menyatakan min adalah
berbeza.Perbelanjaan untuk membaca bagi keempat
empat daerah adalah sama.
2.53
Output minitab
Analisis varian satu hala

Analysis of Variance
Source DF SS MS F P
Factor 3 20085 6695 1.61 0.215
Error 23 95857 4168
Total 26 115942
Using the P value method, fail to reject the null
hypothesis since 0.215 > 0.10.





Contoh 2
Jadual ini menunjukkan jumlah jualan
mingguan jus mangga di empat buah negeri.
Pada o = 0.05, bolehkah anda membuat
kesimpulan bahawa purata jualan mingguan
berbeza mengikut kemudahan,kualiti ,rasa
dan harga mangga ?



Melaka Ipoh Kuantan
(kualiti) (Rasa) (Harga)
15 10 13 20
17 12 19 18
22 15 18 16
20 17 16 19
18 12 17 21
16 13 16 16
14 15 15 15
19 16 18 23
Johor Bahru
(kemudahan)
H
0
:
1
=
2
=
3
=
4
H
1
:sekurang-kurangnya
satu min adalah berbeza
dari yang lain.
Df
N
= k 1 = 4 1 = 3

Df
D
= N k = 32 - 4 = 28


2.95
28 , 3 , 05 . 0
= F
15 10 13 20
17 12 19 18
22 15 18 16
20 17 16 19
18 12 17 21
16 13 16 16
14 15 15 15
19 16 18 23
Ti: 141 110 132 148 =531
ni: 8 8 8 8 N=32
17.63 13.75 16.5 18.5 =16.59

X
X
i
X
Ti:
T
1
= 141 T
2
= 110 T
3
= 132 T
4
= 148
=531
ni:
n
1
= 8 n
2
= 8 n
3
= 8 n
4
= 8
N=32
=17.63 =13.75 =16.5 =18.5 =16.59

X
i
X
2
X
3
X
4
X
1
X
X
( )
2
x x n SST
i i
E =
= 8[ (17.63 16.59)
2
+ (13.75 16.59)
2

+ (16.50 16.59)
2
+ (18.50 16.59)
2
]
= (8.508 + 64.695 + 0.070 + 29.070)
= 102.344
SSE= [(15 17.63)
2
+ (17 17.63)
2
+ (19 17.63)
2

+ (10 13.75)
2
+ 12 13.75)
2
+ + (16 13.75)
2

+ (13 16.50)
2
+ (19 16.50)
2
+ + (18 16.50)
2

+ (20 18.50)
2
+ (18 18.50)
2
+ + (23 18.50)
2
]
( )
2
1
i i
s n SSE E =
= 169.375

( )

= =
=
i
n
i
C
1
2
1 j
j ij
X - X SSE
34.115
3
102.344
df
SST
MST
N
= = =
049 . 6 = = =
28
169.375
df
SSE
MSE
D
5.604
6.049
34.115
MSE
MST
F = = =
SS(Total) = SST + SSE
= 102.344 + 169.375
= 271.719
Jadual ANOVA
Sumber
Varian
df SS MS F
Rawatan 3 102.344 34.12 5.604
Ralat 28 169.375 6.049
Jumlah 31 271.179
Jadual F untuk o = 0.05
v
1
v
2
1 2 3 4 5 6 7 8 9
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21
Darjah Kebebasan Numerator
2.95
28 , 3 , 05 . 0
= F
ANOVA: langkah penyelesaian
. H tolak > F ika o
table
cal F
, 95 . 2 = J
. H tolak
> 5.604 = F kerana Oleh
o
table
F
, 95 . 2 =
Kesimpulan : purata jualan mingguan
berbeza mengikut kemudahan,kualiti ,rasa
dan harga .
Output Excel
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Johor Bahru 8 141 17.625 7.125
Melaka 8 110 13.750 5.643
Ipoh 8 132 16.500 3.714
Kuantan 8 148 18.500 7.714
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 102.3438 3 34.115 5.640 0.004 2.947
Within Groups 169.375 28 6.049
Total 271.7188 31
Contoh 3
Sebuah rantaian pasaraya sedang mempertimbangkan
untuk membina pasaraya baru pada empat kawasan
perumahan yang berbeza. Salah satu daripada
faktor yang penting didalam membuat keputusan
ialah purata pendapatan tahunan penduduk empat
kawasan tersebut. Katakan, didalam kajian awal
beberapa isirumah telah disoal apakah jumlah
pendapatan tahunan mereka. Keputusan daripada
survei tersebut ditunjukkan didalam jadual dibawah.
Adakah terdapat bukti yang mencukupi untuk
menyatakan ujudnya perbezaan didalam purata
pendapatan tahunan penduduk diantara empat
kawasan tersebut? Gunakan o = 0.01.

Kawasan 1 Kawasan 2 Kawasan 3 Kawasan 4
25 32 27 18
27 35 32 23
31 30 48 29
17 46 25 26
29 32 20 42
30 22 12
19 18
51
27
Jawapan:
Hipotesis


Ujian statistik


Nilai o

Peraturan Keputusan





H
0
:
1
=
2
=
3

H
1
: Sekurang-kurangnya satu min adalah berbeza dari
yang lain.
N
df
SST
MST =
D
df
SSE
MSE =
MSE
MST
F =
o = 0.01
Rawatan (numerator, df
N
) = 4 1 = 3
Ralat (denominator, df
D
) = 27 4 = 23
Tolak Ho jika F
calc
> F
table
= 4.76


Nilai Ujian statistik







4.76
23 , 3 , 01 . 0
= F
T
1
= 159

T
2
= 294

T
3
= 182

T
4
= 138

T = 773

n
1
= 6

n
2
= 9

n
3
= 7

n
4
= 5

N = 27


500 . 26 X
1
= 32.667 X
2
=
26.000 X
3
=
27.600 X
4
= 28.630 = X
SST = 6(256.500-28.630)
2
+ 9(32.667-28.630)
2
+ 7(26.000-
28.630)
2
+ 5(27.600-28.630)
2

= 27.212 + 146.679 + 48.405 + 5.301 = 227.596
SSE = (25.000-26.500)
2
+ (27.000-26.500)
2
+ + (30.000
26.500)
2
+ (32.000 32.667)
2
+(15.000 32.667)
2
+ + (27.000
32.667)
2
+ (27.000 26.000)
2
+ (32.000 26.000)
2
+ + (18.000
26.000)
2
+ (18.000 28.630)
2
+ (23.000 28.630)
2
+ + (42.000
28.630)
2
= 2134.700
SS(Total) = SST + SSE
= 227.596 + 2134.700 = 2362.296
Kesimpulan
Keputusannya ialah tidak dapat menolak hipotesis nol
kerana nilai F yang dikira lebih kecil daripada nilai jadual
kritikal F= 4.76. Oleh itu, tidak terdapat bukti yang
mencukupi untuk menyatakan purata pendapatan tahunan
berbeza diantara empat kawasan. Pengurus rantaian pasaraya
dinasihatkan supaya tidak mempertimbangkan pendapatan isi
rumah sebagai faktor untuk membuat keputusan berkaitan
lokasi pasaraya baru.

Sumber variasi SS df MS F
Rawatan 227.596 3 75.865 0.817
Ralat 2134.700 23 92.813
Jumlah 2362.296 26
Output Komputer Excel
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Kawasan 1 6 159 26.50 26.30
Kawasan 2 8 267 33.38 117.70
Kawasan 3 7 182 26.00 136.33
Kawasan 4 5 138 27.60 81.30
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 261 3 86.988 0.912 0.451 3.049
Within Groups 2099 22 95.390
Total 2360 25
Tutorial

Вам также может понравиться