You are on page 1of 32

ANALISIS DESKRIPTIF

PENGENALAN
Analisis deskriptif boleh dilakukan sama ada kajian itu menggunakan kaedah kulitatif dan
kuantitatif. Biasanya, analisis deskriptif dilakukan pada bahagian awal dalam bab analisis data
iaitu sebelum perbincangan berdasarkan analisis statistik dibuat. Beberapa analisis deskriptif
yang sering digunakan adalah seperti taburan kekerapan dan persembahan grafik, serta ukuran
berangka iaitu min, mod dan median.

JENIS-JENIS STATISTIK
Kita mungkin sukar untuk membuat keputusan secara persendirian, terutamanya masalah yang
berkaitan dengan ekonomi atau perniagaan. Oleh sebab itu kita memerlukan satu pendekatan
yang lebih efisyen bagi membantu mereka membuat keputusan dengan lebih cekap. Salah satu
pendekatan yang dapat membantu membuat keputusan adalah dengan menggunakan
pendekatan statistik. Statistik digunakan secara meluas terutamanya dalam program-program
yang ditawarkan oleh universiti ataupun kolej seperti program ekonomi, pengurusan,
pendidikan dan sebagainya. Cuma yang membezakan statistik bagi setiap program ialah
contoh-contoh yang digunakan. Pendekatan statistik dapat membantu individu membuat
sebarang keputusan dalam kehidupan terhadap kebajikan peribadi individu. Sebagai contoh,
syarikat-syarikat insurans menggunakan analisis statistik untuk menetapkan kadar insurans
terhadap rumah, kenderaan, kehidupan dan juga insuran kesihatan. Seorang penyelidik pula
perlu mempunyai pengetahuan terhadap penggunaan statistik bagi mengurus, menganalisis, dan
membentangkan maklumat atau data.
Statistik merujuk kepada maklumat berangka. Statistik didefinisikan sebagai sains
pengumpulan, penyusunan, pelaporan, persembahan, penganalisaan dan penterjemahan angka-
angka data bagi membantu dalam membuat keputusan yang efektif.
Secara umum, terdapat dua jenis statistik, iaitu statistik perihalan dan statistik
penakbiran. Statistik perihalan adalah kaedah-kaedah yang digunakan untuk menyusun,
meringkaskan dan mempersembah data yang dikumpul supaya memberi maklumat yang mudah
difahami. Ia termasuk kaedah membina graf, carta dan jadual serta beberapa ukuran keperihalan
seperti purata dan ukuran serakan seperti persentil.
Statistik pentakbiran (inferen) pula melibatkan teknik menganalisis, mentafsir dan
membuat kesimpulan (generalisasi) tentang populasi berdasarkan sampel (sebahagian yang
dipilih daripada populasi). Misalnya, satu rangkaian televisyen ingin mengetahui sejauh mana
penonton menggemari rancangan yang ditayangkan. Satu sampel terdiri daripada 800 penonton
1

di waktu perdana diambil dan mendapati 320 responden ataupun 30% menunjukkan rancangan
yang ditonton ialah "CSI: Crime Scene Investigation". Kajian ini diperlukan bagi memutuskan
sama ada rancangan ini perlu diteruskan tayangan ataupun diberhentikan sahaja. Oleh sebab
statistik tersebut berkaitan sesuatu populasi berdasarkan data sampel, maka ianya boleh
dikategorikan sebagai statistik inferen iaitu kaedah yang digunakan bagi menganggar ciri-ciri
populasi berdasarkan sampel.


Kebarangkalian Taburan Normal

Terdapat beberapa ciri bagi kebarangkalian taburan normal. Di antara ciri- ciri taburan normal
ialah ia berbentuk loceng dan mempunyai satu puncak. Min (mean), median dan mod adalah
sama dan terletak di tengah- tengah rajah. Bentuk keluk bagi taburan normal adalah simetri
iaitu kawasan kanan adalah sama dengan kawasan kiri. Keluk kebarangkalian taburan normal
adalah berbentuk asimptot kerana keluknya tidak memotong paksi-X tetapi semakin
menghampiri paksi-X. Kedudukan kebarangkalian taburan normal ditunjukkan dengan min,
dan sisihan piawai, ditunjukkan seperti berikut:














Taburan normal piawai adalah taburan normal dengan min sifar dan sisihan piawai ialah
1.
Ia juga dipanggil taburan z.
Nilai-z ialah jarak antara nilai yang dipilih, katakan X, dan min populasi , dibahagikan
dengan sisihan piawai populasi, .
Formula taburan z adalah seperti berikut:

X
z

=

Menggunakan taburan sampel bagi min sampel

J ika populasi adalah bertaburan normal, taburan persampelan bagi min populasi juga akan
mengikut taburan normal. Untuk menentukan kebarangkalian min sampel adalah terletak di
kawasan tersebut, kita gunakan formula berikut;
Ekor
kiri
Ekor
kanan
Min =median =mod
2

n

z

=
_


Sebaliknya, jika populasi tidak bertaburan normal, tetapi bilangan sampel sekurang-kurangnya
30 cerapan, maka min populasi adalah dianggap bertaburan normal. Untuk menentukan min
sampel terletak di kawasan taburan normal, kita gunakan formula berikut;

n s

t

=
_


Rajah di bawah menunjukkan syarat-syarat bagaimana kita boleh menggunakan taburan z dan
taburan t apabila populasi diandaikan bertaburan normal.

Rajah 1: Syarat-syarat menggunakan taburan z dan taburan t



UKURAN KECENDERUNGAN MEMUSAT
a) Min

Kaedah min iaitu mencari nilai purata daripada nilai yang telah diberikan merupakan kaedah
yang kerap digunakan dalam penyelidikan. Formula bagi min adalah seperti berikut;

Andaian populasi adalah
bertaburan normal
Adakah bilangan sampel 30
atau lebih?
Guna ujian bukan
parametrik
Guna taburan z
Adakah sisihan piawai
populasi diketahui?
Guna taburan t Guna taburan z
Tidak Tidak Ya Ya
Tidak Ya
3

=
X
X
_


yang mana, X-bar ialah simbol bagi min, sigma () simbol untuk penjumlahan, X ialah simbol
untuk skor (data) dan N ialah simbol untuk jumlah keseluruhan skor.
Formula ini digunakan bagi mendapatkan purata jumlah nilai yang diberikan atau digunakan
untuk mendapatkan jumlah min.


b) Median

Median atau penengah ialah satu nilai yang berada di tengah-tengah sesuatu data yang telah
disusun sama ada menaik ataupun menurun. Nilai median akan membahagikan data kepada dua
bahagian. Median sering digunakan apabila kita memerlukan penilaian lokasi yang tidak
dipengaruhi dengan nilai item yang tinggi atau rendah serta untuk menilai perubahan dalam
taburan perbezaan set yang menukarkan arah yang sama dalam ragam yang sama. Median juga
digunakan sebagai purata bagi menguji kebolehan-kebolehan umum. Misalnya, kepandaian,
markah ujian, dan peperiksaan. Fungsi lain bagi median diperoleh dalam penilaian perubahan
kos hidup, apabila harga kebanyakan barangan bagi perbelanjaan am hampir di semua negara
terkumpul dan diringkaskan kepada suatu rajah tunggal.
Median merujuk kepada nilai pertengahan bagi suatu set data yang disusun mengikut
tertib menaik atau menurun. Median berbeza daripada min melalui 2 kaedah iaitu median boleh
digunakan dengan pembolehubah skala ordinal, selang, dan nisbah. Median boleh dikira bagi
kedua-dua data terkumpul dan tidak terkumpul.

i. Median bagi data tak terkumpul

a) Bilangan data adalah ganjil. Sekiranya set nilai n pembolehubah Xi, X1, X2,...., Xn,
di mana n adalah ganjil disusun dalam tertib menaik atau menurun, nilai median
diberikan dengan:

Median bagi data tidak terkumpul (n ganjil) adalah seperti formula berikut;

2 / ) 1 ( nilai Median + = n X

Contohnya, sekiranya Xi mewakili bilangan isi rumah bagi 7 buah keluarga dan
mengambil nilai seperti berikut:


X1 X2 X3 X4 X5 X6 X7
2 2 4 4 6 6 8

yang mana, n = 7 dan (n +1)/2 =8/2 = 4. Oleh itu, X (n +1)/ 2 =X4 iaitu
median = 4. Kesimpulannya, median bagi bilangan orang dalam 7 buah
keluarga ini ialah 4.

4

b) Bilangan data adalah genap. Sekiranya set nilai n bagi pembolehubah Xi, X1,
X2,...., Xn, di mana n adalah genap disusun dalam tertib menaik atau menurun.

Median bagi data tidak terkumpul (n genap) adalah seperti formula berikut;

2
1 2 / 2 /
Median
+ +
=
n X n X


Contohnya, sekiranya Xi mewakili bilangan isi rumah bagi 8 buah keluarga dan
mengambil nilai seperti berikut:

X1 X2 X3 X4 X5 X6 X7 X8
2 2 4 4 6 6 8 10

yang mana, n = 8 dan n/2 =4 dan n/2 +1 =4 +1 =5. Oleh itu, Xn/2 =pada
X4 dan Xn/2 +1 =pada X5. Maka, median terletak di antara bilangan isi
rumah yang ke-4 ( X4) dan bilangan isi rumah yang ke-5 (X5).

5
2
10
2
6 4
Median = =
+
=


Kesimpulannya, median bagi bilangan orang dalam isi rumah kesemua 8
keluarga ialah 5.



ii. Median bagi data terkumpul
Median bagi data terkumpul adalah lebih rumit berbanding data tidak terkumpul.
Langkah pertama adalah menyediakan jadual kekerapan kumulatif. Kebiasaannya, data
telah tersusun secara tertib menaik dalam kumpulan taburan kekerapan.

Misalnya, markah peperiksaan bagi 47 orang pelajar seperti di bawah:


Kelas Kekerapan
(% markah) (bilangan pelajar)

40 - 49

6
50 59

14
60 69

18
70 79

9

Dalam jadual di atas, median atau markah pertengahan adalah nilai bagi X (n +1) / 2 iaitu
5

nilai X(47 +1 )/2 =X47/2 =X24. Oleh itu, kita perlu meletakkan markah ke-24 dalam taburan
ini. Kita tahu bahawa terdapat 20 pelajar yang mendapat skor dalam dua kelas yang pertama.
Ia bermaksud bahawa 4 lagi skor diperlukan (24 20 =4) yang mesti diperoleh daripada 18
skor dalam kelas (60 - 69). Kelebaran kelas (60 - 69) ialah 10 (yang diperoleh daripada nilai
had bawah 59.5 kepada nilai had atas iaitu 69.5). J usteru, 4/9 10 perlu ditambah had bawah
kelas ini untuk mendapatkan skor ke-24. Ringkasnya,

Skor median =59.5 +4/9 10 = 59.5 + 2.22 =61.72

Formula untuk mendapatkan nilai tersebut adalah:

Median bagi data terkumpul menggunakan formula berikut;

Median =L +{(n +1)/2 fcum-1}w
f
L =had bawah kelas mempunyai median
fcum-1 =taburan kumulatif kelas mendahului kelas median
f =kekerapan kelas median
w =kelebaran kelas median
Contohnya, jika nilai-nilai data seperti berikut: 2, 12, 4, 11, 3, 7, 10, 5, 9, 6. Langkah seterusnya
yang perlu diambil adalah menyusun data-data tersebut dari nilai terendah ke nilai tertinggi.

2
3 4 5 6 7 9 10 11 12

2 3 4 5 6 7 9 10 11 12
Nilai median bagi contoh di atas adalah 6.5, iaitu dengan menggunakan formula ini:
5 . 6
2
7 6
Median =
+
=
Kebaikan Median:

1) Nilai yang terlalu tinggi atau rendah tidak mengubah nilai median sebagai mewakili
nilai purata.
2) Nilai median telah tersedia diperoleh, walaupun kita tidak mengetahui nilai untuk
kesemua item. Ia juga tidak dipengaruhi oleh selang kelas atau kelas secara terbuka.
3) Median adalah nilai yang sebenar melainkan yang melibatkan selang kelas yang mana
setiapnya mempunyai had atau batasan.
6

Kelemahan Median:

1) Median hanya memberikan satu nilai sahaja yang berada di tengah-tengah walaupun
item yang lain mungkin mempunyai nilai yang sama. Tetapi sekiranya bilangan item
adalah sedikit atau item tersebut diserakkan secara tidak tentu samada lebih atau kurang,
nilai median mungkin boleh hilang sebagai rajah yang diwakili.
2) Dalam siri secara berterusan, kumpulan data dalam kelas selang, nilai median hanya
boleh dianggarkan.

c) Mod
Mod ialah nilai yang paling kerap sekali diulang di dalam sesuatu data tertentu. Mod dapat
dikira sama ada daripada data kuantitatif dan data kualitatif. Kelebihan mod ialah ia tidak
dipengaruhi nilai ekstrim. Pengiraannya adalah sangat mudah dan ringkas untuk dihuraikan
iaitu dengan mengira kebanyakan nilai yang disertakan berulang-ulang kali. Tetapi kadang kala
kita mungkin mempunyai pengagihan ganjil di mana mungkin terdapat dua puncak. Walaupun
jika puncak itu tidak betul-betul pengagihannya, maka ia dipanggil dirujuk sebagai bimod
pengagihan.
Mod bagi frekuensi pembahagian adalah semata-mata titik tengah atau nama kelas
daripada kelas sukatan kekerapan. Kaedah mod digunakan untuk menjelaskan sebarang
pembahagian, tanpa mengambilkira sama ada sesuatu data itu adalah numerik atau
dikategorikan. Walau bagaimanapun, terdapat beberapa kelemahan bagi penggunaan kaedah
mod. Salah satunya mungkin terdapat lebih daripada satu kelas modal. Ia adalah sangat
mustahil untuk dua atau lebih sukatan kelas untuk menunjukkan frekuensinya yang bersamaan
antara satu sama lain dan mempunyai nilai yang tinggi daripada frekuensi yang ditunjukkan
oleh kelas-kelas yang lain. Dalam situasi ini, terdapat keraguan mengenai kategori kelas yang
boleh memberikan mod pembahagian, iaitu jenis dua atau lebih nilai atau jenis selang adalah
sangat popular. Adalah suatu yang bernasib baik kerana ia tidak berlaku secara kerap, walaupun
terdapat dua atau lebih lengkung di dalam graf pembahagian.
Titik tengah bagi selang mempunyai frekuensi yang tertinggi ataupun kebarangkalian
masih lagi diambil secara mod. Titik tengah adalah mana-mana selang kelas yang mempunyai
nilai yang berkemungkinan semakin menurun berbanding dengan nombor-nombor lain di
dalam selang. Tetapi di dalam sesetengah pembahagian, di mana pengukuran kelas adalah tidak
begitu jelas, mod tidak efektif sebagai karakter atau sifat untuk keseluruhan pembahagian.
Kelemahan seterusnya adalah mod sangat sensitif terhadap saiz dan nombor selang kelas yang
digunakan apabila sesuatu hal itu bersifat numerikal, iaitu nilai mod mungkin dibuat untuk
jump around dengan mengambil kira perubahan selang kelas untuk proses pembahagian.
Akhir sekali, mod bagi sampel pembahagian membentuk ketidakbergantungan sumber
maklumat yang tinggi tentang pembahagian kebarangkalian sampel mod. Atas sebab ini,
penggunaan kaedah mod akan mengehadkan keadaan, di mana (a) data adalah sebenarnya skala
nominal dalam persekitaran, atau (b) hanya kecenderungan memusat yang ringkas, mudah
dihitung sahaja diperlukan.


7

Rajah 2: Kedudukan relatif min, median dan mod bagi data berbentuk simetri.















Berdasarkan histogram di atas, taburan data berbentuk simetri dan berbentuk seperti bukit
menunjukkan taburan mempunyai saiz yang sama di kanan dan kiri. J ika poligon kekerapan di
sambungkan separuh, akan ada dua garis separuh. Bagi taburan yang simetri, nilai min, median
dan mod adalah sama di tengah-tengah histogram.
Contohnya, pada carta di atas nilai min, median dan mod adalah bersamaaan 20 tahun.
Nilai tertinggi ditunjukan oleh nilai mod (20 tahun) disebabkan taburan ini berbentuk simetri.
Oleh itu, nilai median juga akan ada pada taburan yang dipotong setengah (20 tahun). J umlah
kekerapan yang mewakili bilangan tahun yang banyak adalah mengimbangi nilai kekerapan
yang sedikit dan menghasilkan min aritmetik bersamaan 20 tahun. Secara logiknya, ketiga-tiga
nilai akan diwakilkan pada taburan ditengah-tengah histogram. J ika taburan data adalah tidak
simetri atau tidak kepecongan, maka hubungan antara ketiga-tiga nilai adalah berubah.

Rajah 3: Kedudukan relatif min, median dan mod bagi data berbentuk pencong ke kiri.

















8

J ika kepencongan negatif, nilai min adalah paling rendah antara ketiga-tiga nilai. Nilai min
dipengaruhi oleh beberapa nilai ekstrim data bawah. Nilai median lebih besar daripada nilai
min aritmetik serta nilai mod adalah lebih besar daripada ketiga-tiga ukuran. Berdasarkan carta
di atas, jika nilai kepencongan tinggi, maka nilai min tidak patut digunakan.


UKURAN SERAKAN

Ukuran kecenderungan memusat seperti min, mod dan median tidak dapat memberi gambaran
lengkap tentang taburan sesuatu set data. Dua set data yang nilai min adalah sama, mungkin
mempunyai bentuk taburan berbeza sekiranya variasi antara 2 set data adalah besar atau kecil.
Ukuran serakan dapat dibahagikan seperti berikut;


a) Julat

Perbezaan di antara nilai tertinggi dan nilai terendah dalam sesuatu set data.

J ulat = nilai tertinggi nilai terendah


Contoh:
Masa menunggu pelanggan di Hospital A paling lama 3 jam, dan paling cepat ialah jam.
Maka, julat masa menunggu di Hospital A ialah 3 0.5 jam =2 1/2 jam.



b) Varians

Varians ialah nilai sisihan piawai yang dikuasaduakan. Varians dapat membanding serakan dua
atau lebih set data. Nilai varians tidak negatif. Nilai varians akan bersamaan sifar jika semua
cerapan adalah sama.


N
X
2
2
) (
) ( populasi Varians


=

Contoh:

Bilangan pelanggan ke sebuah restoran pada 5 hari pertama dalam seminggu adalah seperti
berikut;

Hari :
Ahad Isnin Selasa Rabu Khamis
Bil. :
38 26 18 41 22


9


Kira nilai varians populasi. :

29
5
145
) ( populasi Min = =




8 . 80
) (
) ( populasi Varians
2
2
=

=
N
X


Sisihan piawai bagi sampel pula boleh dikira menggunakan formula berikut;

1
) (
) ( sampel Varians
2
2


=
n
X X
s

c) Sisihan piawai

Sisihan piawai menerangkan bagaimana cerapan dalam sesuatu set data tersebar di sekeliling
nilai min. Nilai sisihan piawai yang besar bermaksud serakan data yang lebih luas disekeliling
nilai min. Sisihan piawai diperolehi daripada punca kuasadua varians seperti berikut;

99 . 8
) (
) ( populasi piawai Sisihan
2
=

=
N
X



PENGANGGARAN DAN SELANG KEYAKINAN

Penganggar ialah statistik sampel yang digunakan untuk menganggar parameter populasi. Ada
dua jenis anggaran yang boleh digunakan untuk menganggar suatu populasi iaitu anggaran titik
dan anggaran selang.

a) Anggaran Titik
Penganggar titik adalah statistik yang dikira daripada maklumat sampel, yang mana ia
digunakan untuk menganggar parameter populasi. Min sampel ( x ) adalah penganggar terbaik
untuk menganggarkan min populasi ( ), asalkan taburan persampelan adalah taburan normal.
38 9 81
26 -3 9
18 -11 121
41 12 144
22 -7 49
145 0 404
10


n
x
x

=


Penganggar kepada sisihan piawai populasi, yang sering digunakan ialah sisihan piawai
sampel, s .Varians sampel (
2
s ) pula digunakan sebagai penganggar kepada varians populasi.

Varians sampel:
1
) (
2
2


=
n
x x
s

Sisihan piawai sampel, s

2
s =


b) Anggaran Selang

Anggaran selang ditunjukkan oleh satu julat nilai-nilai yang mana suatu parameter populasi
berkemungkinan besar akan berada pada satu kebarangkalian khusus yang telah ditetapkan.
Kebarangkalian khusus tersebut dipanggil aras keyakinan.

Faktor penentu kepada kelebaran satu selang keyakinan adalah:

1. Saiz sampel, n.
2. Perbezaan dalam populasi, biasanya penganggar bagi populasi, dianggarkan oleh
penganggar sampel s.
3. Aras keyakinan yang ditetapkan.

Saiz sampel yang besar kurang sesuai jika kita menggunakan Teorem Had Memusat. J adi,
untuk mengukur sebaran atau serakan data, kita boleh mengira menggunakan ralat piawai bagi
min (
x
);



n
x

=


c) Taburan Normal

Taburan kebarangkalian yang sangat penting ialah taburan normal. Kepentingan taburan normal
dalam statistik ialah ia mempunyai sifat yang mana inferens boleh dibuat melalui persampelan.
Bagi taburan kebarangkalian normal, jumlah luas kawasan dibawah keluk normal ialah
1.00, tak
tak kira apapun nilai sisihan piawai populasi, () dan min sampel ( ).

Sifat-sifat taburan normal;
a) Keluk normal adalah simetrik tentang min,
b) Kedudukan min adalah ditengah-tengah dan dibahagikan kepada dua bahagian yang
sama.
11

c) J umlah kawasan dibawah keluk normal adalah bersamaan dengan 1
d) Ia dapat ditentukan secara lengkap oleh min dan sisihan piawai, (atau varians,
2
)
sendiri.


Peraturan Empirikal:

Bagi taburan data yang berbentuk simetri;

a) 68% daripada semua cerapan berada dalam lingkungan 1 sisihan piawai daripada min,
ditulis

) 1 X , 1 - X ( s s +

b) 95% daripada semua cerapan berada dalam lingkungan 2 sisihan piawai daripada min,
ditulis

) 2 X , 2 - X ( s s +


c) 99.7% daripada semua cerapan berada dalam lingkungan 3 sisihan piawai daripada min,
ditulis;

) 3 X , 3 - X ( s s +



Contoh pengiraan sisihan piawai adalah seperti berikut;

Andaian;

Taburan pendapatan bagi 100 pekerja adalah simetri
Nilai min pendapatan RM583
Sisihan piawai RM133

68% drp pendapatan pekerja dlm lingkungan 1 sisihan piawai drp nilai min. Ini
bermakna kira-kira 68 daripada 100 pekerja mempunyai pendapatan antara RM450 dan
RM716.



95% drp pendapatan pekerja dlm lingkungan 2 sisihan piawai drp nilai min. Ini
bermakna kira-kira 95 daripada 100 pekerja mempunyai pendapatan antara RM317 dan
RM849.
) 716 , 450 ( ) 133 x 1 583 , 133 x 1 583 ( = +
12




99% drp pendapatan pekerja dlm lingkungan 3 sisihan piawai drp nilai min. Ini
bermakna kira-kira 99 daripada 100 pekerja mempunyai pendapatan antara RM184 dan
RM982



Rajah di bawah dapat menjelaskan peraturan empirikal bagi taburan frekuensi berbentuk simetri
dan berbentuk loceng. Kira-kira 68 peratus cerapan adalah dalam lingkungan 1 sisihan piawai
daripada min; Kira-kira 95 peratus cerapan adalah dalam lingkungan 2 sisihan piawai daripada
min; dan secara praktikalnya kira-kira 99.7 peratus cerapan adalah dalam lingkungan 3 sisihan
piawai daripada min.



Rajah 4 : Mengira selang keyakinan menggunakan statistik taburan t


















Contoh;

Sebuah syarikat pengeluar tayar ingin mengenalpasti jangka hayat sesebuah tayar keluaran
mereka. Satu sampel 10 buah tayar yang telah digunakan untuk pemanduan 50,000 batu
menunjukkan min sampel ialah 0.35 inci bunga tayar telah haus dengan sisihan piawai ialah
0.09. Bina 95 peratus selang keyakinan bagi min populasi. Adakah munasabah bagi pengeluar
tayar untuk merumuskan bahawa selepas 50,000 batu, min populasi bagi bunga tayar yang haus
kekal 0.30 inci?

) 849 , 317 ( ) 133 x 2 583 , 133 x 2 583 ( = +
) 982 , 184 ( ) 133 x 3 583 , 133 x 32 583 ( = +
13


J awapan;

n
s
t X
t
s
x
n
n 1 , 2 /
diketahui) tidak (kerana . - taburan statistik n menggunaka keyakinan selang Kira
09 . 0
35 . 0
10
ini; masalah dalam diperolehi Maklumat

=
=
=


n
s
t X
n 1 , 2 /
=


10
09 . 0
1 10 , 2 / 05 . 0
= t X

10
09 . 0
35 . 0
9 , 2 / 05 . 0
t =

10
09 . 0
262 . 2 35 . 0 =


Nota: nilai 2.262 sila rujuk daripada jadual taburan-t, iaitu cari titik persilangan antara 95% selang keyakinan dan 9
d.f. (darjah kebebasan).

J adual 1: Contoh J adual Taburan t



14


064 . 0 35 . 0 =

064 . 0 35 . 0 =

) 414 . 0 , 286 . 0 ( =


Kesimpulan:

Pengeluar tayar mempunyai alasan yang meyakinkan (95% keyakinan) bahawa min bunga tayar
haus adalah antara 0.286 inci hingga 0.414 inci. J adi, adalah munasabah untuk menyatakan
bahawa min populasi ialah 0.35 inci.



RECODE DAN COMPUTE DATA


Contoh:

Terdapat enam (6) item untuk mengukur rasa tidak puas hati guru-guru terhadap rakan sekerja,
iaitu item Q1, item Q2, item Q3, item Q4, item Q5 dan item Q6. Setiap item akan disusun
mengikut skala 5-mata seperti di bawah.

1 = Sangat setuju

2 = Setuju

3 = Kurang setuju
4 = Tidak setuju
5 = Sangat tidak setuju


Soalan kajian

Andaikan item Q2, Q4 dan Q6 adalah berbentuk negatif dan perlu diterbalikkan. Oleh itu,
item-item ini perlu di kod semula seperti berikut.

Respons Asal

Respons Baru
1

5
2

4
3

3
4

2
5

1


Bagaimana melakukan recode berkenaan?

15

PROSEDUR SPSS BAGI RECODE DATA

Arahan: Buka Data Bab 10_ Recode

1. Klik Transform > Recode Into Same Variables
Masukkan item Q2, Q4, Q6 dalam kotak Numaric Variable


Lihat kotak dialog di bawah.



2. Klik Old and New Values
Taip 5 dalam petak Value di bawah Old Value
Taip 1 dalam petak Value di bawah New Value
Lihat paparan di bawah





3. Klik Add
Taip 4 dalam petak Value di bawah Old Value
Taip 2 dalam petak Value di bawah New Value
4. Klik Add
Ulangi langkah yang sama untuk 3 (old value) > 3 (new value); 2 (old value) >4 (new
16

value); 1 (old value) > 5 (new value)
Lihat paparan di bawah



5. Klik Continue > OK

Nota: Dalam Data Bab 10_ Recode untuk item Q2, Q4 dan Q6 telah sedia diubah
(recode).

7. Klik Save untuk fail data berkenaan.




PROSEDUR SPSS BAGI COMPUTE DATA


Tujuan

Compute Data bertujuan mendapatkan nilai total (ataupun nilai min) bagi item-item Q1 hingga
Q6 untuk mengukur tahap tidak puas hati responden guru terhadap rakan sekerja mereka.
Biasanya dalam kajian sebenar, penyelidik menggunakan nilai min (purata) bagi mengukur
tahap tidak puas hati responden.




Arahan: Buka Data Bab 10 _ Recode (selepas langkah 7 di atas)

1. Klik Transform > Compute Variables
Taip pada kotak di bawah Target Variables dengan satu nama pembolehubah baru yang
anda rasa sesuai (contohnya Total_Q).

Lihat paparan di bawah

17




Di bawah kotak Functions, cari formula SUM (numexpr, numexpr.). Masukkannya ke
dalam kotak Numeric Expression menggunakan .




2. Klik Q1 dan masukkan dalam kotak Numeric Expression menggunakan .
Masukkan item Q1 hingga Q6 supaya menjadi formula berikut;

SUM(Q1 +Q2 +Q3 +Q4 +Q5 +Q6)


3. Klik OK. Satu kolum bagi pembolehubah baru (Total_Q) telah dipaparkan dalam
Data Fail ini. Pembolehubah Total_Q akan digunakan untuk mengukur tahap tidak puas
hati (merengus) di kalangan semua responden guru.

Nota: Tahap tidak puas hati responden juga boleh diukur dengan menggunakan nilai min iaitu
dengan menggunakan formula berikut; SUM(Q1+Q2+Q3+Q4+Q5+Q6)/6
18


Lihat paparan berikut






PROSEDUR SPSS BAGI ANALISIS DESKRIPTIF PEMBOLEHUBAH KUALITATIF

Secara umumnya terdapat tiga jenis pembolehubah kualitatif, iaitu;

Pembolehubah kualitatif dengan dua kategori. Contohnya, jantina
Pembolehubah kualitatif dengan bilangan kategori sederhana. Contohnya, bangsa
Pembolehubah kualitatif dengan kategori yang banyak. Contohnya, kategori pekerjaan

Nota: Data _Deskriptif 1 bagi contoh ini dapat ditunjukkan dalam jadual di bawah.


Jantina

1 = Lelaki


2 = Perempuan


Bangsa

1= Melayu


2= Cina


3=India


4=Bumiputera Bukan Melayu

5= Lain-lain


Pekerjaan

1= Perkeranian


2= Pengurusan

19


3=Penyenggaraan


4= Akademik


5= Profesional


6=Kerja sendiri


7=Perubatan


8=Pekerja mahir


9=Tentera


10= Menganggur


Soalan kajian

Apakah peratusan lelaki dan perempuan dalam sampel?
Apakah frekuensi bagi setiap kategori etnik?
Berapa banyak peserta dalam setiap 10 kategori pekerjaan?


Arahan: Buka Data _Deskriptif 1

1. Klik Analyze > Descriptive Statistics > Frequencies.
Lihat kotak dialog di bawah.





2. Klik Jantina, Bangsa, dan kategori kerja. Masukkan dalam kotak Variable(s).
3. Klik Statistics. Anda dapat lihat kotak dialog Frequencies: Statistics di bawah.

20




4. Di bawah kawasan Central Tendency, klik mode
5. Klik continue > OK
[ nota: anda juga boleh klik pada mean, median, std. deviation, variance dan sebagainya
mengikut keperluan. Bagaimanapun nilai mean, median bagi data aras nominal tidak
mempunyai apa-apa makna statistik]


Lihat paparan output di bawah:


Statistics

J antina
responden
Bangsa Kategori kerja
N Valid 118 118 118
Missing 0 0 0
Median 2.00 2.00 6.00
Mode 2 1 7
Jantina responden
Frequency Percent Valid Percent
Cumulative
Percent
Valid Lelaki 56 47.5 47.5 47.5
Perempuan 62 52.5 52.5 100.0
Total 118 100.0 100.0

Bangsa
21

Frequency Percent Valid Percent
Cumulative
Percent
Valid Melayu 51 43.2 43.2 43.2
Cina 24 20.3 20.3 63.6
India 15 12.7 12.7 76.3
Bumiputera Bukan Melayu 20 16.9 16.9 93.2
Lain-lain 8 6.8 6.8 100.0
Total 118 100.0 100.0


Kategori kerja

Frequency Percent Valid Percent
Cumulative
Percent
Valid Perkeranian 13 11.0 11.0 11.0
Pengurusan 5 4.2 4.2 15.3
Penyenggaraan 7 5.9 5.9 21.2
Akademik 15 12.7 12.7 33.9
Profesional 12 10.2 10.2 44.1
Kerja sendiri 13 11.0 11.0 55.1
Perubatan 20 16.9 16.9 72.0
Pekerja mahir 13 11.0 11.0 83.1
Tentera 12 10.2 10.2 93.2
Menganggur 8 6.8 6.8 100.0
Total 118 100.0 100.0




PROSEDUR SPSS BAGI ANALISIS TABULASI SILANG

Tujuan

Penjadualan atau Tabulasi Silang (crosstab) memaparkan taburan secara serentak antara dua
atau lebih pembolehubah. Tabulasi Silang biasanya dibentangkan sebagai jadual kontigensi
dalam format matriks.


Arahan: Buka Data _Deskriptif 1

1. Klik Analyze > Descriptive statistics >Crosstabs

Masukkan Jantina Responden dalam kotak Row(s) dan Bangsa dalam kotak
Column(s)

Lihat paparan di bawah:

22




2. Klik OK


Lihat Output di bawah;

Jantina responden * Bangsa Crosstabulation
Count
Bangsa Total
Melayu Cina India Bumiputera
Bukan Melayu
Lain-lain
J antina responden
Lelaki 5 22 13 8 8 56
Perempuan 46 2 2 12 0 62
Total 51 24 15 20 8 118

J adual Tabulasi Silang di atas dapat membandingkan antara dua pembolehubah iaitu J antina
dan Bangsa. Responden perempuan berbangsa Melayu adalah paling ramai iaitu 46 orang iaitu
74.2% berbanding keseluruhan responden perempuan. Manakala responden lelaki berbangsa
Cina pula adalah responden lelaki teramai iaitu seramai 22 orang atau 39.3% berbanding
keseluruhan responden lelaki.






23

MEMBINA CARTA

1. Klik Graphs > Legacy Dialogs >Bar.
Pilih Simple > Define
Dalam kotak Category Axis masukkan pembolehubah Kategori Kerja




2. Klik Ok
Graf Bar akan dipaparkan seperti di bawah


24

3. Klik dua kali pada graf bar
Anda boleh edit graf berkenaan sama ada dengan menukar warna dan sebagainya.
4. Klik File > Close
[nota: untuk copy graf ke msword, klik kanan tetikus >buka msword >klik paste




a) Latihan: Membina Carta Pie

1. Klik Graphs > Legacy Dialogs >Pie.
Pilih Summaries for groups of cases
2. Klik Define

o Pilih N of cases (default)
Dalam kotak Define slices by, masukkan pembolehubah Jantina Responden
3. Klik Ok
Graf Bar akan dipaparkan seperti di bawah

4. Klik dua kali pada carta pie. Klik elements >show chart labels
Anda boleh edit graf berkenaan sama ada dengan menukar warna dan sebagainya.
5. Klik File > Close
[nota: untuk copy graf ke msword, klik kanan tetikus >buka msword >klik paste



PROSEDUR SPSS BAGI ANALISIS DESKRIPTIF PEMBOLEHUBAH KUANTITATIF

Contoh di bawah menunjukkan data bagi 88 pelajar yang baru menamatkan pengajian semester
akhir di sebuah universiti. Semua responden adalah bekas pelajar sebuah politeknik yang
memperolehi diploma masing-masing. Responden terdiri daripada 45 lelaki (1 =lelaki) dan 43
perempuan (2 =perempuan). Kesemua responden direkodkan purata mata gred (PMK) bagi
diploma dan ijazah masing-masing.




25

Arahan: Buka Data _ Deskriptif 2.

1. Klik Analyze > Descriptive Statistics > Explore

Masukkan PMK ijazah ke dalam kotak Dependent List



2. Klik Statistics. Pastikan tanda pada Descriptive > Continue > OK

J adual berikut akan dipaparkan.




Descriptives

Statistic Std. Error
PMK ijazah Mean 2.4935 .04781
95% Confidence Interval for
Mean
Lower Bound 2.3985

Upper Bound 2.5886

5% Trimmed Mean 2.5003

Median 2.5650

Variance .201

Std. Deviation .44853

Minimum 1.17

Maximum 3.45

Range 2.28

Interquartile Range .61

Skewness -.237 .257
Kurtosis .071 .508



26

Penerangan:

Nilai kepencongan (skewness) dan kurtosis sepatutnya di antara +2 hingga -2 iaitu julat untuk
data yang bertaburan normal. Nilai min (mean), median adalah hampir sama. Ini menunjukkan
data boleh dikatakan bertaburan normal.


Bagi melihat perbezaan PMK Diploma berdasarkan jantina pelajar secara berasingan.

1. Klik Analyze >Descriptive Statistics > Explore
2. Klik Reset untuk kosongkan kotak dialog.
Masukkan PMK diploma dalam kotak Dependent List
Masukkan Jantina dalam kotak Factor List
3. Klik Statistics. Pastikan tanda pada Descriptive > Continue > OK

Descriptives

J antina Statistic Std. Error
PMK ijazah lelaki Mean 2.2644 .05910
95% Confidence Interval for
Mean
Lower Bound 2.1453

Upper Bound 2.3836

5% Trimmed Mean 2.2806

Median 2.3200

Variance .157

Std. Deviation .39645

Minimum 1.17

Maximum 2.94

Range 1.77

Interquartile Range .58

Skewness -.506 .354
Kurtosis .020 .695
perempuan Mean 2.7333 .05645
95% Confidence Interval for
Mean
Lower Bound 2.6193

Upper Bound 2.8472

5% Trimmed Mean 2.7326

Median 2.6900

Variance .137

Std. Deviation .37014

Minimum 2.05

Maximum 3.45

Range 1.40

Interquartile Range .58

Skewness .036 .361
Kurtosis -.795 .709
27


PROSEDUR SPSS BAGI UJIAN KENORMALAN

Andaian bahawa data bertaburan normal merupakan prasyarat bagi kebanyakan teknik analisis
statistik. Terdapat beberapa cara yang berbeza untuk melakukan ujian kenormalan (normality


Arahan: Buka Data _Deskriptif 2.

1. Klik Analyze > Descriptive Statistics > Explore
2. Masukkan PMK ijazah dalam kotak Dependent List
3. Klik pada Plots. Tandakan Factor level together, Stem-and-leaf, Histogram, Normality
plots with tests.

Lihat paparan di bawah



4. Klik Continue. Dalam kotak display, pastikan Both diaktifkan.
5. Klik Options. Dalam kotak Missing Values, klik pada Exclude cases pairwise.
6. Klik Continue > OK.
Lihat paparan histogram di bawah.




28

Descriptives
Statistic Std. Error
PMK ijazah
Mean 2.4935 .04781
95% Confidence Interval for
Mean
Lower Bound 2.3985

Upper Bound 2.5886

5% Trimmed Mean 2.5003

Median 2.5650

Variance .201

Std. Deviation .44853

Minimum 1.17

Maximum 3.45

Range 2.28

Interquartile Range .61

Skewness -.237 .257
Kurtosis .071 .508

Penerangan:

Nilai kepencongan (skewness) dan kepuncakan (kurtosis) sepatutnya di antara +2 hingga -2
iaitu julat untuk data yang bertaburan normal. Nilai kepencongan -0.237 dan nilai kepuncakan
0.071, manakala nilai min dan median adalah hampir sama menunjukkan data dikatakan
bertaburan normal.

Tests of Normality
Kolmogorov-Smirnov
a
Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
PMK ijazah .070 88 .200
*
.992 88 .865
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Nilai sig. 0.200 bagi ujian Kolmogorov-Smirnov dalam jadual Test of Normality di atas
menunjukkan Hipotesis Nol iaitu Data tidak bertaburan secara normal jika p<0.05 adalah
ditolak. Ini menunjukkan data adalah bertaburan normal. Ujian Shapiro-Wilk adalah sama
tetapi ujian ini sesuai untuk sampel yang lebih besar (melebihi 200).

29



Dalam bidang sains sosial, kebanyakan penyelidik sentiasa memikirkan pembolehubah-
pembolehubah kuantitatif yang digunakan sentiasa bertaburan normal. Bentuk taburan data
menunjukkan rajah ini bertaburan normal dan kita boleh andaikan PMK ijazah adalah
bertaburan normal atau menghampiri taburan normal.

Lihat paparan di bawah.

PMK i j azah St em- and- Leaf Pl ot

Fr equency St em& Leaf

1. 00 Ext r emes ( =<1. 2)
1. 00 1 . 4
7. 00 1 . 5777899
34. 00 2 . 0000000011111122222233333334444444
33. 00 2 . 555555666666666666777778888899999
12. 00 3 . 000001123334

St emwi dt h: 1. 00
Each l eaf : 1 case( s)


Plot stem-and-leaf adalah sama dengan histogram di atas tetapi ditunjukkan dalam sudut yang
berlainan. Batang (stems) dalam plot stem-and-leaf ialah nilai-nilai di bahagian depan,
manakala daun (leaf) ialah nilai-nilai di bahagian belakang. Baris pertama menunjukkan
terdapat satu nilai ekstrem (iaitu nilai PMK hampir 1.2) manakala nilai-nilai lain diambilkira.
30

Misalnya dalam ketiga (1.5777899) menunjukkan nilai-nilai PMK 1.5, 1.7 (ada tiga nilai), 1.8
dan 1.9 (ada dua nilai).


.
Garis lurus hitam terletak di tengah-tengah kotak menunjukkan nilai min (mean) bagi PMK
ijazah berdasarkan jantina pelajar. Data dikatakan bertaburan normal jika garis tersebut terletak
ditengah-tengah kotak atau dalam lingkungan sisihan piawai antara nilai +2 dan -2. Data yang
berada di luar kotak adalah data ekstrem (outlier) dan responden tersebut patut dibuang
daripada data yang akan digunakan untuk analisis.




31

Rajah Normal Q-Q Plot di atas menunjukkan titik-titik data berada di sepanjang garis lurus
yang menunjukkan data adalah bertaburan normal.

32