Вы находитесь на странице: 1из 28

BAB 1

PENDAHULUAN

1.1 Latar Belakang


Secara etimologis kata statistic berasal dari kata status (bahasa latin) yang
mempunyai persamaan arti dengan kata state (bahasa inggris) atau kata staat (bahasa
belanda), dan yang dalam bahasa indonesia diterjemahkan menjadi negara. Pada
mulanya, kata statistic diartikan sebagai kumpulan bahan keterangan (data), baik
yang berwujud angka (data kuantitatif) maupun yang tidak berwujud angka (data
kualitatif), yang mempunyai arti penting dan kegunaan yang besar bagi suatu Negara.
Namun, pada perkembangan selanjutnya, arti kata statistic hanya di batasi pada
kumpulan bahan keterangan yang berwujud angka (data kuantitatif) dan yang tidak
berwujud angka (data kualitatif).
Istilah statistic juga sering diberi pengertian sebagai kegiatan statistic atau
kegiatan persetatistikan atau kegiatan pensetatistikan. Sebagaimana disebutkan dalam
undang-undang tentang statistic (lihat undang-undang No. 7 tahun 1960), kegiatan
statistic mencakup 4 hal, yaitu: (1) pengumpulan data, (2) penyusunan data, (3)
pengumuman dan pelaporan data, dan (4) analisis data.
Bidang ilmu kesehatan masyarakat merupakan bidang yang kini semakin luas
amatannya. Oleh karena itu, bidang ilmu kesehatan masyarakat memerlukan berbagai
perspektif ilmiah dan berbagai metode penelitian. Tidak jarang pula dijumpai suatu
penelitian kesehatan masyarakat yang menerapkan kombinasi dari beberapa metode
penelitian. Setiap kegiatan penelitian dari awal sudah harus ditentukan dengan jelas
pendekatan atau desain penelitian apa yang akan digunakan. Hal ini bertujuan supaya
penelitian yang dilakukan dapat mempunyai landasan yang kokoh dilihat dari sudut
metodologi penelitian, disamping pemahaman hasil penelitian yang akan lebih
proporsional apabila pembaca mengetahui pendekatan yang diterapkan. Objek dan
masalah penelitian memang mempengaruhi pertimbangan-pertimbangan mengenai
pendekatan, desain ataupun metode penelitian yang akan diterapkan.1,2,3 Dan pada

dasarnya ada 3 (tiga) pendekatan penelitian yang selama ini

digunakan dalam

penelitian ilmiah yaitu penelitian kualitatif, penelitian kuantitatif, dan penelitian


triangulasi yang merupakan penggabungan dari penelitian kualitatif dan penelitian
kuantitatif.1,3
Pada penelitian kuantitatif harus ditentukan terlebih dahulu populasi dan
sampel. Untuk mempelajari populasi diperlukan sampel yang diambil dari populasi
yang akan diteliti. Meskipun peneliti dapat mengambil lebih dari sebuah sampel
berukuran n dari sebuah populasi berukuran N, pada prakteknya hanya sebuah sampel
yang bisa diambil dan digunakan untuk hal tersebut. Sampel yang diambil ialah
sampel yang acak dan dari sampel tersebut nilai-nilai statistiknya dihitung untuk
digunakan seperlunya. Untuk itu diperlukan sebuah teori yang dikenal dengan istilah
distribusi sampling. Distribusi sampling biasanya diberi nama tergantung pada nama
statistik yang digunakan dalam penelitian.

1.2 Rumusan Masalah


1.2.1

Apa yang dimaksud dengan distribusi sampling?

1.2.2

Apa yang dimaksud dengan distribusi rata-rata?

1.2.3

Apa yang dimaksud dengan distribusi proporsi?

1.2.4

Apa yang dimaksud dengan simpangan baku?

1.2.5

Apa yang dimaksud dengan distribusi median?

1.2.6

Apa yang dimaksud dengan distribusi selisih?

1.3 Tujuan Penulisan


Ada beberapa tujuan dari pembuatan makalah ini yaitu:
1.3.1

Memahami distribusi sampling

1.3.2

Memahami distribusi rata-rata

1.3.3

Memahami distribusi proporsi

1.3.4

Memahami distribusi simpangan baku

1.3.5

Memahami distribusi median

1.3.6

Memahami distribusi selisih

1.4 Manfaat Penulisan


1.4.1

Bagi Penulis
Dengan melakukan penulisan ini, dapat meningkatkan wawasan,
pengetahuan, dan pengalaman penelitian dalam menerapkan ilmu yang
diperoleh selama pendidikan terutama materi Pendidikan Kesehatan
Masyarakat.

1.4.2

Bagi Institusi Pendidikan


Makalah ini diharapkan dapat digunakan dan menjadi sebagai
salah satu sumber bacaan atau untuk lebih memahami mengenai distribusi
sampling.

BAB II
TINJAUAN PUSTAKA

2.1 Teori Sampling


Populasi adalah totalitas dari semua objek atau individu yang memiliki
karakteristik tertentu, jelas dan lengkap yang akan diteliti. Sampel merupakan bagian
dari populasi yang diambil melalui cara-cara tertentu yang juga memiliki karakteristik
tertentu, jelas dan lengkap yang dianggap bisa mewakili populasi. Populasi yang akan
diteliti disebut unit analisis atau elemen populasi, yang dapat berupa orang,
perusahaan, hasil produksi, rumah tangga dan tanah pertanian. Sementara sampel
yang akan diteliti dalam sampel disebut unit sampel. Unit sampel mungkin sama
dengan unit analisis, tetapi bisa saja tidak sama.1
Teori sampling merupakan studi yang mempelajari hubungan antara suatu
populasi dengan sampel-sampel yang diambil dari populasi tersebut. Teori sampling
sangat berguna untuk dapat mengestimasi besaran populasi yang tidak diketahui
(misalnya mean dan varians dari populasi) yang seringkali disebut parameter
populasi berdasarkan besaran sampel (misalnya mean dan varians sampel) atau yang
disebut statistik sampel (Tabel 10.1).1,2
Tabel 1 Parameter dan Statistik Sampel1
Keterangan

Parameter Populasi

Rata-rata

Proporsi

Varians

S2 atau 2

Simpangan Baku

S atau

Statistik Sampel

p=

Teori sampling juga berguna untuk menentukan perbedaan yang didapatkan


antara dua sampel disebabkan oleh variasi yang terjadi secara kebetulan atau memang
benar-benar signifikan. Pertanyaan seperti itu akan muncul, contohnya, dalam
pengujian terhadap sebuah serum baru. Jawaban-jawaban atas pertanyaan ini akan
melibatkan uji signifikansi dan hipotesis yang memegang peran penting dalam teori
keputusan.2
Secara umum, studi tentang penarikan kesimpulan yang terkait dengan suatu
populasi dengan menggunakan sampel-sampel yang diambil dari populasi tersebut,
beserta indikasi keakurasian kesimpulan tersebut yang dikaji menggunakan teori
probabilitas, disebut sebagai kesimpulan (inferensi).2

2.2 Sampel Acak dan Nomor Acak

Supaya kesimpulan dari teori sampling dan kesimpulan statistiknya valid,


maka sampel yang diambil harus representatif atau perwujudan dari populasinya.
Studi mengenai metode sampling serta persoalan yang terkait disebut rancangan
eksperimen.2
Salah satu cara mendapatkan sampel yang representatif adalah dengan proses
yang disebut sampling acak (random sampling), di mana dalam proses ini masingmasing anggota populasi memiliki kesempatan atau peluang yang sama untuk
menjadi anggot sampel. Salah satu teknik untuk memperoleh sebuah sampel acak
adalah dengan memberi nomor pada masing-masing anggota populasi, kemudian
nomor tersebut diacak dan diambil. Metode alternatif adalah dengan menggunakan
tabel nomor acak yang khusus.2

2.3 Sampling dengan dan tanpa Pengembalian

Jika kita mengambil sebuah nomor yang telah diacak, maka kita akan
memiliki pilihan untuk mengembalikan atau tidak mengembalikan nomor tersebut
sebelum pengambilan nomor berikutnya dilakukan. Jika nomor dikembalikan lagi,
maka nomor tersebut dapat muncul lagi dalam pengambilan-pengambilan berikutnya,

yang disebut sebagai sampling dengan pengembalian, sementara jika dilakukan tanpa
pengembalian maka nomor bersangkutan hanya dapat muncul sekali, yang disebut
sampling tanpa pengembalian.2
Populasi dapat merupakan populasi berhingga ataupun tidak berhingga.
Sebagai contoh, jika kita mengambil 10 bola secara berturut-turut dari kantong berisi
100 bola dengan tidak mengembalikan lagi bola yang telah diambil, maka kita
melakukan sampling dari populasi berhingga. Sementara itu, jika kita melemparkan
sekeping uang logam sebanyak 50 kali dan menghitung banyaknya tanda gambar
yang muncul, maka kita melakukan sampling dari suatu populasi tak berhingga.2

BAB III
PEMBAHASAN

3.1 Distribusi Sampling


Jika memperhatikan semua kemungkinan sampel berukuran n yang diambil
dari suatu populasi (dengan atau tanpa pengembalian), maka kita dapat menghitung
statistik sampel (seperti mean dan simpangan baku) yang bervariasi antara unit
sampel yang satu dan lainnya. Dalam hal ini, kita akan memperoleh sebuah distribusi
dari statistik tersebut yang disebut sebagai distribusi sampling.2,4
Pada suatu populasi berhingga dilakukan pengambilan sampel berukuran n
secara acak berulang-ulang hingga semua kemungkinan sampel dapat ditarik dari
populasi tersebut. Bila sampel diambil dari populasi berhingga, dan sebelum
pengambilan sampel berikutnya, unit sampel dikembalikan ke dalam populasi, maka
pengambilan yang dilakukan secara berulang tersebut (selalu dengan jumlah sampel
n) akan menghasilkan kemungkinan sampel sebanyak:3,4

NPn

Sebagai contoh, jika kita melakukan pengambilan 3 sampel dari 10 populasi


dengan melakukan pengembalian secara berulang-ulang, maka jumlah seluruh sampel
yang mungkin terjadi adalah sebanyak 10! / (3! x 7!), atau sebanyak 3628800 / (6 x
5040), yaitu 120 kemungkinan sampel.
Distribusi sampel dihasilkan dari pengambilan sampel yang dilakukan
berulang-ulang, sedangakan dalam praktik hal tersebut tidak pernah dilakukan. Oleh
karena itu, distribusi sampling disebut juga distribusi teoritis atau distribusi
probabilitas.3
Distribusi sampel diberi nama sesuai dengan statistik yang dihitung. Jika
statistik yang ditinjau adalah mean dari masing-masing sampel, maka distribusi yang
terbentuk adalah distribusi rata-rata sampling. Hal ini dapat digambarkan melalui
7

pengambilan sampel berulang dengan jumlah sampel n (X1, X2, X3, ..., Xn) untuk
setiap pengambilan, dan masing-masing unit sampel memiliki nilai rata-rata berupa
X, sehingga akan terdapat banyak unit sampel Xn dengan rata-rata X. Distribusi ini
menggambarkan variabilitas (perubahan) rata-rata sampel terhadap rata-rata populasi
. Proses ini kemudian akan menghasilkan ukuran statistik deskriptifnya. Untuk
masing-masing unit sampel tersebut juga dapat dihitung statistik sampel lainnya,
seperti distribusi sampling dari simpangan baku, varians, median, proporsi dan lain
sebagainya.1,2

3.2 Distribusi Rata-rata/Mean


Distribusi sampling rata-rata adalah distribusi sampling dari besaran rata-rata
aritmatika yang muncul dari tiap unit sampel dari populasi atau suatu distribusi
sampling yang statistik sampelnya merupakan rata-rata hitung suatu sampel. Sifat
distribusi sampling rata-rata adalah jika sampel-sampel acak dengan jumlah n
masing-masing diambil dari suatu rata-rata populasi yang dikaji dan varians 2,
maka distribusi sampling rata-rata akan memiliki distribusi normal.1,3,4
Dalil limit pusat atau teorema batas tengah (central limit theorem) adalah
hubungan antara bentuk distribusi populasi dengan bentuk distribusi sampling ratarata. Hubungan tersebut adalah sebagai berikut:3
1. Rata-rata dari distribusi rata-rata sampel sama dengan rata-rata populasi
dan tidak bergantung pada besarnya sampel dan bentuk distribusi populasi
(X = ).
2. Dengan penambahan jumlah sampel maka distribusi rata-rata sampel akan
mendekati distribusi normal dan tidak bergantung pada bentuk distribusi
populasi.
Dalil limit pusat merupakan dalil yang sangat penting dalam statistika
inferensial karena dengan dalil ini memungkinkan kita untuk menafsir parameter
populasi dari sampel tanpa harus mengetahui bentuk distribusi populasi.
Berdasarakan dalil ini, diketahui bahwa untuk pendekatan ke distribusi normal,

distribusi rata-rata sampel tidak membutuhkan sampel yang besar. Dengan sampel
sebesar 30 saja, telah terjadi pendekatan ke distribusi normal. Bahkan untuk distribusi
rata-rata dengan sampel sebesar 15 pun telah terjadi pendekatan ke distribusi normal.3
Bedasarkan dalil limit pusat, apabila sampel-sampel acak diambil dari suatu
populasi yang berdistribusi sembarang dengan rata-rata dan varians 2, maka untuk
jumlah sampel n, distribusi sampling rata-rata dianggap mendekati distribusi normal
dengan rata-rata X = dan simpangan X = / , dengan kata lain Z =

X/X

mendekati normal baku. Tingkat pendekatan akurasi menurut dalil ini akan semakin
baik jika n semakin besar, atau disebut distribusi sampling normal asimtotik. Pada
kasus di mana populasinya terdistribusi secara normal, distribusi mean sampel juga
akan terdistribusi secara normal bahkan untuk nilai n yang kecil sekalipun (yaitu n <
30).1-4
Dalil di atas hanya berlaku bila cara pengambilan sampelnya dengan
pengembalian. Jika pengambilan sampelnya tanpa pengembalian pada populasi N,
maka distribusi sampling akan mempunyai rata-rata X = dan simpangan bakunya
adalah X = /

) (

), dengan (

) (

) merupakan faktor

koreksi pada simpangan baku. Rumus-rumus yang digunakan antara lain:1,3,4


a. Untuk pemilihan sampel dari populasi berhingga:
Bila populasi berhingga yang berukuran N dan berdistribusi normal dengan ratarata dan simpangan baku , maka rata-rata sampel X didasarkan pada sampel
acak berukuran n yang dipilih dari populasi N di atas akan memiliki distribusi
normal dengan rata-rata dan simpangan baku seperti berikut:

1) Untuk pengambilan sampel tanpa pengembalian atau n/N > 5%, digunakan
faktor koreksi.
Rata-rata

: X =

Simpangan baku : X =

10

Nilai baku

: Z=

atau Z =

2) Untuk pengambilan sampel dengan pengembalian atau n/N 5%, tidak


digunakan faktor koreksi.
Rata-rata

: X =

Simpangan baku : X =
Nilai baku

: Z=

atau Z =

b. Untuk pemilihan sampel dari populasi yang tidak berhingga:


Bila populasi N memiliki ukuran yang tidak berhingga dan didistribusikan secara
normal dengan rata-rata dan simpangan baku , maka rata-rata sampel X dari
sampel acak berukuran n yang dipilih dengan atau tanpa pengembalian akan
memiliki distribusi normal dengan rata-rata dan simpangan baku sebagai berikut:
Rata-rata

: X =

Simpangan baku : X =
Nilai baku

: Z=

atau Z =

Pada umumnya, teorema batas tengah merupakan normalitas dari distribusi


sampling dan sifat-sifatnya dinyatakan sebagai berikut:1
1. Jika populasi cukup besar dan berdistribusi secara normal, maka distribusi
sampling rata-ratanya akan normal.
2. Jika distribusi populasi tidak normal maka distribusi sampling rata-ratanya
akan mendekati normal apabila jumlah sampel cukup besar, biasanya lebih
dari 30.
3. Jika normal rata-rata sampel memiliki rata-rata yang sama dengan rata-rata
harapan E(X) dan simpangan baku X, nilai rata-rata sampel dapat dihitung
dari rata-rata populasi () dan simpangan baku populasi ().

11

CONTOH SOAL
Suatu perusahaan obat memproduksi obat yang tiap botolnya berisi rata-rata 20
ml dengan simpangan baku 4 ml. Jika diambil 36 botol obat secara acak,
tentukan probabilitas untuk terambilnya botol dengan isi rata-rata antara 20,06 ml
sampai dengan 21 ml!

PENYELESAIAN
: = 20

Diketahui

= 4
n = 36
X = rata-rata isi botol (20,06 dan 21)
Ditanyakan : P (20,06 X 21)
Jawab

N tidak diketahui Populasi tidak berhingga (tanpa faktor koreksi)


X = = 20
X =
Z1 =
Z2 =

= 0,67

= 0,09

= 1,49

P (20,06 X 21) = P (0,09 Z 1,49)


= P (0 Z 1,49) P (0 Z 0,09)
= (1,49) (0,09)
= 0,4319 0,0359
= 0,3960
Jadi probabilitas isi botol rata-ratanya antara 20,06 ml sampai dengan 21 ml
adalah 0,3960 atau 39,60%.

12

Lima ratus bayi memiliki berat badan rata-rata 5,02 kg dan simpangan baku 0,30
kg. Tentukan probabilitas suatu sampel acak terdiri dari 100 bayi yang memiliki
berat badan total antara 496 sampai 500 kg!

PENYELESAIAN
Diketahui

: = 5,02
= 0,3
N = 500
n = 100
X = rata-rata berat badan bayi (4,96 dan 5)

Ditanyakan : P (4,96 X 5)
Jawab

N diketahui Populasi berhingga


=

= 0,2 > 0,05 (gunakan faktor koreksi)

X = = 50,2
X =

= 0,027

Jika 100 sampel bayi memiliki berat badan total 496 sampai 500 kg, maka
rata-ratanya adalah 4,96 5 kg.

Z1 =
Z2 =

= 2,22
= 0,74

P (4,96 X 5) = P (2,22 Z 0,74)


= P (0,74 Z 0) P (2,22 Z 0)
= (0,74) (2,22)
= 0,2296 0,0132 = 0,2164

13

Jadi probabilitas berat badan bayi yang rata-ratanya antara 4,96 kg sampai
dengan 5 kg adalah 0,2164 atau 21,64%.

3.3 Distribusi Proporsi


Distribusi proporsi sampling adalah distribusi proporsi-proporsi (persentase)
dari seluruh sampel acak berukuran n yang mungkin terpilih dari sebuah populasi.
Hal ini digunakan untuk mengetahui persentase atau perbandingan antara dua hal
yang berkomplemen (peristiwa binominal), seperti persentase perokok atau bukan
perokok, persentase pemilih bukan pemilih di suatu pemilu, serta perbandingan antara
pemakai dan bukan pemakai produk tertentu.1,2,4
Jika event populasi adalah X dan event sampel adalah x, maka proporsi dari
populasi dinyatakan dengan = X/N, sementara proporsi untuk sampel dinyatakan
dengan p = x/n. Misalkan terdapat sebuah populasi tak berhingga, sebagai contoh,
pelemparan koin, probabilitas untuk terjadinya suatu peristiwa (disebut keberhasilan),
contohnya munculnya tanda gambar pada satu kali pelemparan, adalah = 1/2,
sementara probabilitas untuk tidak munculnya tanda gambar adalah q = 1 . Sejalan
dengan sifat distribusi sampling rata-rata, maka distribusi sampling mempunyai
rumus:1-3
a. Untuk pemilihan sampel dari populasi berhingga:
) (

1) n/N > 5% (0,05), digunakan faktor koreksi (


Rata-rata

: =

Simpangan baku : =

Nilai baku

: Z=

atau Z =

2) n/N 5% (0,05), tidak digunakan faktor koreksi.


Rata-rata

: =

).

14

Simpangan baku : =

Nilai baku

: Z=

atau Z =

b. Untuk pemilihan sampel dari populasi yang tidak berhingga:


Rata-rata

: =

Simpangan baku : =

Nilai baku

: Z=

atau Z =

Perlu diperhatikan bahwa proporsi adalah nilai variabel diskrit yang


populasinya mengikuti distribusi binomial. Jika nilai n besar (n > 30), distribusi
proporsi sampling mendekati suatu distribusi normal. Untuk mengubah suatu nilai
proporsi ke dalam skor Z guna menentukan probabilitas suatu interval proporsi
tertentu dengan menggunakan tabel distribusi normal kumulatif, diperlukan faktor
koreksi (1/2n) terhadap nilai proporsi tersebut.4

CONTOH SOAL
Suatu pengiriman obat-obatan biasanya akan terdiri dari 88 kotak obat yang tidak
memenuhi kualitas standar dari total 1000 kotak obat yang dikirimkan. Jika 75
kotak obat dipilih secara acak dari populasinya, berapa besar probabilitas sampel
proporsi kotak obat yang tidak memenuhi kualitas standar antara 8% hingga
12%?
PENYELESAIAN
Diketahui

: X = 88
N = 1000
n = 75

15

Ditanyakan : P (0,08
Jawab

0,12)

N diketahui Populasi berhingga


=

= 0,075 > 0,05 (gunakan faktor koreksi)

==
=

= 0,088

Z1 =

= 0,27

Z2 =

= 1,07

P (0,08

= 0,03

0,12) = P (0,27 Z 1,07)


= P (0 Z 0,27) + P (0 Z 1,07)
= 0,1064 + 0,3577
= 0,4641

Jadi probabilitas sampel proporsi obat yang tidak memenuhi kualitas standar
antara 8% sampai dengan 12% adalah 0,4641 atau 46,41%.
Dalam setiap pengiriman botol infus biasanya 95% diterima dalam keadaan baik.
Pada suatu waktu telah dikirim 100.000 botol infus. Berapa probabilitas untuk
pemeriksaan yang terdiri dari 50 botol infus dari pengiriman itu berisi botol infus
yang baik minimal 96%?
PENYELESAIAN
Diketahui

: = 0,95
N = 100.000
n = 50

16

Ditanyakan : P (
Jawab

0,96)

N diketahui Populasi berhingga


= 0,0005 0,05 (tanpa faktor koreksi)

=
= = 0,95
=

Z=
P(

= 0,03

= 0,33

0,96) = P (Z 0,33)
= P (Z 0) P (0 Z 0,33)
= 0,5000 0,1293
= 0,3707

Jadi probabilitas sampel proporsi botol infus dengan kualitas standar minimal
96% adalah 0,3707 atau 37,07%.
Divisi pengendalian mutu pabrik perkakas mesin alat kesehatan mencatat bahwa
2% dari mata bor yang diproduksi mengalami cacat. Jika dalam pengiriman satu
batch produk terdiri dari 400 mata bor, tentukan probabilitas banyaknya mata bor
yang cacat sebanyak 3% atau lebih!

PENYELESAIAN
Diketahui

: = 0,02
n = 400

Ditanyakan : P (

0,03)

17

Jawab

N tidak diketahui Populasi tak berhingga (tanpa faktor koreksi)


= = 0,02
=

Faktor koreksi varibel diskrit =

= 0,007
=

= 0,00125

Proporsi (3%) setelah dikoreksi, P = 0,03 0,00125 = 0,02875

Z=
P(

= 1,25

0,02875) = 1 P (Z 1,25)
= 1 (1,25)
= 1 0,08944
= 0,1056

Jadi probabilitas mata bor yang cacat sebanyak 3% atau lebih adalah 0,1056 atau
10,56%.

3.4 Distribusi Simpangan Baku


Simpangan baku dari distribusi sampling suatu statistik sering disebut sebagai
standard error atau kesalahan baku, yang memuat kesalahan baku dari distribusi
sampling untuk berbagai ukuran statistik (Tabel 2). Kesalahan baku diukur dalam
kondisi sampling acak dari populasi tak berhingga (atau sangat besar) atau dari
sampling dengan pengembalian dari suatu populasi berhingga.2,3

18

Tabel 2. Kesalahan baku untuk beberapa distribusi sampling2


Distribusi Sampling

Kesalahan Baku

Mean

X =

Proporsi
=

Simpangan Baku

(1) s =

(2) s =

Varians
(1)

(2)

Kesalahan baku tidak hanya menggambarkan besarnya penyimpangan atau


kesalahan yang diakibatkan pengambilan sampel, tetapi dapat pula digunakan untuk
menggambarkan ketepatan estimasi terhadap populasi. Bila kesalahan baku kecil,
berarti penyebaran rata-rata sampel juga kecil, maka estimasi terhadap parameter
populasi akan lebih tepat. Sebaliknya, jika nilai kesalahan baku besar, berarti
penyabarannya juga besar, maka estimasi terhadap parameter populasi menjadi
kurang tepat.3

19

Telah dibahas bahwa jika ukuran sampel n cukup besar, maka distribusi
samplingya akan nomal atau mendekati normal. Oleh karena itu, metode-metodenya
dikenal sebagai metode sampling besar. Ketika n < 30, sampelnya disebut berukuran
kecil.2,3
Pada perhitungan distribusi simpangan baku, seperti biasa, kita akan memiliki
populasi berukuran N, dengan sampel berukuran n yang diambil dari pengambilan
acak, lalu dihitung simpangan bakunya, yaitu . Bila pada rumus kesalahan baku ratarata adalah X = / , maka penambahan jumlah n akan menyebabkan kesalahan
baku mengecil, yang berarti bahwa besarnya kesalahan baku berbanding terbalik
dengan besarnya sampel, tetapi penambahan besarnya sampel tidak seimbang dengan
penurunan kesalahan baku. Fenomena ini dikenal sebagai law of demininshing return
yang berarti output lebih kecil daripada input. Misalnya, suatu populasi dengan
simpangan baku 100 dan sampel yang diambil sebesar 10, kemudian dihitung
kesalahan bakunya, maka kita akan mendapatkan hasil sebagai berikut:3
X = 100/

= 31,6

Bila sekarang sampel ditingkatkan dari 10 menjadi 100, maka kesalahan baku
yang dihasilkan menjadi 100/

= 10. Dari kedua hasil tersebut, tampak bahwa

bila besarnya sampel ditingkatkan 10 kali, maka kita akan mendapatkan penurunan
kesalahan baku rata-rata hanya sebesar 3 kali.3
Jika simpangan baku populasi adalah dan tiap sampel dihitung simpangan
bakunya, yaitu S, kemudian dapat dihitung rata-ratanya (S) dan simpangan bakunya
(S). Jika populasi berdistribusi normal atau hampir normal, maka distribusi
simpangan baku untuk sampel n (biasanya 100), akan sangat mendekati distribusi
normal dengan rumus:2

20

: S =

Rata-rata

Simpangan baku : S =
Nilai baku

: Z=

Contoh soal:
Ada sebuah populasi umur pasien stroke yang di rawat inap di bagian neurologi
Rumah Sakit Umum Moh.Husein bulan Januari-Maret tahun 2010. Diketahui ratarata populasi adalah 76,4 dan standard deviasi nya 6,24. 5
Sampel random 1

Sampel random 2

Sampel random 3

Umur

Jumlah

Umur

Jumlah

Umur

Jumlah

66

65

65

67

66

66

68

70

65

70

72

68

73

73

69

75

75

70

78

76

71

80

77

72

81

78

73

82

80

74

86

81

75

89

82

76

90

83

77

84

78

89

79

90

80

91

81

21

82

83

84

85

88

90

Total

13

33

48

Mean

77,3

77,7

75,5

S.E Mean

2,285

1,242

0,874

Variance

67,90

50,92

36,64

SD

8,24

7,14

6,05

Rata-rata populasi 76,4


Jumlah sampel 1 sebanyak 13, didapatkan rata-rata 77,3, lebih tinggi 0,9 unit
dibandingkan dengan rata-rata populasi. Pada sampel 2 jumlahnya ada 33 dengan rata-rata
77,7, lebih tinggi 1,3 unit dibandingkan rata-rata populasi. Didapatkan standar deviasi sampel
1 (SD= 8,24) lebih besar dibandingkan standar deviasi sampel 2 (SE=7,14), hal ini
menandakan bahwa varian dan standar eror sampel 1 lebih besar dibandingkan sampel 2.
Jika jumlah sampel ditambah menjadi 48 sampel, maka rata-rata yang didapatkan 75,5
dan standar deviasi 6,05, lebih rendah dibandingkan sampel 1 dan 2. Hal ini juga berarti
standar erornya juga mengecil, yaitu 0,874 untuk sampel 3.

3.5 Distribusi Median


Untuk n 30, distribusi sampling dari median akan sangat mendekati normal.
Hasil yang diperoleh akan tetap sama hanya jika populasinya normal (atau mendekati
normal).2
Rata-rata

: med =

Simpangan baku : med =

22

3.6 Distribusi Sampling dari Selisih dan Jumlah


Misalkan kita diberi dua populasi. Untuk setiap sampel berukuran N1 yang
diambil dari populasi pertama, mari kita hitung suatu statistik (data) S1; perhitungan
ini menghasilkan sebuah distribusi sampling untuk statistik S1 yang mean dan
simpangan bakunya masing-masing dilambangkan dengan S1 dan S1. Demikian
pula, untuk setiap sampel berukuran N2, akan didapatkan distribusi sampling statistik
S2 berupa S2 dan S2. Dari seluruh kombinasi sampel yang mungkin diambil dari
kedua populasi tersebut, kita dapat memperoleh suatu data distribusi dari selisih S1
S2, yang disebut distribusi sampling selisih dari statistik. Dengan syarat bahwa
sampel-sampel yang dipilih tidak bergantung satu sama lain (dengan kata lain saling
bebas), mean dan simpangan baku dari distribusi sampling ini, dilambangkan masingmasing dengan S1-S2 dan S1-S2, yang dirumuskan dengan:2

dan

Jika S1 dan S2 adalah mean sampel yang diperoleh dari kedua populasi
sehingga dilambangkan dengan

maka distribusi sampling dari selisih

dan

mean untuk kedua populasi tak berhingga (dengan mean dan simpangan baku
masing-masing 1, 1 dan 2, 2), adalah:2

dan

Rumus di atas dipakai menggunakan persamaan X = dan X = / , namun


rumus di atas juga berlaku untuk populasi berhingga jika sampling dilakukan dengan
pengembalian. Hasil yang sama juga dapat diperoleh untuk populasi berhingga yang
samplingnya diakukan tanpa pengembalian dengan menggunakan persamaa X =
dan X = / (

) (

).2

23

Hasil-hasil serupa dapat diperoleh untuk distribusi-distribusi sampling selisih


proporsi dari dua populasi yang terdistribusi secara binomial dengan parameter
masing-masing (p1, q1) dan (p2, q2). Dalam kasus ini, S1 dan S2 serupa dengan
proporsi dari keberhasilan, 1 dan 2, maka persamaan

dan

menjadi:2

dan

Jika n1 dan n2 lebih besar dari 30 atau tepat berjumlah 30, maka distribusi
sampling dari selisih mean atau proporsi akan sangat dekat dengan distribusi normal.
Di samping distribusi sampling dari selisih, terdapat pula distribusi sampling dari
jumlah statistik. Dengan mengasumsikan bahwa sampel-sampel merupakan sampel
yang saling bebas, mean dan simpangan baku dari distribusi ini diberikan oleh
persamaan berikut:2
dan

3.6.1 Distribusi Sampling Selisih Rata-rata


Bila kita memiliki dua populasi sebesar N1 dan N2, dengan simpangan baku
sebesar 1 dan 2, kemudian diambil sampel independen masing-masing sebesar n1
dan n2 secara berulang-ulang, sehingga menghasilkan rata-rata populasi 1 dan 2,
serta rata-rata sampel X1 dan X2.1,3
Rata-rata yang diambil dari sampel-sampel populasi pertama dan kedua
masing-masing disusun menjadi distribusi rata-rata, kemudian dihitung selisihnya.
Rumus yang digunakan untuk menghitung selisih tersebut yaitu:1,3
Rata-rata

: (X1X2) = 1 2

Simpangan baku : (X1 X2) =

24

Bila sampel cukup besar, maka besar distribusi sampel akan mendekati
distribusi normal, yaitu:3
(

Nilai baku

: Z=
(

CONTOH SOAL
Sebuah pabrik alat kesehatan Z menghasilkan lampu kamar operasi dengan ratarata daya listrik 6000 W dan simpangan baku 300 W, sedangkan saingannya,
pabrik kesehatan Y menghasilkan lampu yang sama dengan rata-rata daya listrik
6500 W dan simpangan baku 400 W. Apabila dari pabrik Z dan Y masingmasing diambil sampel acak yang berukuran 75 dan 125, maka tentukan
probabilitas rata-rata daya listrik lampu pabrik Y minimal 350 W melebihi dari
rata-rata daya tahan lampu pabrik Z!

PENYELESAIAN
Diketahui

: z = 6000
z = 300
nz = 75
Xz = rata-rata daya listrik lampu Z
y = 6500
y = 400
ny = 125
Xy = rata-rata daya listrik lampu Y

Ditanyakan : P (Xy Xz 350)


Jawab

= 6500 6000 = 500

= 49,80

25

Z=

= 3,01

P (Xy Xz 350) = P (Z 3,01)


= P (0 Z 3,01) + P (Z 0)
= 0,4987 + 0,5000
= 0,9987
Jadi probabilitas rata-rata daya listrik lampu Y minimal 350 W melebihi dari
rata-rata daya tahan lampu pabrik Z adalah 0,9987 atau 99,87%.

3.6.2 Distribusi Selisih Proporsi


Distribusi sampling beda dua proporsi adalah distribusi dari perbedaan dua
besaran proporsi yang muncul dari sampel dua populasi. Misalkan, terdapat dua
populasi, yaitu N1 dan N2 (2 populasi binomial), dengan event yang sama, yaitu X1
dan X2, maka proporsi event tersebut adalah 1 = X1/N1 dan 2 = X2/N2, dengan q1 = 1
1 dan q2 = 1 2. Pada kedua populasi, kemudian diambil sampel acak, yaitu n1
dan n2 dengan event x1 dan x2, maka proporsi p1 = x1/n1 dan p2 = x2/n2. Beda antara
kedua proporsi dinyatakan dalam selisih kedua proporsi, yaitu 1 2, yang
membentuk suatu disribusi sampling selisih proporsi. Pada distribusi sampling selisih
proporsi, berlaku hal-hal berikut:1,3
Rata-rata

: 1-2 = 1 2

Simpangan baku : 1-2 =

Jika n1 dan n2 yang diambil dari populasi cukup besar (n 30), maka
distribusi sampling selisih proporsi akan mendekati distribusi normal, sehingga dapat
digunakan yang rumus nilai baku dengan transformasi menjadi distribusi normal
baku, yaitu:1,3
Rumus

: Z=

) (

26

CONTOH SOAL
Di sebuah kota, terdapat dua jenis pasta gigi yang dipasarkan, yaitu pasta gigi A
dan B. Biasanya dari seluruh produk pasta gigi A terdapat 5% yang tidak
memenuhi kualitas, sedangkan dari pasta gigi B terdapat 4% yang tidak
memenuhi kualitas. Jika diambil sampel acak masing-masing 100 buah dari
kedua pasta gigi, berapa probabilitas jumlah pasta gigi A yang tidak memenuhi
kualitas akan kurang dari 1,5% dari jumlah pasta gigi B yang tidak memenuhi
kualitas?
PENYELESAIAN
: A = 0,05

Diketahui

nA = 100
B = 0,04
nB = 100
Ditanyakan : P (A B < 0,015)
Jawab

= 0,05 0,04 = 0,01


(

=
Z=

= 0,03

= 0,17

P (A B < 0,015) = P (Z < 0,17)


= P (0 Z 0,17) + P (Z < 0)
= 0,0675 + 0,5000
= 0,5675
Jadi probabilitas jumlah pasta gigi A yang tidak memenuhi kualitas kurang dari 1,5%
dari jumlah pasta gigi B yang tidak memenuhi kualitas adalah 0,5675 atau 56,75%.

27

BAB IV
PENUTUP
4.1 Kesimpulan
a.

Distribusi sampling merupakan studi yang mempelajari hubungan antara


suatu populasi dengan sampel-sampel yang diambil dari populasi tersebut.

b.

Distribusi sampling rata-rata adalah distribusi sampling dari besaran rata-rata


aritmetika yang muncul dari tiap unit sampel dari populasi atau suatu
distribusi sampling yang statistik sampelnya merupakan rata-rata hitung
suatu sampel.

c.

Distribusi proporsi sampling adalah distribusi proporsi-proporsi (persentase)


dari seluruh sampel acak berukuran n yang mungkin terpilih dari sebuah
populasi.

d.

Simpangan baku dari distribusi sampling suatu statistik sering disebut


sebagai standard error atau kesalahan baku, yang memuat kesalahan baku
dari distribusi sampling untuk berbagai ukuran statistik

e.

Distribusi selisih adalah keseluruhan kombinasi sampel yang mungkin


diambil dari dua populasi yaitu selisih S1 S2.

27

28

DAFTAR PUSTAKA

1. Harianti A, Veronica MS, Nur, Setiawan S & Iskandar D. Statistika II. 2012.
Yogyakarta: Andi Offset.
2. Spiegel MR & Stephens LJ.. Schaums Outlines Teori dan Soal-soal: Statistik.
Edisi III. 2007. Jakarta: Erlangga.
3. Budiarto E.. Biostatistika untuk Kedokteran dan Kesehatan Masyarakat. 2002.
Jakarta: EGC.
4. Harinaldi. Prinsip-prinsip Statistik untuk Teknik dan Sains. 2005. Jakarta:
Erlangga.
5. Carol, EO. Statistical Applications for Health Information Management. 2009.
Jones and Bartlett Publihsher:USA.

Вам также может понравиться