Вы находитесь на странице: 1из 24

Agung Priyo Utomo - agungpu@gmail.

com 1
MODEL PROBIT
BAHAN KULIAH ANALISIS DATA KATEGORIK
SEKOLAH TINGGI ILMU STATISTIK

Oleh:
Agung Priyo Utomo
Agung Priyo Utomo - agungpu@gmail.com 2
Model Probit
Contoh 1:
Penelitian untuk mengetahui faktor-faktor yang
mempengaruhi apakah seorang kandidat akan
memenangkan pemilu atau tidak. Dalam kasus ini maka
hasilnya adalah menang atau kalah. Beberapa faktor yg
diduga berpengaruh adalah besarnya uang yang
dikeluarkan dalam kampanye, lamanya waktu
berkampanye negatif dan apakah kandidat memiliki
jabatan atau tidak.

Contoh 2:
Penelitian untuk mengetahui apakah latihan OR, usia, dan
jenis kelamin berpengaruh terhadap seseorang akan
terkena serangan jantung atau tidak.
Agung Priyo Utomo - agungpu@gmail.com 3
Model Probit
Contoh 3:
Beberapa siswa SMU berkeinginan untuk melanjutkan
kuliah. Dalam berkas lamarannya, mereka memasukkan
skor GRE dan nilai GPA. Beberapa siswa berasal dari
sekolah unggulan dan ada juga yang dari sekolah non
unggulan. Beberapa bulan setelah siswa mengirimkan
aplikasi, siswa tersebut menerima 2 macam amplop (tebal
atau tipis) yang menandakan mereka diterima atau ditolak
di PT yang bersangkutan.
Agung Priyo Utomo - agungpu@gmail.com 4
Model Probit
Pertama kali ditemukan oleh Chester Bliss (1930)
Probit = Probability Unit
Model logit menggunakan fungsi logistik kumulatif
(cumulative logistic function)
Model probit menggunakan fungsi normal kumulatif
(normal CDF) disebut juga dengan model normit
Secara prinsip utk memperoleh model probit dpt dilakukan
dg mengganti fungsi logistik kumulatif pd persamaan


dengan fungsi normal kumulatif
i
Z
i
e 1
1
P

+
=
Agung Priyo Utomo - agungpu@gmail.com 5
Model Probit
Agung Priyo Utomo - agungpu@gmail.com 6
Model Probit
Contoh:
Keputusan untuk membeli/memiliki rumah dilihat dari
pendapatan keluarga.
Ada suatu nilai, semacam indeks kegunaan yg tdk dpt
diamati (unobservable utility index), misal I
i
, sedemikian
sehingga makin besar nilai I
i
, maka makin besar pula
peluang sebuah keluarga untuk membeli rumah.
Indeks I
i
dapat dinyatakan sbb:

I
i
=
1
+
2
X
i

X
i
= pendapatan keluarga ke-i
Agung Priyo Utomo - agungpu@gmail.com 7
Model Probit
Bgmn hubungan I
i
dg keputusan utk membeli rumah?
Pada model logistik, Y = 1 jika keluarga memiliki rumah dan Y = 0
jika keluarga tidak memiliki rumah
Pada model probit, dapat diasumsikan untuk setiap keluarga ada
batasan indeks, misal I
i
* sedemikian shg jika I
i
> I
i
*, maka keluarga
tersebut akan membeli rumah
Jika diasumsikan I
i
* berdistribusi normal dengan rata-rata
dan varian sama, maka I
i
* maupun I
i
dapat diestimasi
Dibawah asumsi kenormalan, maka



dimana t ~ N(0,1)
} }
| + |

t
=
t
= = s = = =
i 2 1
2
2
t
i
2
2
t
X T
i i
*
i i
dt e
2
1
dt e
2
1
) I ( F ) I I ( P ) 1 Y ( P P
Agung Priyo Utomo - agungpu@gmail.com 8
Model Probit
Jika P
i
= peluang sebuah event akan terjadi, maka
peluang untuk memiliki rumah dapat dihitung dari luas di
bawah kurva normal baku dari - s.d. I
i



P
i
= F(I
i
)
I
i
=
1
+
2
X
i
Agung Priyo Utomo - agungpu@gmail.com 9
Model Probit
Untuk menghitung indeks I
i
, dapat diperoleh dari

I
i
= F
-1
(I
i
) = F
-1
(P
i
) =
1
+
2
X
i
F
-1
merupakan invers dari CDF normal
P
i Pr(I
i
*I
i
)
0 -
P
i
= F(I
i
)
1
I
i
= F
-1
(P
i
)
Agung Priyo Utomo - agungpu@gmail.com 10
Model Probit
Bagaimana memperoleh indeks I
i
, jika yg diketahui hanya
X
i
(pendapatan) dan Y = 1 atau Y = 0 (tergantung apakah
keluarga tersebut memiliki rumah atau tidak)?
Misal datanya sbb: (X = dalam ribuan $)

X Ni ni
6 40 8
8 50 12
10 60 18
13 80 28
15 100 45
20 70 36
25 65 39
30 50 33
35 40 30
40 25 20
Agung Priyo Utomo - agungpu@gmail.com 11
Model Probit
Untuk mengestimasi indeks I
i
dpt dilakukan melalui nilai
Peluang (frekuensi relatif), selanjutnya bandingkan
dengan CDF normal
X Ni ni Est. Pi Ii
6 40 8 0,20 -0.84
8 50 12 0,24 -0.70
10 60 18 0,30 -0.52
13 80 28 0,35 -0.38
15 100 45 0,45 -0.12
20 70 36 0,51 0.03
25 65 39 0,60 0.25
30 50 33 0,66 0.40
35 40 30 0,75 0.67
40 25 20 0,80 0.84
Agung Priyo Utomo - agungpu@gmail.com 12
Model Probit
Dari data tersebut, model probit dapat diperoleh sbb:
Berdasarkan est. P
i
(frekuensi relatif), maka dapat diperoleh I
i
dari
CDF normal (ada di tabel sebelumnya)
Setelah I
i
diperoleh, maka dapat dicari
1
dan
2
dg mudah
Pada analisis probit, I
i
disebut normal equivalent deviate
(n.e.d) atau disebut juga normit
Karena I
i
atau n.e.d akan bernilai negatif (-) pada saat P
i
<
0.5, maka dalam prakteknya ditambahkan dengan nilai 5
dan hasilnya disebut probit
probit = n.e.d + 5 = I
i
+ 5

1
dan
2
dapat diestimasi berdasarkan model:
I
i
=
1
+
2
X
i
+ u
i
; dimana u
i
= unsur gangguan
Agung Priyo Utomo - agungpu@gmail.com 13
Model Probit
Tahapan dalam model probit:
1. Dari data yang sudah dikelompokkan, estimasi P
i

(frekuensi relatif)
2. Berdasarkan estimasi dari P
i
, cari n.e.d (I
i
) dari CDF
normal
3. Gunakan estimasi I
i
(I
i
*), sebagai variabel terikat dalam
regresi
I
i
* =
1
+
2
X
i
+ u
i

4. Jika diperlukan, tambahkan 5 pada nilai n.e.d (Ii) untuk
mengubah menjadi probit dan gunakan sebagai
variabel terikat pada
I
i
* =
1
+
2
X
i
+ u
i

Agung Priyo Utomo - agungpu@gmail.com 14
Logit vs Probit?
Kedua model termasuk dalam model non linier
Untuk membuat menjadi model linier, Logistik
menggunakan transformasi fungsi logit (logaritma natural
dari nilai odds), sedangkan probit menggunakan fungsi
invers dari distribusi kumulatif normal (Z-score)
Dalam prakteknya kedua model seringkali memberikan
hasil yang sama/mirip.
Kedua metode menggunakan metode MLE
Model probit tidak menghasilkan nilai odds ratio seperti
pada model logit.
Agung Priyo Utomo - agungpu@gmail.com 15
Perkiraan Peluang Logit &
Probit
Agung Priyo Utomo - agungpu@gmail.com 16
Contoh:
(Aplikasi menggunakan SPSS)
Beberapa siswa SMU berkeinginan untuk melanjutkan
kuliah. Dalam berkas lamarannya, mereka memasukkan
skor GRE dan nilai GPA. Beberapa siswa berasal dari
sekolah unggulan dan ada juga yang dari sekolah non
unggulan. Beberapa bulan setelah siswa mengirimkan
aplikasi, siswa tersebut menerima 2 macam amplop (tebal
atau tipis) yang menandakan mereka diterima atau ditolak
di PT yang bersangkutan.
Data ada di file probit.sav
Agung Priyo Utomo - agungpu@gmail.com 17
Contoh:
(Aplikasi menggunakan SPSS)
Variabel tak bebas/terikat = admit
1 = diterima (admitted)
0 = tidak diterima (not admitted)
Variabel bebas =
gre (graduate record exam score),
gpa (grade point average),
topnotch (asal sekolah) :
- 1 jika berasal dari sekolah ungulan
- 0 jika berasal dari sekolah non unggulan
Agung Priyo Utomo - agungpu@gmail.com 18
Contoh:
(Aplikasi menggunakan SPSS)
Descriptive Statistics
400 220,00 800,00 587,7000 115,51654
400 2, 26 4, 00 3, 3899 ,38057
400
Graduat e Record Exam
Grade Point Av erage
Valid N (listwise)
N Minimum Maximum Mean Std. Dev iation
Asal Sekol ah
335 83, 8 83, 8 83, 8
65 16, 3 16, 3 100,0
400 100,0 100,0
Non Unggulan
Unggulan
Tot al
Valid
Frequency Percent Valid Percent
Cumulat ive
Percent
Agung Priyo Utomo - agungpu@gmail.com 19
Beberapa Strategi
Regresi OLS
Analisis ini akan bermasalah, karena asumsi OLS akan
terlanggar jika digunakan pada kasus variabel terikatnya
berupa kategorik.
Uji t
Uji ini bisa digunakan jika kasusnya hanya terdiri dari
satu variabel bebas dan bersifat kuantitatif, misal hanya
melihat pengaruh dari GPA terhadap diterima atau
tidaknya seorang siswa di PT.
Regresi Logit
Model ini sangat mirip dengan model probit
Agung Priyo Utomo - agungpu@gmail.com 20
Penggunaan Model Probit
Sebelum menjalankan model probit, maka periksa dulu
apakah ada sel yang kosong/terlalu kecil frekuensinya
(pada tabulasi silang antara variabel bebas kategorik dan
variabel tak bebasnya). Jika terdapat sel yang kosong,
maka akan sulit menjalankan model probit.
Admi ssi on Status * Asal Sekolah Crosstabul ati on
Count
238 35 273
97 30 127
335 65 400
not admitt ed
admitt ed
Admission
Stat us
Tot al
Non
Unggulan Unggulan
Asal Sekolah
Tot al
Tidak ada
sel yang kosong
Agung Priyo Utomo - agungpu@gmail.com 21
Model Probit
Sebelum menjalankan model probit, maka periksa dulu
apakah ada sel yang kosong/terlalu kecil frekuensinya
(pada tabulasi silang antara variabel bebas kategorik dan
variabel tak bebasnya). Jika terdapat sel yang kosong,
maka akan sulit menjalankan model probit.
Karena GPA dan GRE
kuantitatif/kontinu
Agung Priyo Utomo - agungpu@gmail.com 22
Model Probit
Semua data
valid digunakan
Digunakan untuk
mengetahui
apakah model dg
beberapa variabel
bebas lebih baik
drpd model tanpa
variabel bebas
(hanya intersep).
Nilai sig. sebesar
0.000 < o (misal
5%) menunjukkan
bahwa model dg
variabel bebas
lebih baik dari
model tanpa
variabel bebas.
Agung Priyo Utomo - agungpu@gmail.com 23
Model Probit
Merupakan perkiraan/pendekatan untuk
R
2
seperti pada regresi OLS pada model
non linier. (pada model non linier tidak
bisa dihitung R
2
scr langsung spt pada
model regresi OLS).
Terdapat banyak jenis pseudo R
2
, dan
masing-masing akan memberikan nilai
perkiraan yg berbeda
GRE & GPA
signifikan
mempengaruhi
status pendaftaran
siswa di PT
Nilai koef. tdk bisa diinterpretasikan spt pd regresi OLS
Interpretasi dpt dilakukan melalui probit index atau Z-
score
Contoh: untuk setiap kenaikan skor GRE, akan
menaikkan Z-score sebesar 0,002
Agung Priyo Utomo - agungpu@gmail.com 24
Cautions !
Ukuran sampel: Baik model logit maupun probit
memerlukan jumlah sampel yg lebih banyak
dibandingkan regresi OLS, karena keduanya
menggunakan metode MLE
Sel kosong/sedikit: jika terdapat sel kosong atau hanya
sedikit frekuensinya, maka kedua model tdk bisa
digunakan/dijalankan
Pseudo R
2
: nilai ini tdk sama dg R
2
pada OLS, ada
banyak jenis pseudo R
2

Diagnosa: pada model probit pemeriksaan asumsi
dilakukan seperti pada model logit.

Вам также может понравиться