Вы находитесь на странице: 1из 24

ANALISIS SOAL

TRISTIANA ERAWATI – LP3UA


Tujuan Dilakukan Analisis Soal
TES OBJEKTIF

• Mengetahui kekuatan & kelemahan butir soal


• Memudahkan menyusun perangkat soal
• Mengetahui masalah dalam butir soal
• Bank soal
• Menyusun beberapa perangkat soal 
JENIS, TUJUAN
FAKTOR ANALISIS SOAL

• Analisis butir soal


– Tingkat kesukaran
– Daya beda butir soal
– Berfungsi tidaknya pilihan (DISTRAKTOR)

• Analisis perangkat soal (naskah ujian)


– Validitas
– Reliabilitas
1. Tingkat Kesukaran
Butir Soal
Proporsi peserta tes menjawab benar
terhadap butir soal tersebut

Tingkat Kesukaran berkisar 0,0 - 1,0

0,0 = Tak seorangpun menjawab benar


1,0 = semua peserta menjawab benar

Jumlah yg menjawab benar


b atau p =
Jumlah seluruh peserta tes
Tingkat Kesukaran
Perangkat/Naskah Soal

 b
P=
N
P = Tingkat kesukaran naskah soal
b = Tingkat kesukaran butir soal
N = Jumlah butir soal

Tingkat Kesukaran Nilai P


Sukar 0,00 - 0,25
Sedang 0,26 - 0,75
Mudah 0,76 - 1,00
2. Daya beda
Indeks  kemampuan butir soal membedakan
kelompok prestasi tinggi dgn prestasi rendah

Ba - Bb
D =
0,5 T
D = Daya beda
Ba = Jml Kel Atas menjawab benar
Bb = Jml Kel Bawah menjawab benar
T = Jumlah peserta Tes

Kisaran: + 1.0 s/d - 1.0 ( ± 0.25 )


Langkah-langkah Mengkalkulasi
Daya Beda
• Peserta disusun berurutan berdasar skornya
• Peserta dibagi menjadi 2 kelompok yg sama
• Dihitung jumlah kelompok Atas / Bawah yang
menjawab benar
• Kalkulasi proporsi peserta yang menjawab
benar
• Kurangi proporsi kelompok Atas dari
kelompok Bawah  indeks
CONTOH PERHITUNGAN
KELOMOK ATAS: KELOMPOK BAWAH:
GANI 10 HAMID 7
SISI 9 ADAM 6
LINA 8 JONI 5
HARI 7 LISA 4
ANA 7 NINA 4
soal no. 4 soal no. 4
5 orang menjawab benar 2 orang menjawab benar
 Proporsi = 1,0  Proporsi = 0,4

DAYA BEDA (soal no. 4) = 1,0 – 0,4 = 0,6


ATAU :
5-2
D = = 0,6
0,5 x 10

JIKA JUMLAH PESERTA GANJIL MAKA DATA


SATU PESERTA DIURUTAN TENGAH TIDAK
DIGUNAKAN
Tabel Flanagan
(Indeks Pembeda)

• 0,61 – 0,80 : tinggi


• 0,41 – 0,60 : sedang
• 0,20 – 0,40 : rendah

( ≥ + 0.25 )
3. Berfungsi tidaknya pilihan

Pilihan
A B C D* E
Kelompok
Atas 0 1 1 1 2

Bawah 0 1 2 1 1

Jumlah 0 2 3 2 3
Pilihan
A* B C D E
Kelompok
Atas 1 1 2 0 1

Bawah 2 0 1 1 1

Jumlah 3 1 3 1 2
Pilihan
A B* C D E
Kelompok
Atas 0 4 1 0 0

Bawah 1 1 1 1 1

Jumlah 1 5 2 1 1
4. Reliabilitas Perangkat Tes
• Seberapa jauh alat ukur (skor) benar - benar
menggambarkan tingkat kemampuan mhs.
 keajekan alat ukur
(Korelasi 2X tes pd peserta yg sama)

Unsur Error al :
– Butir tes mendua
– tes terlalu sukar  menebak
– jumlah tes sedikit
ANALISIS SOAL DENGAN
METODE “ITEMAN”
Harga : menggambarkan konsistensi skor tes 
naskah dapat diandalkan (reliable). Semakin
tinggi (>0,5) berarti naskah dapat diandalkan
Nilai P: menggambarkan kesukaran perangkat tes
Yang baik adalah 0,5 (kesukaran sedang).
Semakin kecil nilainya, tingkat kesukaran
semakin tinggi
Nilai Biser: menggambarkan daya beda naskah.
Perangkat tes mempunyai daya beda yang
baik bila memilik poin biser lebih dari +0,25.
Berfungsi tidaknya distraktor:

Diperoleh dari data prop. endorsing pada


tiap option/distraktor

Distraktor tidak berfungsi jika prop. endorsing


< 0,100 (atau <10% peserta yang memilih
option tersebut)
Tidak berfungsinya distraktor dapat
dikarenakan:

• Tidak homogen
• Peserta tes benar-benar pintar, sehingga
benar-benar dapat membedakan kunci
dengan distraktor
Daya beda butir soal:

Diperoleh dari data point biser tiap butir


soal

Daya beda yang baik bila memiliki point


biser lebih dari + 0.25

Bila kurang maka butir soal tersebut tidak


mampu membedakan antara anak yang
pintar dan tidak pintar
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Item analysis for data from file dodo.TXT

Item Statistics Alternative Statistics


----------------------- -----------------------------------
Seq. Scale Prop. Point Prop. Point
No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key
---- ----- ------- ------ ------ ----- --------- ------ ------ ---
51 0-1 0.272 0.425 0.317 A 0.092 -0.137 -0.078
B 0.330 -0.237 -0.182
C 0.136 -0.067 -0.042
D 0.272 0.425 0.317 *
E 0.101 0.093 0.054
Other 0.069 -0.262 -0.137

52 0-2 0.264 0.371 0.275 A 0.124 -0.160 -0.099


B 0.247 -0.057 -0.041
C 0.264 0.371 0.275 *
D 0.146 0.033 0.022
E 0.087 -0.048 -0.027
Other 0.132 -0.331 -0.209
Item Statistics Alternative Statistics
----------------------- -----------------------------------
Seq. Scale Prop. Point Prop. Point
No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key
---- ----- ------- ------ ------ ----- --------- ------ ------ ---
65 0-15 0.286 0.048 0.036 A 0.138 0.013 0.008
B 0.103 -0.060 -0.036
CHECK THE KEY C 0.287 0.157 0.118 ?
D was specified, C works better D 0.286 0.048 0.036 *
E 0.090 0.031 0.018
Other 0.096 -0.394 -0.228
There were 1414 examinees in the data file.
Scale Statistics
----------------
Scale: 0
-------
N of Items 50
N of Examinees 1414
Mean 14.929
Variance 28.653
Std. Dev. 5.353
Skew 0.615
Kurtosis 0.417
Minimum 2.000
Maximum 35.000
Median 14.000
Alpha 0.678
SEM 3.036
Mean P 0.299
Mean Item-Tot. 0.239
Mean Biserial 0.322
5. Validitas Perangkat Tes

• Seberapa jauh perangkat tes berguna


dlm mengambil keputusan sesuai dg
tujuan (bidang studi).

• Validitas isi tes  penilai ahli


dibidangnya.
TES SUBYEKTIF

1. KEJELASAN KALIMAT
2. VALIDITAS
3. KETEPATAN MARKING SCHEME
(KATA KUNCI, PEMBOBOTAN)
4. ALOKASI WAKTU DAN NILAI
TERIMAKASIH

Вам также может понравиться