Вы находитесь на странице: 1из 15

BAHAN AJAR

PENDAMPINGAN K-13

ANALISIS BUTIR INSTRUMEN

A. Pendahuluan
Kurikulum 2013 menghendaki proses pembelajaran menggunakan pendekatan
saintifik (Mengamati, Menanya, Mengolah, Menyajikan, Menyimpulkan dan
Mencipta), menggunakan ilmu pengetahuan sebagai penggerak pembelajaran untuk
semua mata pelajaran, Menuntun siswa untuk mencari tahu, bukan diberi tahu
(discovery learning). Di dalam proses penilaian yang diukur dalam kurikulum 2013
adalah tingkat berpikir siswa mulai dari rendah sampai tinggi, sedangkan proses
pembelajarannya salah satunya menekankan kemampuan berpikir kreatif. Berpikir
kreatif merupakan bagian dari berpikir tingkat tinggi (Higher OrderThinking Skills
(HOTS)).
Untuk dapat mengembangkan proses pembelajaran yang mendukung
peningkatan berpikir kreatif, maka guru dituntut untuk mampu mengembangkan
instrument penilaian berbasis HOTS. DDTK Penilaian Berbasis HOTS ini akan
membahas penilaian pendidikan secara umum dengan lebih ditekankan pada
penyusunan instrument penilaian berbasis HOTS.

B. Indikator Keberhasilan
a. Menjelaskan analisis butir soal secara kualitatif
b. Menjelaskan analisis butir soal secara kualitatif
c. Menjelaskan validitas butir
d. Menjelaskan reliabilitas butir
e. Menjelaskan tingkat kesukaran butir
f. Menjelaskan daya pembeda butir
g. Melakukan analisis butir dengan aplikasi
C. Uraian Materi

Setelah instrumen selesai ditulis, langkah selanjutnya adalah mengujicobakannya. Data


skor hasil uji coba inilah yang akan kita gunakan sebagai bahan untuk melakukan
analisis terhadap butir tes yang kita susun.
Analisis terhadap butir soal yang kita susun bertujuan untuk mengetahui
kualitasnya. Analisis butir soal dilakukan dengan melihat tingkat validitas, reliabelitas,
daya pembeda dan tingkat kesukarannya.
a. Validitas Butir
Suatu alat pengukur dikatakan valid jika ia benar-benar cocok untuk
mengukur apa yang hendak diukur. Sebagaimana dikemukakan oleh Scarvia B.
Anderson dalam bukunya "Encyclopedia of Educational Evaluation" disebutkan
bahwa "A test is valid it measures what it purpose to measure" (sebuah tes
dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur). Dalam
bahasa Indonesia "valid" disebut dengan istilah "sahih".
Validitas butir dibedakan menjadi tiga macam, yaitu validitas isi, validitas
konsep (konstruk), dan validitas empirik. Validitas isi terkait ketepatan dan
kesesuaian isi. Kesesuian isi dapat dilihat dari kesesuaian butir instrumen yang kita
tulis dengan tuntutan kompetensi pada standar isi (KI, KD, Indikator) dan ketepatan
konsep materi yang akan dinilai.
Validitas konstruk merupakan validitas butir terkait kanstruksi bagaimana
kalimat pada butir terbentuk. Penggunaan kata baku, keefektifan kalimat, dan
kejelasan maksud butir menjadi perimbangan untama dalam validitas kanstruk.
Dengan kata lain validasi konstruk terkait kebahasaan. Oleh sebab itu proses validasi
butir terkait validitas konstruk biasanya melibatkan para ahli bahasa.
Validitas empirik terdiri dari 3 (tiga) validitas, yaitu Validitas Pengukuran
Setara (congruent validity), Validitas Pengukuran Serentak (concurent validity),
dan Validitas prediksi (predictive validity),

1) Validitas pengukuran Setara (congruent validity)


Jenis kevalidan ini menunjukkan kenyataan yang diperoleh dengan
mengkorelasikan hasil suatu ujian dengan pengukuran yang setara (mengukur
fungsi yang sama). Sebagai contoh, mengkorelasikan hasil sebuah tes
intelegensi yang baru dengan hasil tes intelegensi yang sudah ada akan
memberikan kenyataan validitas jenis ini.

2) Validitas Pengukuran Serentak (concurrent validity)


Validitas konkuren atau validitas yang ada sekarang menunjuk pada
hubungan antara tes skor dengan yang dicapai pada keadaan sekarang.
Validitas ini dikenal sebagai validitas empiris. Sebuah tes dikatakan memiliki
validitas konkuren jika hasilnya sesuai dengan pengalaman.

3) Validitas Ramalan (predictive validity)


Validitas prediksi menunjukkan kepada hubungan antara tes skor yang
diperoleh peserta tes dengan keadaan yang akan terjadi diwaktu yang akan
datang. Sebuah tes dikatakan memiliki validitas prediksi apabila mempunyai
kemampuan untuk memprediksikan apa yang akan terjadi di masa yang akan
datang.

Setelah mengetahui berbagai bentuk validitas yang ada, kemudian


bagaimanakah cara mengukur validitas? Ada dua kemungkinan, jika instrumen
berbentuk dikotomi (mempunyai pola skor 0 atau 1) maka digunakan koefisien
korelasi biserial, dengan rumus:

_ _
𝑋𝑖 − 𝑋𝑡 𝑝𝑖
rbis(i) = √𝑞
𝑆𝑡 𝑖

Keterangan:
Rbis(i) = koefisien korelasi biserial antara skor butir soal no ke-I
_ dengan skor total
Xi = rata-rata skor total responden yang menjawab benar butir
_ soal nomor i
Xt = rata-rata skor total semua responden
St = standar deviasi skor total semua responden
pi = proporsi jawaban yang benar untuk butir soal nomor i
qi = proporsi jawaban yang benar untuk butir soal nomor i

Setelah didapatkan nilai r hitung, kemudian kita bandingkan dengan r tabel (ada
pada lampiran). Kemudian pemaknaannya adalah, jika rhitung > rtabel, maka
instrumen tersebut valid.
Contoh 4.5
Data hasil uji coba 7 butir soal pada 10 responden adalah sebagai berikut:

No. Nomor Butir


jml
Resp 1 2 3 4 5 6 7
1 1 1 1 1 0 0 0 4
2 1 1 0 1 1 1 0 5
3 0 1 1 1 0 0 0 3
4 1 1 0 0 0 0 0 2
5 0 1 0 0 0 0 0 1
6 1 1 1 1 1 1 1 7
7 1 1 1 1 1 1 0 6
8 0 0 0 0 0 0 0 0
9 1 1 0 0 1 0 0 3
10 1 1 1 1 1 0 0 5
jml. 7 9 5 6 5 3 1 36

Dari hasil hitungan didapat rbis sebagai berikut:

nomor 1 2 3 4 5 6 7
rbis(i) 0.704 0.57 0.66 0.81 0.76 0.75 0.54
r tabel 0.63 0.63 0.63 0.63 0.63 0.63 0.63

Dari hasil di atas, dapat disimpulkan bahwa butir soal nomor 2 dan 7 tidak valid,
sedangkan yang lainnya semuanya valid

Sedangkan untuk instrumen politomi (ada banyak kemungkinan skor), untuk


menentukan validitas alat ukur adalah dengan menggunakan korelasi product
moment dengan simpangan yang dikemukakan oleh Pearson berikut ini.

∑ 𝑥𝑦
rxy =
√(∑ 𝑥 2 )(∑ 𝑦 2 )
Dengan,
rxy : koefisien korelasi antara variabel x dan variabel y
_ _
(x = X - .X dan y = Y – Y)
∑ 𝐱𝐲 : jumlah perkalian antara x dan y
𝑥2 : kuadrat dari x
𝑦2 : kuadrat dari y

Setelah didapatkan nilai r hitung, kemudian kita bandingkan dengan r tabel


(ada pada lampiran). Kemudian pemaknaannya adalah, jika rhitung > rtabel,
maka instrumen tersebut valid.

Contoh 4.6
Misal X adalah nilai matematika pada suatu ulangan semester 1 kelas IX dan Y
adalah nilai matematika pada ujian akhir kelas IX. Akan dicari validitas dari
ujian tersebut.

Tabel IV .3: Hitungan untuk Koefisien Korelasi Product Moment

No Nama X Y x y x2 y2 xy

1 Mulida M 8 6 0,8 0 0,64 0 0


2 Wahyu A 7 6 -0,2 0 0,04 0 0
3 Irvan Aria A 6 4 -1,2 -2 1,44 4 2,4
4 Ivan Fajar A 7 6 -0,2 0 0,04 0 0
5 Axel Eka A 8 7 0,8 1 0,64 1 0,8
6 Faizana I 7 5 -0,2 -1 0,04 1 0,2
7 Christian G.H 6 5 -1,2 -1 1,44 1 1,2
8 Hilan A 8 7 0,8 1 0,64 1 0,8
9 Maulana M 7 7 -0,2 1 0,04 1 -0,2
10 Aditya AD 8 7 0,8 1 0,64 1 0,8
Jumlah 72 60 0 0 5,6 10 6
Rata-rata 7,2 6

∑ 𝒙𝒚 𝟔
rxy = = = 0,802
√(∑ 𝒙𝟐 )(∑ 𝒚𝟐 ) √𝟓,𝟔 ×𝟏𝟎

Hasil hitungan didapatkan r hitung adalah 0,802, sedangkan r tabel (derajat


bebas = N2=10-2=8, taraf signifikansi 0,05) adalah 0,707.

rhitung = 0,802 > rtabel = 0,707, maka instrumen tersebut dengan taraf signifikansi
0,05 adalah valid.

b. Reliabelitas Butir
Reliabilitas atau keajegan suatu skor sangat penting dalam menentukan apakah
tes telah menyajikan pengukuran yang baik atau belum. Besar kecilnya reliabilitas
suatu tes ditentukan oleh besar kecilnya nilai korelasi hasil tes yang dinamakan
dengan indeks atau koefisien reliabilitas. Pada umumnya untuk menentukan
estimasi reliabilitas khususnya dalam bidang pengukuran prestasi belajar
digunakan keajegan internal, seperti formula Alpha Cronbach ataupun
Kuder-Richardson. Tinggi rendahnya koefisien reliabilitas dipengaruhi beberapa
faktor, antara lain: panjang tes, kecepatan, homogenitas belahan, dan tingkat
kesukaran (Crocker dan Algina, 1986).
Makin tinggi koefisien reliabilitas semakin baik karena kemungkinan
kesalahan semakin kecil. Tidak ada angka koefisien batas yang pasti yang
dapat digunakan sebagai dasar untuk menentukan apakah suatu koefisien
reliabilitas hasil perhitungan menunjukkan reliabel atau tidak. Batas reliabilitas
bersifat sangat relatif akan sangat tergantung pada kepentingan penilai atau
pembuat instrumen. Gronlund (1985), mengatakan bahwa koefisien reliabilitas
untuk tes buatan guru sebesar 0,6 sudah cukup memadai. Sedangkan menurut
Nunnaly (1972) dan Kaplan (1989) dikatakan bahwa koefisien reliabilitas 0,70 s/d
0,80 dikatakan cukup tinggi. Namun secara umum reliabilitas sudah dianggap
memuaskan jika koefisien reliabilitasnya = 0,70.

Beberapa metode untuk menentukan reliabilitas adalah sebagai berikut:

Tabel IV.4 Metode untuk Menentukan Reliabilitas

METODE LANGKAH
Sajikan tes yang sama sebanyak
Test-retest methods (stabilitas)
dua kali kepada peserta tes yang
Pengkuran dengan produk momen
sama dalam waktu yang berbeda
dan korelasi intra kelas
dan tentukan korelasinya.
Paralel (ekuivalen) Sajikan dua tes yang sama kepada
Pengkuran dengan produk momen peserta tes yang sama dalam
dan korelasi intra kelas waktu yang relatif tidak lama
(misalnya dua minggu).
Korelasikan kedua skor tersebut
untuk mencari korelasinya.
Sajikan satu kali tes lalu
Split-half methods (belah dua)
dibelah dua, gunakan rumus
Pengkuran dengan persamaan split-
untuk mengkorelasikan kedua
half dan Spearman Brown
belahan.
Internal consistency Berikan sekali tes, gunakan rumus
Pengukuran dengan koefisien
alpha, Kuder-Richardson (K-20 dan
K-21)

Melihat dari metode untuk memperoleh reliabilitas dari berbagai bentuk reliabilitas
di atas, sepintas metode yang dianggap paling mudah dilaksanakan adalah internal
consistency, yaitu dengan melakukan sekali tes dan menggunakan persamaan yang
ada. Internal consistency didasarkan pada korelasi antar skor jawaban pada
setiap butir tes dengan skor total (Nunnaly, 1970). Teknik ini khususnya
digunakan pada butir soal yang dikotomi seperti soal pilihan ganda.

Berikut rumus-rumus untuk menentukan koefisien reliabilitas.


1) Koefisien alpha (Į) dari Cronbach
Koefisien alpha dihitung dengan menggunakan persamaan sebagai berikut:
Formula ini biasanya digunakan untuk mencari reliabilitas tes bentuk
politomi.

2) Formula Kuder-Richardson 20 (KR-20)

Untuk mencari koefisien reliabilitas tes bentuk objektif biasanya digunakan


rumus KR-20, sebagai berikut:
2
𝑘 𝑠𝑡− ∑ 𝑝𝑞
r11 = ( )
𝑘−1 𝑠𝑡2

r11 : reliabilitas tes dengan persamaan KR-20


𝑝 : proporsi peserta tes yang menjawab benar (tingkat kesukaran)
𝑞 : proporsi peserta tes yang menjawab salah (1 − 𝑝)
∑ 𝑝𝑞 : jumlah perkalian antara 𝑝 dan 𝑞
k : jumlah butir soal
2
𝑠𝑡 : varian total
𝑠 : standar deviasi atau simpangan baku
_
∑(𝑥𝑖 − 𝑥)2
Dengan persamaan: 𝑠=√
𝑁
_
Dengan N adalah jumlah peserta tes dan (𝑥𝑖 − 𝑥)2 adalah jumlah kuadrat
selisih skor masing-masing butir dan rerata.
Formula ini biasanya digunakan untuk mencari reliabilitas instrumen tes
bentuk pilihan ganda (dikotomi). Untuk membantu pemahaman Saudara
bagaimana mencari koefisien reliabilitas dengan menggunakan rumus KR-20,
perhatikan kasus berikut:
Contoh 4.7
Akan ditentukan koefisien reliabilitas dari 10 butir soal yang diujicobakan
kepada 10 siswa.

Tabel selengkapnya untuk perhitungan adalah sebagai berikut:

No Nama Nomor Soal Skor Deviasi Deviasi


dari mean
1 2 3 4 5 6 7 8 9 10 total Mean_ _
kuadrat
(x – x) (x – x)2

(1)(2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15)
1 Mulida M 1 1 1 1 1 1 1 1 0 0 8 1,4 1,96
2 Wahyu A 1 1 1 1 1 1 1 1 0 0 8 1,4 1,96
3 Irvan
Aria A 1 1 1 1 1 1 1 1 0 0 8 1,4 1,96
4 Ivan
Fajar A 1 1 1 1 1 1 0 1 0 0 7 0,4 0,16
5 Axel Eka 1 1 1 1 1 1 0 1 0 0 7 0,4 0,16
A
6 Faizana I 1 1 1 1 1 1 0 1 0 0 7 0,4 0,16
7 Christian
G.H 0 0 0 1 1 1 1 0 0 0 4 -2,6 6,76
8 Hilan A 1 1 0 0 0 1 1 0 0 0 4 -2,6 6,76
9 Maulana
M 1 1 1 1 0 0 0 1 1 1 7 0,4 0,16
10 Aditya 1 1 1 1 0 0 0 0 1 1 6 -0,6 0,36
AD
Jumlah 9 9 8 9 7 8 5 7 2 2 66 0 20,4
P 0,9 0,9 0,8 0,9 0,7 0,8 0,5 0,7 0,2 0,2
Q 0,1 0,1 0,2 0,1 0,3 0,2 0,5 0,3 0,8 0,8
Pq 0,09 0,09 0,16 0,09 0,21 0,16 0,25 0,21 0,16 0,16 1,58
Tabel IV.5 Contoh Hitungan untuk KR 20
Langkah-langkah perhitungannya adalah sebagai berikut:
a) Menentukan proporsi peserta tes (𝑝) yang menjawab benar, yaitu dengan
∑ 𝑥𝑖
remus : 𝑝 =
𝑁

𝑝 : proporsi peserta tes yang menjawab benar


∑ 𝑥𝑖 : adalah jumlah skor total untuk setiap jawaban
𝑁 : jumlah peserta tes

Pada kasus di atas, untuk jawaban no. 1 sampai 3:


∑ 𝑥1 9
𝑝1 = = = 0,9
𝑁 10
∑ 𝑥2 9
𝑝2 = = = 0,9
𝑁 10
∑ 𝑥3 8
𝑝3 = = = 0,8
𝑁 10
demikian juga untuk proporsi jawaban benar lainnya.
b) Menentukan proporsi peserta tes yang menjawab salah (𝑞), yaitu dengan
remus : 𝑞 = 1 − 𝑝
𝑞1 = 1 – 0,9 = 0,1
𝑞2 = 1 – 0,9 = 0,1
𝑞3 = 1 – 0,8 = 0,2
demikian juga untuk proporsi jawaban salah lainnya.
c) Mengalikan p dan q untuk semua soal kemudian dijumlahkan. Dari
hasil perhitungan diperoleh ∑ 𝑝𝑞 = 1,58 (lihat kolom 13 pada tabel).
∑𝑋
d) Menentukan jumlah rerata skor dengan persamaan M = dengan
𝑁
M : rata-rata skor
N : banyaknya peserta tes
∑𝑋 : jumlah skor total
66
Dari contoh tersebut di atas, M = = 6,6
10

e) Menentukan deviasi dari mean kuadrat (kolom 14 pada tabel). Jika


dijumlahkan jumlahnya harus nol.
f) Menentukan deviasi dari mean kuadrat (kolom 15 pada tabel) kemudian
jumlahkan. Dari hasil perhitungan diperoleh 20,4.

20,4
g) Menentukan standar deviasi dengan persamaan 𝑠=√ sehingga 𝑠2=
10

2,04
h) Menentukan koefisien reliabilitas dengan memasukkan angka yang
telah diperoleh, yaitu:
2
𝑘 𝑠𝑡− ∑ 𝑝𝑞
r11 = ( )
𝑘−1 𝑠𝑡2

10 2,04−1,58
r11 = ( )
10−1 2,04

r11 = 0,25054467
Dari contoh yang disajikan, nilai koefisien reliabiltas dari 10 soal yang
telah diujicobakan kepada 10 siswa adalah 0,25, sehingga soal tersebut
kurang reliabel.

3) Formula Kuder-Richardson 21 (KR-21)


Untuk mencari koefisien reliabilitas tes bentuk objektif dapat pula
digunakan rumus KR-21 sebagai berikut:

𝒌 𝑴 ( 𝒌−𝑴)
r11 = (1 - )
𝒌−𝟏 𝒌𝒔𝟐𝒕

dengan,
k : jumlah butir soal
M : rata - rata skor

𝑠𝑡2 : Varian total

Pada umumnya perhitungan menggunakan formula KR-20 hasilnya lebih


akurat dibandingkan perhitungan menggunakan formula KR-21.
Penghitungan reliabilitas dengan memanfaatkan software dapat Saudara
baca pada modul Suplemen Diklat Teknis Substantif “Pemanfaatan
Program Komputer untuk Analisis Butir Soal dan Pengolahan Nilai”.
c. Tingkat Kesukaran dan Daya Pembeda
Butir soal seharusnya tidak dibuat terlalu mudah ataupun terlalu sukar
sehingga tidak bisa membedakan antara siswa yang pandai dan siswa yang
kurang pandai. Kemampuan butir soal untuk membedakan siswa yang pandai
dengan siswa yang kurang pandai disebut daya pembeda. Sedangkan tingkat
kesukaran butir soal adalah proporsi siswa yang menjawab benar butir soal yang
dimaksud.
Cara mencari Tingkat Kesukaran (TK) dan Daya Pembeda (DP) suatu item
dapat dilakukan dengan menganilis item. Caranya dalah:
1) Menyusun skor siswa. Urutkan dimulai dari skor paling tinggi sampai dengan
paling rendah.
2) Hitung 27% siswa dari atas yang selanjutnya disebut kelompok atas, dan
hitung 27% siswa dari bawah dan selanjutnysa disebut kelompok bawah.
3) Menentukan Tingkat Kesukaran dengan menggunakan rumus:

𝐵𝐴+𝐵𝐵
TK =
𝑁𝐴+𝑁𝐵
Dengan,
BA : jumlah siswa yang menjawab benar pada kelompok atas
BB : jumlah siswa yang men jawab benar pada kelompok bawah
NA : jumlah siswa pada kelompok atas
NB : jumlah siswa pada kelompok bawah

4) Menentukan Daya Pembeda dengan menggunakan rumus:


𝐵𝐴−𝐵𝐵
DP = 1
(𝑁𝐴+𝑁𝐵)
2
DP : daya pembeda
Contoh: Diketahui data skor ulangan matematika 40 siswa setelah diurutkan
dan data skor untuk butir nomor 5 sebagai berikut:

Siswa … Skor Butir … Skor


No. 5 Total

1. 1 40

2. 1 40

3. 1 38

4. 1 36

5. 0 35

6. 1 32 27%
7. 0 28

Dari data dapat


dihitung:
8. 1 28

9. 1 27

10. 0 27

11. 1 27

… … … … …

30. 0 19

31. 0 19

32. 1 18

33. 0 17

34. 1 17

35. 0 16

36. 0 16

37. 0 13

38. 1 12

39. 0 10

40. 1 7

Tabel IV. 6 Contoh Pembagian Kelompok Atas dan Bawah

𝐵𝐴+𝐵𝐵 8+4
Tingkat Kesukaran (TK) = = = 0,545
𝑁𝐴+𝑁𝐵 11+11

𝐵𝐴−𝐵𝐵 8−4
Daya Pembeda (DB) = 1 =1 = 0,363
2
(𝑁𝐴+𝑁𝐵) 2
(11+11)
Interpretasi:
Tingkat Kesukaran (TK):
TK = 0 – 0,30 tingkat kesukaran soal sukar/tinggi
TK = 0,31 – 0,70 : tingkat kesukaran soal sedang
TK = 0,71 – 1,00 : tingkat kesukaran soal rendah/mudah

Daya Pembeda (DB):

1. DP 0,70 sampai 1,00 adalah baik sekali


2. DP 0,40 sampai 0,69 adalah baik
3. DP 0,20 sampai 0,39 adalah cukup
4. DP 0,00 sampai 0,19 adalah jelek
5. DP negatif (minus) adalah jelek sekali

Kesimpulan:
Butir soal nomor 5 mempunyai tingkat kesukaran 0,545 (sedang) dan daya
pembeda 0,363 (cukup baik)

Angka yang menunjukkan daya pembeda disebut indek


DESCRIMINATIONS (D). Indek deskrimination berkisar antara 0 sampai 1.
Pada daya pembeda ada tanda negatif (-) , sedang pada tingkat kesukaran
tidak mengenal tanda negatif. Tanda negatif digunakan bila soal terbalik,
maksudnya anak pandai disebut kurang dan sebaliknya. Daya pembeda dengan
hasil +1 berarti seluruh kelompok atas menjawab benar terhadap butir soal itu
sedang seluruh kelompok bawah menjawab salah terhadap butir soal itu. Daya
pembeda -1 berarti sebaliknya.

Berdasarkan hasil analisis butir soal hasil ujicoba kemudian dilakukan


perbaikan. Berbagai bagian tes yang masih kurang memenuhi standar kualitas yang
diharapkan perlu diperbaiki sehingga diperoleh perangkat tes yang lebih baik.
Untuk soal yang sudah baik tidak perlu lagi dibenahi, tetapi soal yang masuk
kategori tidak bagus harus dibuang karena tidak memenuhi standar kualitas.
Beberapa hal yang sering menjadi pertimbangan baik tidaknya butir tes antara lain:
tingakt kesukaran soal terlalu tinggi (TK mendekati 0: soal terlalu sukar) atau
terlalu rendah (mendekati 1: soal terlalu mudah); daya pembeda terlalu rendah (DP
mendekati 0) atau bahkan jika DP bernilai negative maka butir harus dibuang.

Setelah tersusun butir soal yang bagus, kemudian butir soal tersebut disusun
kembali untuk menjadi perangkat instrumen tes, sehingga instrumen tes siap
digunakan. Perangkat tes yang telah digunakan dapat dimasukkan ke dalam bank soal
sehingga suatu saat nanti bisa digunakan lagi.
DAFTAR PUSTAKA

Allen, M.J., &Yen,W. M. (1979). Introduction to measurement theory. Monterey,


California: Brooks/Cole Publishing Company.

Crocker, L. & Algina, J. 1986. Introduction to Classical and Modern Tes Theory.
New York: Holt, Rinehart and Winston, Inc.

Departemen Pendidikan Nasional, (2006), Kurikulum 2004, Standar Isi.


Jakarta : Departemen Pendidikan.

Departemen Pendidikan Nasional, (2004). “Kurikulum 2004 Standar Kompetensi


Sekolah Menengah Atas”. Jakarta

Djemari Mardapi. 2008. Teknik Penyusunan Instrumen Tes dan Non Tes. Yogyakarta:
Mitra Cendikia Offset

Ebel, R. L. (1979). Essentials of education measurement. New Jersey: Prentice Hall.

Eko Haryono. 2011. Efektivitas Pembelajaran Matematika Berbasis Mind Map


Methode dengan Menggunakan Media Grafis Komik dalam Meningkatkan
Kreativitas Berpikir Siswa Kelas VII SMP Muhammadiyah 3 Depok Sleman.
Skripsi Prodi Pendidikan Matematika Fakultas Sainteks UIN Sunan Kalijaga
Yogyakarta.

Gronlund, N. E., dan Linn, R. L. (1990). Measurement and evaluation in teaching. New
York: McMillian Publishing Company.

Guion, R.M. 1977. Content Validity, The Source of My Discontent, Applied


Psychological Measurement, 1.1-10

Ismul Fariks. 2007. Upaya Meningkatkan Kemampuan Berpikir Kritis dan Kreatif
Siswa Kelas X MA Wahid Hasyim Sleman Dalam Pembelajaran Matematika
Dengan Pendekatan Open Ended. Yogyakarta: Skripsi pada Prodi Guruan
Mat em at i ka F akul t a s S ai nt eks U IN S una n Kal i j aga Yo g yak ar t a

Messick, S. 1995. Validity of Psychological Assessment, Validation of Inferences


from Persons' Responses and Performances as Scientific Inquiry Into Score
Meaning. American psychologist

Nathan, B. R. & Cascio, W. F. (1986). Technical and legal aspects in Berk, R. A. (edit.
1986). Performance assessment. Baltimore:Nunnaly, J.C. 1970. Introduction
to Psychological Measurement, International Student Edition. New York:
MacGraw Hill Book Company

Sumarna Surapranata. 2004. Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil


Tes Implementasi Kurikulum 2004. Bandung: PT Remaja Rosdakarya

Вам также может понравиться