Вы находитесь на странице: 1из 10

PENELITIAN 2

Metode Sampel. Penelitian ini dirancang sebagai suatu pengulangan dari penelitian pertama, telah diselenggarakan pada 101 sampel siswa kelas tujuh dan siswa kelas delapan yang belajar pada dua lingkungan sekolah yang berdekatan (yaitu, kelas menengah, n = 62, kelas lebih rendah, n = 39) di Israel utara. Sampel dibagi menurut jenis kelamin (anak laki-laki 47%, anak perempuan 53%) dan menurut tingkatan (tingkat tujuh terdiri dari 54%, tingkat delapan terdiri dari 46%).

Instrumen dan Prosedur Skala rating diferensial semantik. Pertama, siswa diminta untuk mengevaluasi bentuk ujian pilihan ganda dengan bentuk ujian essai untuk membandingkannya dengan menggunakan sepuluh dimensi yang sama seperti yang digunakan dalam penelitian 1 (lihat bagian metoda, studi 1). Bagaimanapun, untuk tujuan validitas dalam penelitian ini ditampilkan tujuh langkah rangkaian skala diferensial semantik (osgood dan tannenbaum, 1957), mengakurkan pasangan kata sifat berikut : susah/gampang, rumit/simpel, tidak jelas/jelas, tidak tidak menyenangkan/menyenangkan, licik/tidak licik, tidak merata/merata,

berharga/berharga, pengharapan keberhasilan rendah/pengharapan keberhasilan tinggi, secara maksimal/secara minimal membangkitkan ketertarikan, merasakan tidak gelisah saat menghadapi ujian/merasakan gelisah saat menghadapi ujian. Skala rating komparatif. Seperti penelitian 1, siswa diminta untuk membandingkan dan memilih antara bentuk ujian essai dan pilihan ganda dengan menggunakan tujuh kriteria berikut: (a) masalah persiapan untuk menghadapi ujian, (b) ketepatan dalam merefleksikan pengetahuan, (c) kemudahan dalam menggunakan, (d) keberhasilan yang diharapkan, (e) tingkat kejujuran, (f) tingkat kegelisahan, (g) tingkat kesukaan secara keseluruhan. Berbeda dengan penelitian 1, para siswa tidak perlu menjelaskan pilihan mereka.

Sebagai tambahan, para siswa mengisi suatu inventori data pribadi dan menilai diri mereka berkenaan dengan prestasi suatu pelajaran dengan menggunakan skala lima nilai (5 = sangat banyak di atas rata-rata, 1 = sangat banyak di bawah rata-rata). Hasil Rating Skala Diferensial Semantik. Tabel 2 menunjukkan rata-rata dan standar deviasi untuk rating skala diferensial semantik dalam bentuk essai serta dalam bentuk pilihan ganda. Keseluruhan, rata-rata skor sikap gabungan (rata-rata kombinasi linear pada rating skala diferensial semantik) secara signifikan lebih tinggi untuk pilihan ganda daripada dalam ujian bentuk essai (5,44 > 4,11), t(99) = 8,55, p < .001. Dengan memperhatikan pada skala spesifik, sebagaimana ditunjukkan pada tabel 2, ujian pilihan ganda relatif terhadap ujian bentuk essai, secara signifikan dipandang lebih mudah (5,70 > 3,30), kurang rumit (4,48 > 2,91), lebih jelas (6,01 > 4,94), lebih menarik (6,01 > 5,01), kurang sulit (4,82 > 4.00), lebih adil (5.79 > 5.40), menimbulkan pengharapan kesuksesan yang lebih tinggi (5,23 > 3,35), menimbulkan sedikit kurang ketertarikan (5,25 > 2,78), dan membuat siswa merasa lebih mudah (5,28 > 3,65) selama ujian. Jadi, dengan menyampingkan nilai yang diterima, format ujian pilihan ganda dinilai lebih diminati daripada ujian bentuk essai pada 8 dari skala 10 yang dimasukan dalam inventori. Suatu analisis varians (ANOVA) untuk pengaruh jenis kelamin, latar belakang sosial (kerugian vs menguntungkandinilai melalui kriteria official yang digunakan oleh Menteri Pendidikan dalam mengklasifikasi populasi sekolah) dan pengaruh jenis kelamin tertentu lawan interaksi latar belakang sosial seluruhnya disajikan menjadi tidak signifikan. Karena, antara kerugian (5,64 > 3,94), t(38) = 6.94, p < ,001, dan kelas menengah (5,32 > 4,21), t(60) = 5,49, p < ,0001, siswa menyukai pilihan ganda essai. Dengan mengambil hal yang sama, anak laki-laki (5,31 > 4,15), t(44) = 6,10, p < ,001) dan anak perempuan (5,53 > 4,13), t(51) = 5,81, p < ,001), keduanya lebih menyukai pilihan ganda daripada essai. Selanjutnya, rating siswa yang diterima mereka diatas rata-rata dan penerimaan mereka secara

identik di bawah rata-rata yang sebenarnya. Jadi, sikap siswa terhadap variasi format test tidak berhubungan dengan gender, latar belakang sosial, dan prestasi kelas yang dinginkan. Perbandingan langsung antara ujian essai dan pilihan ganda. Ujian bentuk pilihan ganda dinilai sebanyak 80 persen responden menjadi lebih mudah bila dibandingkan dengan ujian bentuk essai dan dipercaya membangkitkan harapan sukses yang lebih tinggi oleh sekitar tiga kuartal sampel dengan baik. Selanjutnya, 83 persen sampel dilaporkan bahwa ujian bentuk pilihan ganda kurang membangkitkan kegelisahan bila dibandingkan dengan ujian bentuk essai. Sekitar 83 persen responden dilaporkan seluruhnya lebih menyukai ujian bentuk pilihan ganda. Oleh karena itu, ujian bentuk essai dinilai lebih valid dan mengukur sesuai isi materi subjek oleh mayoritas (66%), dan oleh mayoritas sedikit (56%) juga memandang bentuk tes essai sebagai pengukuran sedikit lebih adil yang lebih baik. Selain itu, data dari penelitian ini membuktikan sikap siswa lebih menyenangi terhadap pilihan ganda daripada essai dengan pertimbangan sebagian besar kriteria, kecuali pada penerimaam nilai, kejujuran dan validitas dalam menilai pengetahuan siswanya. PEMBAHASAN UMUM Secara keseluruhan, data yang ditunjukkan untuk dua bidang penelitian independen yang terdapat di dalam riset ini sangat konsisten, dengan variasi berbagai fakta yang mengindikasikan bahwa ujian bentuk pilihan ganda pada umumnya diterima lebih disukai daripada bentuk essai dalam berbagai item dimensi penilaian. Pengamatan preferensi untuk ujian bentuk pilihan ganda dianggap benar untuk siswa dengan variasi gender dan latar belakang sosial. Dalam kedua studi, format pilihan ganda dan format essai diterima dengan sangat berbeda. Pilihan ganda lebih disenangi dalam dimensi kesulitan yang dirasakan, kegelisahan, harapan sukses, kompleksitas dan perasaan mudah dengan format. Dalam kedua studi juga, perbedaan terkecil antara kedua format dibuktikan pada dimensi kesulitan, kesenangan dan nilai/ harga yang dirasakan. Lebih lanjut , siswa merasa

ujian essai lebih tepat daripada ujian pilihan ganda untuk tujuan merefleksikan pengetahuan seseorang dalam subjek persoalan yang diujikan. Dari sudut pandang metodologi, harus dipegang dalam pikiran bahwa sampel siswa tidak digambarkan secara acak dan riset dilakukan hanya di antara siswa sekolah menengah pertama. Hal tersebut mungkin akan lebih baik jika perbedaan hasil diperoleh untuk kelompok usia lainnya serta siswa dengan setting budaya atau pendidikan yang berbeda. Oleh karena itu, riset lebih lanjut dibutuhkan untuk memperluas validitas penemuan yang dimiliki kelompok usia tertentu yang diteliti dan setting budaya dan pendidikan tertentu yang mana penelitian ini diperluas. Keberatan pemikiran dalam hal metodologi, data secara jelas

mengindikasikan bahwa siswa menerima item-item pilihan ganda lebih disenangi daripada item-item bentuk essai. Anehnya, beberapa tahun lalu sedikit, test tipe pilihan ganda telah menjadi target severe public dan professional pada berbagai bidang (contohnya,gagal untuk mengukur kognitif yang lebih tinggi atau proses psikologis,menghambat kreatifitas ujian, menempatkan terlalu banyak penekanan pada kecepatan dan hapalan, dan sebagainya; cf. Allen & Yen, 1979). Memang, sikap dan profile semantik pada ujian pilihan ganda muncul dari perspektif peserta uji yang secara luas bervariasi dengan ketidaksenangan dan profil negatif tidak dari ujian pilihan ganda sering muncul dari beberapa literatur anti-tes. Ahli penilaian pendidikan terlihat untuk menyetujui bahwa sikap peserta uji, persepsi dan disposisi motivasi dengan tanggapan pada ujian kelas seharusnya diberikan pertimbangan dan beratnya ketentuan penilaian sebuah tes menghadapi validitas atau dalam menentukan kebijakan dan prosedur pengujian (Nevo, 1985). Diasumsikan bahwa umpan balik peserta uji secara langsung mendukung berbagai macam segi dalam ujian kelas, atau komponen konstituen, yang secara potensial dapat menilai sumber informasi tentang tes untuk keduanya yaitu guru dan ahli tes. Dalam hal ini, masuk akal bahwa sikap para siswa dan persepsi tentang bentuk tes merupakan faktor penting dalam mempengaruhi perilaku persiapan tes siswa; kerjasama para siswa dan motivasi tes selama ujian, dan mungkin mempengaruhi

tingkat prestasi tes siswa dan hasil yang dicapai pada ujian. Jika pengujian secara aktual menerima bentuk tes khusus yang jelas dapat menyenangkan, dan motivasi yang optimal akan ditingkatkan, sedangkan reaksi penolakan emosional dan penurunan disposisi motivasional akan dikurangi. Bahkan, preferensi yang paling kuat untuk peserta uji pada pilihan ganda melebihi format essai, faktanya dalam riset ini perlu untuk diberikan pertimbangan yang cermat oleh guru selama tahapan inisial dalam perencanaan ujian kelas, khususnya ketika menentukan format item yang tepat untuk tes yang direncanakan. Lebih lanjut, sikap dan persepsi siswa dengan perhatian terhadap bentuk tes merupakan bagian informasi penting bagi guru dan ahli penilaian, karena hal tersebut perlu sebagai indikator dari suatu tes yang menghadapi validitas dari sudut pandang yang sangat dipengaruhi oleh hasil tes, yaitu, siswa peserta ujian. Seperti ditunjukkan dalam literatur, konsep melakukan validitas menyiratkan bahwa sebuah tes tidak hanya menjadi valid dari suatu isi, konstruk ataupun prediktif dari sudut pandang validitas, namun juga muncul menjadi valid pada varietas penilaian mencakup pengambil tes (nevo, 1985). Suatu tes yang mengambil sudut pandang peserta uji dalam pertimbangan, semuanya adalah sama, juga diperkirakan faktafakta utama menghadapi validitas juga. Jadi, terlihat penting bagi guru yang secara rutin menilai validitas dari instrumennya, berdasarkan perspektif peserta ujian. Secara umum, guru mungkin mendapatkan keuntungan dari administrasi rutin pada inventori sikap tes yang direncanakan untuk mengukur sikap-sikap siswa dan disposisi terhadap berbagai macam segi ujian kelas (misalnya, format, batas waktu, instruksi, wording, dan lain sebagainya). Penggunaan inventori sikap tes pada skala besar dan mendasar rutin di dalam kelas dapat mengisi celah kebutuhan untuk suatu pendekatan penilaian validitas dari ujian kelas dan komponen konstituennya, memberikan guru dan peneliti pendidikan dengan memanfaatkan informasi tentang kunci dimensional dalam kondisi tes berdasarkan sudut pandang peserta ujiannya. Lebih lanjut, informasi diperoleh melalui inventori sikap tes yang dapat membantu para guru mengidentifikasi area problem yang spesifik pada pengujian kelas dan

menggunakan informasi tersebut untuk memodifikasi atau memperbaiki kondisi ujian tertentu yang dirasakan menjadi permasalahan dari sudut pandang peserta ujian. Selanjutnya, umpan balik ujian yang muncul menjadi sesuatu yang sangat bernilai yang sebelumnya mengabaikan sumber-sumber informasi tentang kualitas subjektif dari suatu ujian kelas atau komponennya.

Analisis Studi TUJUAN/JUSTIFIKASI Tujuan dari studi ini adalah secara jelas menyatakan : untuk menentukan kesukaan siswa SMP terhadap bentuk ujian pilihan ganda atau bentuk essai (dan untuk mengembangkan instrumen lebih lanjut yang digunakan dalam penilaian preferensi).Menurut penilaian kami, pengarang cukup bergantung pada pentingnya informasi, walaupun dia harus memasukkan perincian besar mengapa pengarang mempercayai sikap siswa terhadap ujian adalah penting, kiranya karena sikap mereka dapat mempengaruhi respon mereka. Dalam fakta, argumen ini secara aktual dibahas lebih lanjut pada bagian pembahasan dalam laporan. DEFINISI Tidak ada definisi formal, yang diberikan. Oleh karena itu, pengarang menguraikan, format pengujian yang kelihatan bagi kita cukup, namun disposisi dan sikap siswa harus didefinisikan. Apakah mereka berbeda? Pada kenyataannya, siswa diminta untuk menilai beberapa dimensi dari dua format yang berbeda sebagaimana yang mereka terima. Dimensi kemudahan, kompleksitas, kejelasan, ketertarikan, kesulitan, keterbukaan, nilai, harapan keberhasilan, membangkitkan kegelisahan, format yang mudah, refleksi pengetahuan, kemudahan dan kecemasan. Dimensi-dimensi ini seharusnya diberikan kepada para pembcar pada permulaan. RISET UTAMA Pengarang mengatakan bahwa hubungan riset utama secara langsung adalah sejumlah kecil dari penelitian dan kemudian mengatakan dua publikasinya.

Pembaca berhak untuk memperkirakan bahwa penelitian-penelitian ini dipandang kurang jelas dan hasilnya sangat ringkas. HIPOTESIS Walaupun kurang berkaitan dengan hipotesis dalam suatu penelitian deskriptif, pengarang mengindikasikan bahwa dia mengira suatu perbedaan preferensi untuk bentuk ujian dan kemungkinan salah satu bentuk diperkirakan dapat lebih disukai. SAMPEL Sampel dari kedua penelitian merupakan sampel convenience (sampel seadanya) , penelitian kedua adalah pengulangan sebagian dari penelitian yang pertama. Tentu saja hal ini memberikan keinginan dari kedua penelitian. Oleh karena itu, kedua sampel lebih berpengaruh pada kelas menengah, pembatasan generalisasi seharusnya dikembangkan lebih lanjut. INSTRUMENTASI Studi I. isi dari kedua instrumen yang muncul menjadi valid, walaupun tidak jelas, mengapa banyak dimensi muncul dari keduanya dan kebanyakan hanya satu. Konsistensi internal skala tipe Likert adalah cukup, namun tidak ada fakta yang diberikan pada rating skala relatif. Skor yang disetujui cukup untuk bagian alasan terbuka. Tidak ada deskripsi try-out utama dari skala ini yang diberikan. Tidak ada fakta-fakta validitas yang diberikan, mungkin karena apa yang diukur adalah persepsi siswa. Meskipun demikian, persepsi dapat dan perlu divaliditaskan. Sekurang-kurangnya, ada dua skala (Likert dan relatif) yang akan diperbandingkan (menggunakan diferensiasi antara skor essai dan pilihan-ganda sebagaimana diindikasikan pada skala Likert). Study 2. Dalam replikasi, siswa akan mengisi rating skala relatif, namun format diferensial semantik menggantikan format Likert. Namun rasional pengaran untuk validitas konvergen mempunyai banyak kebaikan yang hasilnya bisa

direplikasi pada siswa dan format yang berbeda, tidak ada perbandingan langsung dengan instrumen yang dianggap cukup reliabilitas (skala Likert) adalah pasti, karena ini tidak digunakan. Lebih lanjut, tidak ada data reliabilitas pada instrumen diferensial semantik yang diberikan. Sekali lagi, korelasi antara skala diferensial semantik dan skala rating relatif akan memberikan fakta langsung pada validitas. Mengapa skala ini digunakan daripada Likert, khususnya karena pada saat ini, siswa beralasan karena preferensinya tidak diperoleh. Kita harus mengira bahwa administrator tidak mencoba untuk mempengaruhi respon dalam berbagai cara yang mana terlihat mungkin kecuali guru kelas, preferensi juga dikenal oleh siswa, skalanya dipertimbangkan. ANALISIS DATA/HASIL Perbandingan rata-rata dari masing-masing dimensi, juga menggabungkan skore, pada skala Likert (Studi I) dan differensial semantic (Studi 2) adalah tepat. Sebagaimana biasanya apabila random sampling tidak terjadi, menggunakan statistic inferensial sangat diragukan, sebelumnya dilaporkan dengan tidak ada qualifikasi. Kelebihan nilai dalam perkiraan magnit perbedaan adalah efek dari ukuran, yang telah dilaporkan. Efek ukuran untuk penggabungan skor pada skala Likert adalah .46/.63 = .76, dan differensial semantic 1.33/.96= 1.39. oleh karena itu, terdapat alasan baik untuk mengambil perbedaan dalam preferensi bentuk unjian pilihan ganda secara serius. Efek ukuran pada subskala umumnya berkaitan dengan interpretasi pengarang. Penemuan preferensi tidak berhubungan dengan tingkatan sosio-ekonomi, gender, ataupun tingkat kemampuan yang dapat diterima dengan tambahan penjelasan tentang penelitian dan meningkat generalisasi hasil penelitian. Kelihatannya, tidak ada skor yang diperoleh untuk penelitian sebelumnya, pada rating skala relative. Kami menemukan hal ini sulit untuk dipahami. Mengapa demikian, yang diberikan khususnya dalam penelitian kedua? Pengarang membahas alasan siswa karena preferensinya (hanya pada studi 1) dan preferensi aktualnya (hanya pada studi 2) yang pada umumnya mendukung hasil pada instrumen lainnya. Contohnya, dimensi harapan keberhasilan pada skala Likert

lebih menyukai format pilihan ganda (3,47 versus 2,86), dan tiga kuartal kelompok dilaporkan mempunyai pilihan pada format ini dengan skala relatif. Disini ditegaskan bahwa kerelasi skor total telah mendukung validitas pada skala ini. Pengarang dengan yakin menegaskan bahwa seluruh preferensi untuk pengujian pilihan ganda tidak mencakup pada refleksi pengetahuan siswa dimana 70 persen pada kelompok 1 dan 66 persen pada kelompok 2 lebih menyukai bentuk essai. PEMBAHASAN Pengarang, kurang menunjukkan pembatasan mengenai samplingnya. Kami menemukan kesalahan hanya dengan pembahasannya pada arus kritis dari pengujian pilihan ganda. Dia mengatakan bahwa dugaan kritis bahwa format ini adalah salah gagal untuk mengukur kognitif tertinggi atau proses psikologi, menghambat kreatifitas ujian, penempatan terlalu banyak susunan pada kecepatan dan memori ingatan, dan lain sebagainya. Dia kemudian menginterpretasikan hasilnya sebagai yang terbesar pada variansi dengan ketidaksukaan dan profil negatif dari ujian pilihan ganda yang seringkali muncul dari beberapa literatur antites. Namun indeks yang secara logis kebanyakan berkaitan dengan perubahan pendapat yaitu refleksi pengetahuan siswa, yang mana siswa setuju dengan pendapatnya. Satu kelalaian serius dalam interpretasi hasil menurut pengarang adalah gagal untuk memperbaiki pentingnya kualitas dan karakteristik lain dari item-item pilihan ganda dan item essai yang ditemukan siswa. Contohnya, jika item essai tertulis kurang baik dan ambigu, siswa tentu saja berpikir merasa sulit. Jika itemitem pilihan ganda cenderung dimudahkan, dan sifat superficial, siswa juga mengatakan mereka merasa lebih mudah daripada item-item essai, dan terukur konsep kurang penting. Dalam hal ini tidak memungkinkan karena para pembaca artikel akan memahami sepenuhnya implikasi penemuan tanpa melihat sekurangkurangnya perwakilan sampel dari jenis item-item yang siswa tunjukan ketika mereka memberikan respon pada instrumen. Jika item-item dari kedua tipe pada umumnya adalah berkualitas tinggi dan mengukur hasil pembelajaran secara tepat

dengan level yang tinggi dari keterampilan intelektual, hasil survey adalah penting. Jika secara umum terdapat kualitas rendah atau tidak merata dan superfisial terukur atau informasi tidak relevan, penemuan dalam artikel ini tidak berguna. Pengarang memberikan perhatian yang tidak cukup dalam mempercayai secara umum bahwa validitas peniliaian lebih penting daripada preferensi siswa terhadap format item. Fakta bahwa siswa lebih menyukai format pilihan ganda tidak cukup beralasan untuk digunakan bahwa format jika hasilnya dipertanyakan (contohnya, kemampuan untuk mengungkapkan ide dalam kata sendiri) tidak bisa diukur dengan item-item dalam format. Prioritas harus diberikan untuk menggunakan format yang lebih cocok untuk penilaian karakteristik siswa yang hasilnya bisa diharapkan terukur.

Вам также может понравиться