KOMPARASI METODE STANDARD SETTING UNTUK PENENTUAN KKM MATA PELAJARAN MATEMATIKA KELAS VIII SMP
KOMPARASI METODE STANDARD SETTING UNTUK PENENTUAN KKM MATA PELAJARAN MATEMATIKA KELAS VIII SMP
Susi Anto, 2) Djemari Mardapi
LPMP Daerah Istimewa Yogyakarta, 2) Universitas Negeri Yogyakarta
susianto.lpmpjogja@gmail.com, 2) djemarimardapi@yahoo.co.id
Abstrak
Tujuan penelitian ini adalah menemukan skor batas Kriteria Ketuntasan Minimum (KKM) de- ngan memanfaatkan metode yang ada dalam standard setting. Metode yang digunakan adalah metode Extended Angoff dan metode Ebel. Penelitian ini merupakan penelitian deskriptif kuantitatif yang diperkuat dengan data kualitatif. Data kuantitatif yang digunakan dalam penelitian ini adalah pola respon peserta didik atas soal UKK SMP/MTs Kelas VIII Mapel Matematika Kabupaten Sleman 2011/2012. Selain itu, dalam penentuan cut of score, juga digunakan data kuantitatif yang diperoleh dari expert judgement. Sementara expert judgement yang bersifat kualitatif digunakan untuk menilai kualitas pelaksanaan pertemuan standard setting. Hasil penelitian ini menunjukkan bahwa cutscore yang diperoleh dengan menggunakan metode Extended Angoff maupun Ebel masing-masing 59 dan 50,98 pada skala 100. Cutscore ini berbeda cukup signifikan dengan KKM sekolah yang ditentukan dengan menggunakan metode konvensional. Berdasarkan analisis validitas standard setting, metode Extended Angoff memberikan hasil cutscore yang relatif lebih valid dibanding metode Ebel. Validitas standard setting yang diukur dalam penelitian ini adalah validitas internal yang meliputi method consistency, decision consistency, intra-judge consistency, dan inter-judge consistency.
Kata kunci: standard setting, KKM, validitas standard setting
COMPARISON OF STANDARD SETTING METHOD FOR DETERMINING MINIMUM MASTERY CRITERIA
Susi Anto, 2) Djemari Mardapi
LPMP Daerah Istimewa Yogyakarta, 2) Universitas Negeri Yogyakarta
susianto.lpmpjogja@gmail.com, 2) djemarimardapi@yahoo.co.id
Abstract
The objective of the research is to find cutscore of Minimum Mastery Criteria (KKM) by utilizing methods existing in standard setting. The methods used are Extended Angoff and Ebel methods. This research is quantitative descriptive one supported by qualitative data. Quantitati ve data used in this research are the pattern of students’ responses against the problems of Mathematics at the End of the Year Examination for SMP/MTs for eight graders in Kabupaten Sleman 2011/2012. In addition, quantitative data obtained from expert judgement are also used for determining cut of score. Meanwhile, qualitative expert judgement is used to assess the quality of standard setting meeting. The result of this research shows that cutscore gained using both Extended Angoff and Ebel methods is 59 and 50,98 respectively on a scale of 100. This cutscore is significantly different from school KKM defined using conventional method. Based on analysis of standard setting, Extended Angoff method would provide cutscore result that is relatively more valid compared to Ebel. The validity of standard setting measured in this research is the internal validity including method consistency, decision consistency, intra-judge consistency, and inter-judge consistency. Keywords: standard setting, minimum mastery criteria, standard setting validity
Komparasi Metode Standard Setting untuk Penentuan KKM − 369
Pendahuluan menimbulkan masalah yang cukup serius Standard setting
terutama berkenaan dengan masalah reliabi- adalah proses penetap-
litas, sebab menentukan nilai intake siswa, an suatu titik dalam skala skor tes tertentu daya dukung, dan kompleksitas membawa yang digunakan untuk menentukan level
konsekuensi tingginya variabilitas nilai yang performa suatu kebijakan atau untuk mem- mungkin muncul dari para penilai. Permasa- buat klasifikasi (Sireci dalam Wells, 2007).
lahan reliabilitas ini bisa dieliminasi, bahkan Dalam dunia pendidikan, standard setting dianulir jika KKM ditentukan dengan banyak digunakan untuk menentukan skor
menggunakan standard setting. batas kelulusan atau biasa disebut sebagai
skor minimum kelulusan. Namun lebih dari Penelitian ini memilih metode Ex- itu, standard setting sesungguhnya dapat di-
tended Angoff dan Ebel dengan alasan seba- gunakan sebagai alat bantu untuk memeta-
gai berikut. Pertama, metode ini relatif mu- kan mutu pendidikan, sebab dengan standard
dah jika diterapkan pada guru. Kedua, me- setting kita bisa membuat suatu klasifikasi
tode ini tidak memerlukan persyaratan ana- rendah-sedang-tinggi kompetensi seseorang
lisis butir yang rumit, tetapi cukup dengan atau prestasi suatu wilayah tertentu (Athana-
menggunakan teori tes klasik yang sudah sou dan Lamprianou, 2009, p.272).
cukup dikenal di kalangan para guru. Secara garis besar, standard setting di-
Penelitian ini bertujuan untuk: (1) bedakan menjadi dua golongan. Pertama
mengetahui karakteristik perangkat soal yang menggunakan acuan norma sementara
UKK jenjang SMP/MTs kelas VIII mata kedua yang menggunakan acuan kriteria.
pelajaran Matematika Kabupaten Sleman ta- Dalam interpretasi nilai beracuan norma,
hun pelajaran 2011/2012, (2) mengetahui kemampuan peserta tes diperbandingkan
skor KKM bidang studi Matematika untuk dengan kemampuan orang lain dalam ke-
siswa SMP/MTs kelas VIII di Kabupaten lompok acuan. Sementara dalam interpretasi
Sleman jika ditentukan dengan mengguna- nilai beracuan kriteria, kemampuan peserta
kan metode standard setting berbasis tes (test- tes diperbandingkan dengan level kemam-
centered ) yaitu metode Extended Angoff dan puan tertentu (Reynolds, Livingston, dan
metode Ebel, (3) mengetahui persentase ke- Willson, 2010, pp.62-64).
tuntasan siswa kelas VIII jenjang SMP/MTs untuk mata pelajaran Matematika di Kabu-
Penentuan skor minimal kelulusan di paten Sleman jika menggunakan KKM yang
Indonesia belum menerapkan kedua pende- ditentukan dengan metode Extended Angoff katan di atas, tapi ditetapkan berdasarkan dan metode Ebel, (4) mengetahui deskripsi kesepakatan dan masukan dari lapangan. kemampuan siswa kelas VIII jenjang SMP/ Begitu pula dalam menilai ketuntasan suatu MTs di Kabupaten Sleman untuk mata mata pelajaran. Penentuan Kriteria Ketun- pelajaran Matematika yang telah dikatakan tasan Minimum (KKM) selama ini dilaku- tuntas jika menggunakan skor KKM ber- kan oleh masing-masing sekolah dengan dasarkan metode Extended Angoff, (5) menggunakan metode di luar standard setting membuat interpretasi terhadap perbedaan atau ditetapkan oleh Dinas Pendidikan di skor KKM yang dihasilkan dengan meng- tingkat kabupaten/kota dengan tujuan ter- gunakan metode standard setting yang ber- tentu yang terkadang justru kontraproduktif beda, (6) mengetahui metode yang mampu dengan tujuan pendidikan secara luas. menghasilkan cutscore dengan validitas Dalam hal penentuan KKM, metode
terbaik, (7) mengetahui kompatibilitas me- yang selama ini dikenal oleh guru adalah de-
tode Extended Angoff dan metode Ebel bagi ngan menentukan subskornya berdasarkan
para guru untuk menentukan KKM, dan (8) intake siswa, daya dukung, dan kompleksi-
mengetahui metode yang lebih mudah tas. Dari ketiga subskor tersebut selanjutnya
dalam penentuan KKM diantara 2 metode diambil rata-rata yang kemudian digunakan
yaitu metode konvensional dan metode sebagai KKM. Penggunaan teknik ini tentu
standard setting (Extended Angoff dan Ebel).
370 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 17, Nomor 2, 2013
Metode Penelitian
Tabel 1. Sumber Data Penentuan KKM Menggunakan Metode Extended
Penelitian ini merupakan penelitian Angoff
deskriptif kuantitatif yang diperkuat dengan data kualitatif. Data kuantitatif yang di-
Nilai gunakan dalam penelitian ini adalah pola
Jumlah
Rata- respon peserta didik atas soal UKK SMP/
No
Sekolah
siswa Rata MTs Kelas VIII Mapel Matematika Kabu-
paten Sleman 2011/2012. Selain itu, dalam
129 8,35 penentuan cut of score, juga digunakan data kuantitatif yang diperoleh dari expert judge-
1 SMPN 1 Godean
201 6,22 ment . Sementara expert judgement yang bersifat
2 SMPN 1 Minggir
143 5,08 kualitatif digunakan untuk menilai kualitas
3 SMPN 1 Mlati
pelaksanaan pertemuan standard setting.
104 4,51 Penelitian ini mengambil tempat di
4 SMPN 2 Pakem
108 4,41 Kabupaten Sleman. Alasan penentuan loka-
5 SMPN 1 Berbah
si penelitian ini adalah: (1) Sleman memiliki 6 SMPN 2 Ngemplak 207 4,16 wilayah yang cukup luas, (2) Sleman me- miliki kondisi sosial ekonomi yang cukup
203 3.80 lengkap yang mewakili tiga kondisi yang
7 SMPN 1 Ngaglik
146 3,67 berbeda, yaitu urban, suburban, dan rural.
8 MTsN Godean
188 3,41 April hingga Agustus 2012. Serangkaian ke-
Penelitian dilaksanakan pada bulan
9 SMPN 2 Moyudan
160 3,25 giatan persiapan dilakukan pada bulan April
10 MTsN Tempel
2012, sementara pengambilan data respon
89 3,02 siswa dilakukan pada bulan Juni 2012. Pada bulan Juli 2012 dilakukan analisis butir soal
11 SMPN 3 Turi
12 SMP Muh. 1 Gamping 85 2,76 berdasarkan data respon siswa untuk me-
1763 52,64 ngetahui karakteristik perangkat tes. Kegiat-
Jumlah
an selanjutnya adalah pengambilan data Nilai rata-rata sampel 4,39 kuantitatif dan kualitatif melalui panel ber- sama expert dalam bentuk focused group dis-
Nilai rata-rata populasi 4,36 cussion (FGD) yang dilaksanakan pada bulan
Agustus 2012. Sumber data kuantitatif dalam pene- Data set dalam penelitian ini berupa
litian ini dapat dilihat pada Tabel 1 dan respon peserta didik SMP/MTs kelas VIII
Tabel 2. Selain pertimbangan pola distribusi Kabupaten Sleman tahun pelajaran 2011/
skor siswa, pemilihan sekolah sampel juga 2012 sebanyak 3504 siswa. Siswa tersebut
memperhatikan letak sekolah secara geo- terdistribusi dalam 24 SMP/MTs yang di-
grafis. Dengan pertimbangan tersebut di- pilih mengikuti distribusi perolehan nilai
harapkan sampel merepresentasikan seluruh UKK jenjang SMP/MTs kelas VIII Kabu-
kondisi daerah yang ada, baik secara geo- paten Sleman tahun pelajaran 2011/2012
grafi maupun secara sosial ekonomi. Secara bidang studi Matematika. Dengan demikian,
geografi, sampel diharapkan mampu mewa- sekolah yang dipilih sebagai sampel me-
kili wilayah Sleman Barat, Sleman Tengah, wakili kelompok-kelompok perolehan nilai
dan Sleman Timur. Sementara secara sosial baik tinggi, sedang, maupun rendah.
ekonomi, sampel diharapkan mampu me- wakili daerah urban, suburban, maupun
rural.
Komparasi Metode Standard Setting untuk Penentuan KKM − 371
Susi Anto, Djemari Mardapi
Tabel 2. Sumber Data Penentuan KKM mengampu pelajaran Matematika di kelas Menggunakan Metode Ebel
VIII.
Banyaknya panelis yang digunakan
dalam penelitian ini untuk masing-masing No
metode adalah 12 untuk menjaga agar vali-
Rata
ditas intra judge dan inter judge tetap tinggi
(Fowell, S.L., Fewtrell, R., & McLaughlin, 1 SMPN 4 Pakem P.J., 2008, p.11). Selain itu, panelis untuk
2 SMPN 1 Turi
metode Angoff dibedakan dengan panelis untuk metode Ebel untuk menghindarkan
3 SMPN 2 Kalasan
bias dan interferensi dalam estimasi mereka. Data yang diperlukan dalam peneli-
4 SMPN 4 Ngaglik
tian ini dikumpulkan dengan menggunakan 5 SMPN 1 Cangkringan
teknik dokumentasi dan melalui focused group discussion (FGD). Instrumen pengumpul
6 SMP Muh. 3 Depok
data yang digunakan adalah lembar jawab siswa, lembar kerja panelis, dan angket
7 SMPN 3 Mlati
Karakteristik perangkat tes perlu di- 8 SMPN 2 Gamping
analisis terlebih dahulu untuk memutuskan 9 SMP Muh. 1 Berbah
apakah butir-butir yang ada memenuhi sya- rat untuk digunakan sebagai basis penentu-
10 SMP Muh. 1 Minggir
an cutscore. Untuk mengetahui karakteristik butir, respon jawaban peserta akan dikaji
11 MTsN Seyegan
secara kuantitatif melalui analisis empirik dengan mengacu pada teori tes klasik. Pe-
SMP Muh. 2
rangkat bantu yang digunakan dalam analisis Gamping
tersebut adalah program Iteman versi 3.0. Jumlah
Selanjutnya untuk menentukan cutscore , penelitian ini menggunakan dua metode, ya-
Nilai rata-rata sampel
itu metode Extended Angoff dan metode Ebel. Impara dan Plake dalam Stahl (2008,
Nilai rata-rata populasi
p.7) mengusulkan suatu modifikasi untuk lebih menyederhanakan proses pada metode
Sumber data kualitatif dan kuantitatif Original Angoff. Modifikasi tersebut meng- usulkan agar panelis memutuskan apakah
lainnya adalah guru-guru pengampu bidang studi Matematika kelas VIII yang bertugas
peserta ujian secara individual mampu atau tidak mampu menjawab butir soal dengan
di 24 SMP/MTs yang digunakan sebagai benar. Cara ini dinamakan prosedur Ya/
sampel data set yang memenuhi kualifikasi Tidak. Jawaban diskor 1 bila Ya dan diskor tertentu. Kualifikasi dimaksud berkenaan
0 jika Tidak. Skor yang diperoleh dari tiap dengan latar belakang pendidikan dan pe- butir soal pada masing-masing panelis ke- ngalaman mengajar guru yang bersangkutan.
mudian dijumlahkan. Hasil penjumlahan itu Guru-guru yang ditunjuk sebagai panelis merupakan kriteria kelulusan minimum atau harus memiliki latar belakang pendidikan minimum passing level dari panelis. Nilai rata- yang sesuai dan memiliki pengalaman rata minimum passing level dari masing-masing mengajar bidang studi Matematika jenjang
panelis inilah yang merupakan final cutting SMP/MTs sekurang-kurangnya 10 tahun
score perangkat tes.
dan sekurang-kurangnya 5 tahun terakhir
372 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 17, Nomor 2, 2013
Metode kedua yang digunakan dalam akan diukur melalui validitas internal yang penelitian ini adalah metode Ebel. Metode
meliputi: method consistency, decision consistency, yang dikemukakan Ebel mengusulkan suatu
intra-judge consistency, dan inter-judge consistency. prosedur yang mirip dengan Angoff, namun
Konsistensi metode akan diukur me- dengan pertimbangan keterkaitan menyang-
lalui standard error of judgement (SEj) atau kesa- kut relevansi isi tiap butir dan tingkat ke-
lahan baku penjurian (Norcini et al., 1987, sukarannya dapat mempengaruhi pertim-
p.60). Menurut Cohen et al., (1999, p.362), bangan tentang bagaimana kualifikasi mini-
konsistensi metode dapat dikatakan meme- mal peserta tes yang diharapkan untuk me-
nuhi jika nilai SEj sama dengan atau lebih ngerjakan suatu butir (Ebel, 1979, p.340).
kecil dari setengah nilai standar error of Teknik ini menggunakan suatu jaringan dua
measurement (SEM) tes.
dimensi untuk membuat kategori setiap Konsistensi keputusan akan diukur butir. Dimensi satu menyangkut tingkat
dengan menggunakan persamaan: relevansi isi butir, sementara dimensi dua
menyangkut tingkat kesukaran butir. Ting- |Z| = (C x – M – 0,5) / S x kat relevasi butir dibedakan menjadi empat
kategori yang meliputi essential (sangat pen- Artinya C x adalah cutscore tes, M ada- ting), important (penting), acceptable (dapat
lah rata-rata skor peserta tes, dan S x adalah diterima), dan questionable (dipertanyakan).
simpangan baku skor peserta tes (Cizek & Tingkat kesukaran dibedakan menjadi tiga
Bunch, 2007, p.307). Harga mutlak Z kemu- kategori yang meliputi mudah, sedang, dan
dian digunakan untuk menentukan estimasi sulit.
koefisien kesepakatan (p 0 ) dan nilai kappa Setelah cutscore ditentukan, langkah se-
(k) dari dua tabel Subkoviak yang tercantum lanjutnya adalah menganalisis persentase
pada Cizek & Bunch (2007, pp.310-311). dan deskripsi ketuntasan siswa kelas VIII
Semakin tinggi koefisien kesepakatan (p 0 ) jenjang SMP/MTs di Kabupaten Sleman
maka semakin tinggi pula proporsi keputus- untuk mata pelajaran Matematika. Analisis
an konsisten yang diharapkan jika prosedur ini penting karena beberapa alasan. Per-
pengujian ulang dilakukan. Begitu pula se- tama, untuk mengetahui peta pencapaian
makin besar nilai kappa (k) mengindikasikan siswa kelas VIII jenjang SMP/MTs di Ka-
makin besarnya pengaruh prosedur penguji- bupaten Sleman dalam pembelajaran Mate-
an terhadap konsistensi keputusan. Rendah- matika. Kedua, untuk membantu membuat
nya nilai kappa (k) menunjukkan bahwa cut- proyeksi persentase kelulusan siswa kelas
score yang dihasilkan terletak jauh dari area
VIII jenjang SMP/MTs di Kabupaten distribusi skor dengan tingkat densitas ter- Sleman setahun yang akan datang pada
tinggi dan estimasi reliabilitas tes rendah mata pelajaran Matematika. Ketiga, untuk
(Cizek & Bunch, 2007, p.312). membantu membuat proyeksi terhadap des-
Intra-judge consistency yang akan diukur kripsi kemampuan yang betul-betul sudah
adalah intra-judge consistency baik di dalam dikuasai siswa atau masih perlu upaya keras
putaran maupun antar putaran. Intra-judge baik oleh guru maupun siswa untuk me-
consistency across rounds akan dilihat dari nguasainya. Keempat, untuk membuat pe-
magnitudo perubahan rating butir dari nilaian terhadap estimasi panelis tentang
putaran ke putaran dan banyaknya rating kemampuan siswa-siswinya, apakah estimasi
butir yang berubah dari putaran ke putaran tersebut sudah tepat ataukah under atau
(Loomis et al., 2000, p.13). Intra-judge consis- bahkan over-estimate.
tency within rounds akan ditentukan berdasar- Validitas cutscore yang dihasilkan juga
kan pemetaaan keputusan rating setiap butir akan dihitung untuk menentukan cutscore
pada tabel tingkat kesulitan item (Loomis et manakah dari kedua metode yang diguna-
al., 2000, p.15). Pemetaan itu akan diuji kan (Extended Angoff dan Ebel) yang memi-
melalui nilai korelasinya. Nilai korelasi yang liki tingkat validitas terbaik. Validitas cutscore
tinggi mengindikasikan tingkat konsistensi Komparasi Metode Standard Setting untuk Penentuan KKM − 373
Susi Anto, Djemari Mardapi Susi Anto, Djemari Mardapi
perangkat tes yang terstandar. Definisi ter- untuk panelis yang telah expert sekalipun,
standar ini mencakup terstandar tahapan maka nilai korelasi di atas 0,30 sudah di-
penyusunannya, terstandar cakupan dan ke- anggap memuaskan (Alderson, 1993, p.55).
dalaman materinya, maupun terstandar ka- Inter-judge consistency merupakan kriteria
rakteristik tiap butir penyusunnya. yang penting untuk menilai apakah suatu
Dilihat dari sisi tahapan penyusunan- proses standard setting memiliki alasan yang
nya, perangkat tes dimaksud sudah bisa di- cukup memadai atau tidak (Loomis et al.,
katakan terstandar karena disusun melalui 2000, p.13). Inter-judge consistency akan dilihat
prosedur yang telah terstandar oleh tim di dari simpangan baku cutscore. Secara umum
bawah Musyawarah Kerja Kepala Sekolah simpangan baku antar putaran akan sema-
(MKKS) jenjang SMP/MTs di Kabupaten kin mengecil untuk cutscore pada level cakap
Sleman. Begitu pula dari sisi cakupan dan dan ahli, dan akan membesar untuk cutscore
kedalaman materinya, perangkat tes dimak- pada level dasar (Loomis et al., 2000, p.13).
sud juga sudah bisa dikatakan terstandar ka- Untuk menjawab pertanyaan apakah
rena disusun berdasarkan SK dan KD yang metode Extended Angoff dan metode Ebel
sesuai dengan kelas dan jenjangnya sebagai- cukup kompatibel digunakan oleh guru un-
mana termaktub dalam Standar Isi. Semen- tuk menentukan KKM serta pertanyaan
tara dari karakteristik tiap butir penyusun- apakah metode Extended Angoff dan me-
nya, perlu dilakukan analisis untuk menyim- tode Ebel lebih mudah digunakan untuk
pulkan apakah perangkat tes tersebut sudah menentukan KKM jika dibandingkan de-
bisa dikatakan terstandar atau belum. ngan metode konvensional akan digunakan
Berdasarkan analisis butir mengguna- analisis statistik deskriptif. Data yang di-
kan program Iteman tersebut, diperoleh ke- analisis merupakan feedback panelis atas
simpulan bahwa seluruh butir yang terdapat penyelengaraan pertemuan standard setting
dalam instrumen tes dapat digunakan dalam yang telah dilakukan. Data tersebut diper-
penentuan cutscore, karena semua indikator oleh dari respon panelis atas instrumen
memberikan informasi yang bagus. Indika- angket yang disebarkan setelah putaran
tor-indikator itu adalah tingkat kesulitan bu- penentuan standard setting dilakukan.
tir, daya beda butir, efektivitas distraktor, dan keberfungsian kunci jawaban.
Hasil Penelitian dan Pembahasan
Metode Extended Angoff Sebagaimana telah diungkap pada ba-
Putaran pertama metode Extended gian sebelumnya, karakteristik butir soal pe- Angoff menghasilkan cutscore sebesar 23 bu- rangkat tes perlu diketahui terlebih dahulu
tir benar dari 40 butir soal UKK atau sebe- sebelum digunakan dalam penentuan cut- sar 58%. Dengan menggunakan final cutscore score . Karakteristik butir tersebut digunakan
1 ini sebagai KKM, ternyata ada 22% siswa sebagai dasar keputusan apakah instrumen di sekolah sampel yang bisa dikatakan telah tes dimaksud memenuhi syarat atau tidak
tuntas dalam mengikuti materi pembelajaran untuk digunakan sebagai basis penentuan matematika SMP/MTs kelas VIII. Sementa- cutscore , sebab kelayakan instrumen menjadi
ra pada putaran kedua, menghasilkan cutscore prasyarat utama yang harus dipenuhi dalam sebesar 24 butir benar dari 40 butir soal penentuan cutscore yang berbasiskan alat tes
UKK atau sebesar 60%. Dengan meng- (test-centered models). gunakan final cutscore 2 ini sebagai KKM,
Penentuan cutscore yang berbasiskan tingkat ketuntasan turun menjadi 19%.
alat tes (test-centered models) mengasumsikan
374 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 17, Nomor 2, 2013
Tabel 3. Rekapitulasi Cutscore Metode Extended Angoff Cutscore Panelis
No. Panelis Perubahan Keputusan
1,5 3,75% KKM Final
Tabel 3 menampilkan rekapitulasi cut- ngan menggunakan KKM ini, ada 682 dari score para panelis pada putaran pertama dan
3504 (sekitar 19%) siswa di sekolah sampel kedua metode Extended Angoff. Rata-rata
yang bisa dikatakan telah tuntas dalam estimasi para panelis pada putaran pertama
mengikuti materi pembelajaran matematika dan kedua menunjukkan perbedaan angka
SMP/MTs kelas VIII.
yang sudah dapat diterima yaitu 1,5 butir Setelah menentukan cutscore pada pu- dari 40 butir soal (3,75%). Oleh karena itu
taran pertama, para panelis mendiskusikan tidak diperlukan adanya putaran ketiga pa-
deskriptor dari cutscore yang ditetapkan de-
da metode Extended Angoff ini. ngan metode Extended Angoff. Deskriptor yang digunakan merupakan kompetensi
Tabel 4. Hasil Penentuan KKM Bidang yang diukur oleh tiap butir soal hasil disku- Studi Matematika Jenjang SMP/
si dan disesuaikan dengan frekuensi panelis MTs Kelas VIII di Kabupaten
yang menjawab Ya. Hasil diskusi menun- Sleman Menggunakan Metode
jukkan ada 38 deskriptor yang memperoleh Extended Angoff
minimal 1 jawaban Ya dari panelis. Itu ber- arti populasi siswa yang telah melampaui
Banyak Persentase Banyak Persentase skor KKM atau siswa yang telah tuntas da- Putaran Butir
pat dikatakan setidaknya memiliki 38 kom- Benar
Benar Tuntas Tuntas petensi sebagaimana diukur oleh ke-38 bu- Pertama
tir tersebut.
Metode Ebel
Rata-Rata 23,5 59%
Putaran pertama metode Ebel meng- hasilkan cutscore sebesar 19,93 atau 49,82 KKM sesungguhnya diperoleh de-
pada skala 100. Dengan menggunakan final ngan mengambil rata-rata cutscore dari pu-
cutscore 1 ini sebagai KKM, ada 32% siswa di taran pertama dan kedua. Tabel 4 menun-
sekolah sampel yang bisa dikatakan telah jukkan skor KKM akhir sebesar 59%. De-
tuntas dalam mengikuti materi pembelajar- Komparasi Metode Standard Setting untuk Penentuan KKM − 375
Susi Anto, Djemari Mardapi Susi Anto, Djemari Mardapi
panelis pada putaran pertama dan kedua cutscore dengan metode Ebel menghasilkan
menunjukkan perbedaan angka yang sudah cutscore sebesar 20,85 atau 52,13 pada skala
dapat diterima yaitu 1,82 butir dari 40 butir 100. Dengan menggunakan final cutscore 2 ini
soal (4,55%). Oleh karena itu tidak diperlu- sebagai KKM, tingkat ketuntasan menurun
kan adanya putaran ketiga pada metode menjadi 28%.
Ebel ini.
Tabel 5 menampilkan rekapitulasi cut- score para panelis pada putaran pertama dan
Tabel 5. Rekapitulasi Cutscore Metode Ebel Cutscore Panelis
No. Panelis Perubahan Keputusan
1,82 4,55% KKM Final
Tabel 6 memberi informasi yang Tabel 6. Hasil Penentuan KKM Bidang lengkap hasil perhitungan KKM dengan
Studi Matematika Jenjang menggunakan metode Ebel berikut persen-
SMP/MTs Kelas VIII di tase tingkat ketuntasan siswa di sekolah
Kabupaten Sleman Menggunakan sampel. KKM sesungguhnya diperoleh de-
Metode Ebel ngan mengambil rata-rata skor KKM pada putaran pertama dan kedua. Dari nilai rata-
Persentase Banyak Persentase rata itu diperoleh KKM akhir sebesar
Skor
Skor Siswa Siswa 50,97%. Dengan menggunakan KKM ini,
Putaran
KKM
KKM Tuntas Tuntas ada 972 dari 3504 (sekitar 28%) siswa di se-
kolah sampel yang bisa dikatakan telah tun- Pertama 19,93 49,82% 1134
32% tas dalam mengikuti materi pembelajaran
matematika SMP/MTs kelas VIII. Kedua 20,85 52,13% 972 28% Rata-Rata 20,39 50,97%
376 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 17, Nomor 2, 2013
Metode Extended Angoff dan Ebel setiap selnya. Hal ini membawa implikasi pada penelitian ini masing-masing mengha-
nilai proporsi pada metode Ebel lebih bias silkan nilai cutscore 59 dan 50,98 pada skala
dibanding nilai proporsi pada metode Ex- 100. Ini berarti kedua metode menghasil-
tended Angoff.
kan nilai cutscore yang berbeda. Perbedaan itu Metode Extended Angoff pada peneli- muncul sebagai implikasi logis dari per-
tian ini menghasilkan nilai cutscore 59 pada bedaan konsep yang melatarbelakangi me-
skala 100. Pada nilai cutscore 59 ini banyak- tode-metode tersebut. Beberapa hal yang
nya siswa yang tuntas belajarnya adalah 19% bisa diuraikan untuk menjelaskan perbeda-
dari 3504 siswa sampel. Sementara pa-da an itu adalah sebagai berikut.
metode Ebel dihasilkan skor cutscore 50,98 Pertama, pada metode Extended An-
dan tingkat ketuntasan siswa di angka 28%. goff, baik tingkat kesulitan soal maupun
Rendahnya persentase ketuntasan siswa ini tingkat kemampuan peserta tes berpenga-
menunjukkan baik panelis metode Extended ruh secara dependen satu sama lain terha-
Angoff maupun Ebel, keduanya telah over dap keputusan Ya/Tidak panelis. Sementa-
estimate dalam memberikan penilaian atas ra pada metode Ebel tingkat kesulitan soal
kemampuan peserta didiknya. Jika estimasi dan tingkat kemampuan peserta tes ber-
mereka tepat, maka akan dihasilkan skor pengaruh secara independen satu sama lain
KKM yang lebih rendah dan persentase terhadap keputusan panelis. Selain itu di
ketuntasan yang lebih tinggi. samping tingkat kesulitan soal, pada meto-
de Ebel ada juga parameter lain yang ikut Validitas Standard Setting berpengaruh terhadap keputusan panelis
Validitas cutscore yang dihasilkan baik yaitu tingkat relevansi soal. Pada metode
oleh metode Extended Angoff maupun oleh Ebel tingkat kesulitan dan tingkat relevansi
metode Ebel akan diukur melalui validitas butir berpengaruh pada keputusan jumlah
internalnya. Validitas internal yang hendak butir yang tersarang dalam tiap-tiap sel. Se-
diukur tersebut meliputi method consistency, mentara tingkat kemampuan peserta tes
decision consistency, intra-judge consistency, dan berpengaruh kepada persentase jawaban
inter-judge consistency.
benar yang tersarang dalam tiap-tiap sel. Kedua, metode Ebel membutuhkan
Tabel 7. Kesalahan Baku Penjurian (SEj) lebih banyak estimasi dibanding metode
Metode Extended Angoff dan Extended Angoff. Jika pada metode Extended
Metode Ebel Angoff panelis hanya diminta mem-buat
satu jenis estimasi, maka tidak demikian hal- Kesalahan Baku (SEj) Referens
Putaran
nya pada metode Ebel. Sebab ada tiga para- i Ext. Angoff Ebel meter yang mesti diestimasi oleh para pane-
1,148 1,870 ≤ 1.3885 lis pada metode Ebel. Parameter itu adalah
Pertama
1,225 1,657 ≤ 1.3885 tir, dan tingkat kemampuan peserta tes. Ba-
tingkat kesulitan butir, tingkat relevansi bu-
Kedua
0,828 1,225 ≤ 1.3885 nyaknya parameter yang mesti diestimasi ini akan berbanding lurus dengan banyaknya
Putaran 1 & 2
Konsistensi metode dapat diukur keraguan yang mungkin muncul dari para
melalui standard error of judgement (SEj) atau panelis. Semakin banyak parameter yang
kesalahan baku penjurian. Sebagaimana di- mesti diestimasi, semakin tinggi pula fre-
tunjukkan oleh Tabel 7, baik pada putaran kuensi munculnya ragu panelis.
pertama maupun pada putaran kedua, nilai Ketiga, nilai proporsi metode Ex-
kesalahan baku (standard error) pada metode tended Angoff bisa dikatakan lebih detail
Ebel selalu lebih tinggi dibanding pada dibanding metode Ebel. Sebab pada meto-
metode Extended Angoff. Tabel 7 juga me-
de Extended Angoff proporsi ditentukan nunjukkan bahwa nilai Sej metode Ebel untuk setiap butirnya sementara pada me-
baik pada putaran 1 maupun pada putaran 2 tode Ebel, nilai proporsi ditentukan untuk
selalu di atas nilai referensi yang disyarat- Komparasi Metode Standard Setting untuk Penentuan KKM − 377
Susi Anto, Djemari Mardapi Susi Anto, Djemari Mardapi
proporsi ditentukan untuk setiap selnya. Hal wa method consistency pada metode Ebel pu-
ini membawa implikasi nilai proporsi pada taran 1 dan putaran 2 belum memenuhi
metode Ebel lebih bias dibanding ni-lai syarat. Syarat konsistensi metode Ebel ini
proporsi pada metode Extended Angoff. baru terpenuhi ketika rating cutscore indivi-
Konsistensi keputusan ditentukan de- dual digabung antara putaran 1 dan putaran
ngan cara menghitung nilai harga mutlak Z
2. Itupun juga masih lebih besar dibanding terlebih dahulu. Harga mutlak Z kemudian metode Extended Angoff.
digunakan untuk menentukan estimasi koe- Berangkat dari premis-premis terse-
fisien kesepakatan (p 0 ) dan nilai kappa (k) but dapat disimpulkan bahwa method consis-
dari dua tabel Subkoviak. Tabel 8 menun- tency metode Extended Angoff lebih bagus
jukkan harga |Z|, alpha, p 0 , dan k untuk dibanding metode Ebel. Atau dengan kata
masing-masing metode dan masing-masing lain dapat diungkapkan bahwa metode Ex-
putaran. Berdasarkan tabel Subkoviak nilai tended Angoff mampu memberikan konsis-
maksimum p 0 adalah 0,98 dan nilai maksi- tensi penjurian yang lebih baik dibanding
mum untuk k adalah 0,71. Oleh karena itu metode Ebel. Hal ini bisa menjadi petunjuk
dapat disimpulkan bahwa berdasar Tabel 8, bahwa bias estimasi pada metode Ebel le-
konsistensi keputusan kedua metode pada bih tinggi dibanding pada metode Extended
penelitian ini sudah cukup memuaskan se- Angoff.
perti ditunjukkan oleh harga p 0 dan k. Metode Ebel memungkinkan muncul-
Sebagaimana diketahui bahwa sema- nya lebih banyak kesalahan dibanding meto-
kin tinggi koefisien kesepakatan (p 0 ) maka
de Extended Angoff. Hal tersebut disebab- semakin tinggi pula proporsi keputusan kan metode Ebel membutuhkan lebih ba-
konsisten yang diharapkan jika prosedur nyak estimasi dibanding metode Extended
pengujian ulang dilakukan. Oleh karena itu, Angoff. Banyaknya parameter yang harus
harga p 0 yang di atas 0,8 (maksimum 0,98) diestimasi ini berbanding lurus dengan ba-
menunjukkan bahwa munculnya proporsi nyaknya keraguan yang mungkin muncul
keputusan konsisten yang diharapkan cukup dari para panelis. Semakin banyak para-
tinggi jika prosedur pengujian ulang dilaku- meter yang mesti diestimasi, semakin tinggi
kan baik pada metode Extended Angoff pula frekuensi munculnya ragu panelis. Ke-
maupun pada metode Ebel. Tabel 8 juga raguan inilah yang sering membawa im-
menunjukkan bahwa nilai p 0 metode Exten- plikasi pada munculnya bias estimasi. Bias
ded Angoff selalu lebih tinggi dibanding estimasi inilah yang terbaca pada nilai stan-
Ebel baik itu pada putaran 1, putaran 2, dard error sebagaimana ditunjukkan Tabel 7.
maupun gabungan putaran 1 dan 2. Hal ini Selain itu, tingkat akurasi nilai pro-
mengindikasikan bahwa harapan mun- porsi pada metode Extended Angoff bisa
culnya proporsi keputusan yang konsisten dikatakan lebih tinggi dibanding pada me-
jika pengujian ulang dilakukan selalu lebih tode Ebel. Sebab pada metode Extended
tinggi pada metode Extended Angoff diban- Angoff proporsi ditentukan untuk setiap
ding pada Metode Ebel. Tabel 8. Nilai Koefisien Kesepakatan (p 0 ) dan Kappa (k) Metode Extended Angoff
dan Metode Ebel
Extended Angoff
Put. 2 Total
0,84 0,83 Kappa (k)
378 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 17, Nomor 2, 2013
Jika diperbandingkan nilai kappanya, wa sebagian besar skor peserta tes terletak maka metode Extended Angoff selalu meng-
di bagian bawah (skor rendah) dari hasilkan nilai kappa yang lebih rendah di-
distribusi skor. Selain itu juga diketahui bandingkan metode Ebel, baik pada putaran
bahwa nilai kurtosis skor tes berharga
1, putaran 2, maupun gabungan putaran 1 positif. Nilai kur-tosis yang berharga positif dan 2. Hal ini menunjukkan bahwa cutscore
menunjukkan distribusi yang lebih lancip yang dihasilkan metode Extended Angoff se-
(memuncak) yang berarti sebagian besar lalu terletak lebih jauh dari area distribusi
skor peserta mengumpul di sekitar nilai skor dengan tingkat densitas tertinggi diban-
modus (modus = 37,5 ) yang condong ke ding dengan cutscore yang dihasilkan metode
sebelah kiri dari kur-va distribusi. Oleh Ebel.
karena itu, bisa dipahami jika nilai kappa Sebagaimana telah diuraikan di depan,
yang dihasilkan metode Ebel selalu lebih metode Extended Angoff dan Ebel pada pe-
tinggi dibanding nilai kappa yang dihasilkan nelitian ini masing-masing menghasilkan ni-
metode Extended Angoff, karena cutscore lai cutscore 59 dan 50,98 pada skala 100. Di
yang dihasilkan metode Ebel selalu lebih samping itu, berdasarkan statistik deskriptif
dekat ke nilai modus (modus = 37,5 ) skor dapat diketahui bahwa nilai skew skor tes
peserta tes dibanding cutscore yang di- yang dihasilkan berharga positif. Nilai skew
hasilkan metode Extended Angoff sebagai- yang berharga positif mengindikasikan bah-
mana ditunjukkan oleh Tabel 9.
Tabel 9. KKM Metode Extended Angoff dan Metode Ebel vs Modus Skor Tes
KKM Extended Angoff
Modus Skor Tes Skor
KKM Ebel
n benar
Skor
n benar
Skor n benar
Intra-judge consistency diukur melalui Tabel 10 menunjukkan kepada kita intra-judge consistency baik di dalam maupun
bahwa magnitudo perubahan rating cutscore antar putaran. Intra-judge consistency across
individual panelis dari putaran 1 ke putaran rounds atau konsistensi intra-judge antarpu-
2 metode Extended Angoff lebih kecil di- taran dapat dilihat dari magnitudo perubah-
banding metode Ebel. Rata-rata perubahan an rating cutscore individual panelis dari pu-
untuk metode Extended Angoff adalah 1,5 taran ke putaran dan banyaknya rating butir
(3,75%) sementara untuk metode Ebel ada- yang berubah dari putaran ke putaran
lah 1,82 (4,54%). Ini berarti pada metode (Loomis et al., 2000, p.13). Tabel 10 me-
Extended Angoff setiap panelis rata-rata nunjukkan magnitudo perubahan rating
membuat perubahan keputusan sebesar cutscore individual panelis dari putaran 1 ke
3,75% dari keputusan sebelumnya. Semen- putaran 2 sementara Tabel 11 menunjuk-
tara pada metode Ebel setiap panelis rata- kan banyaknya butir yang rating cutscore
rata membuat perubahan keputusan sebe- butirnya berubah dari putaran 1 ke putaran
sar 4,54% dari keputusan sebelumnya.
2. Kedua tabel tersebut menggunakan basis Angka-angka ini menunjukkan bahwa intra- perhitungan banyaknya butir tes yaitu 40.
judge consistency across rounds pada metode Extended Angoff lebih baik dibanding pada
Komparasi Metode Standard Setting untuk Penentuan KKM − 379
Susi Anto, Djemari Mardapi Susi Anto, Djemari Mardapi
da metode Extended Angoff lebih konsisten sama sekali tidak melakukan perubahan atas dalam membuat keputusan atau penjurian
keputusan butir.
antar putaran dibanding panelis pada meto- Sementara itu, dibanding metode
de Ebel. Extended Angoff konsistensi panelis pada metode Ebel bisa dikatakan lebih buruk.
Tabel 10. Magnitudo Perubahan Rating Hampir seluruh panelis pada metode Ebel
Cutscore dari Putaran 1 ke Putaran melakukan perubahan di atas 20% dari bu-
2 Metode Extended Angoff dan tir yang ada. Hanya ada seorang panelis Metode Ebel
yaitu Panelis 1 yang melakukan perubahan sebanyak 1 digit. Sementara ada 4 panelis
Magnitudo Perubahan Rating Cutscore
yang melakukan perubahan 50% atau lebih
(Skala 40)
yaitu Panelis 3, Panelis 4, Panelis 7, dan Pa- Ext. Angoff
Ebel
nelis 10. Bahkan ada 2 panelis yang mela- kukan perubahan terhadap lebih dari 60%
1 3 butir yang ada, yaitu Panelis 2 dan Panelis 9. Panelis 2
Panelis 1
Tabel 11. Banyak Butir yang Berubah dari Putaran 1 ke Putaran 2 Metode Panelis 3
Extended Angoff dan Metode Ebel Panelis 4
Banyak Butir yang Berubah
Panelis 5
Ext. Angoff Ebel
2 10 Tabel 11 menunjukkan banyaknya
Panelis 8
butir yang rating cutscore butirnya berubah
10 30 dari putaran 1 ke putaran 2. Sebagaimana
Panelis 9
0 22 Tabel 10, Tabel 11 juga menggunakan basis
Panelis 10
perhitungan banyaknya butir tes yaitu 40.
2 13 Secara umum seluruh panelis baik pada
Panelis 11
metode Extended Angoff maupun metode
10 15 Ebel dapat dikatakan tidak konsisten kare- na melakukan perubahan terhadap kepu-
tusan butir. Hanya ada seorang panelis di metode Extended Angoff yang bisa dika-
380 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 17, Nomor 2, 2013
Jika dilihat rata-ratanya banyak kepu- rendah mengindikasikan rendahnya konsis- tusan butir yang berubah untuk metode
tensi intra-judge dalam putaran. Extended Angoff adalah 5,7 butir (14%)
Tabel 12 menunjukkan hasil pemeta- sementara untuk metode Ebel adalah 18
an antara tingkat kesulitan butir statistik dan butir (45%). Ini berarti pada metode Ex-
representasi tingkat kesulitan butir empirik tended Angoff banyaknya butir yang beru-
metode Extended Angoff dan metode Ebel. bah keputusannya pada putaran 2 untuk
Pada tabel tersebut, pemetaan dilakukan setiap panelis adalah 14% dari butir yang
dengan terlebih dahulu mengurutkan butir ada. Sementara pada metode Ebel banyak-
berdasar tingkat kesulitannya (p) secara sta- nya butir yang berubah keputusannya pada
tistik dari mudah ke sulit. Urutan repre- putaran 2 untuk setiap panelis adalah 45%
sentasi tingkat kesulitan butir empirik ke- dari butir yang ada. Angka-angka ini me-
dua metode dibuat mengikuti urutan ting- nunjukkan bahwa intra-judge consistency across
kat kesulitan butir secara statistik. Peng- rounds pada metode Extended Angoff lebih
urutan dengan cara itu memungkinkan kita baik dibanding pada metode Ebel. Dengan
mengukur masing-masing nilai korelasinya. kata lain panelis pada metode Extended
Tingkat kesulitan butir statistik me- Angoff lebih konsisten dalam membuat ke-
rupakan proporsi siswa yang menjawab be- putusan atau penjurian antar putaran di-
nar butir tersebut yang diperoleh dari Item banding panelis pada metode Ebel.
Analysis . Sementara representasi tingkat ke- Fenomena ini sekali lagi membukti-
sulitan butir empirik untuk metode Ex- kan premis yang telah dituliskan di depan
tended Angoff diperoleh dari banyaknya bahwa banyaknya estimasi yang mesti dila-
jawaban panelis yang bernilai 1 untuk tiap kukan oleh panelis berbanding lurus de-
butirnya atau bisa juga disebut rating cutscore ngan besarnya ragu yang mungkin muncul
butir. Untuk mendapatkan representasi dari para panelis. Oleh karena itu angka-
tingkat kesulitan butir empirik metode Ebel, angka tersebut bisa dijelaskan dengan cara
terlebih dahulu butir mudah diberi skor 3, menelusuri tahapan-tahapan yang ada pada
butir sedang diberi skor 2, dan butir sulit masing-masing metode. Disparitas yang cu-
diberi skor 1. Jumlah skor tingkat kesulitan kup tinggi antara kedua metode (14% versus
dari semua panelis untuk setiap bu-tirnya 45%) menunjukkan perbedaan potensi ra-
itulah yang merupakan representasi tingkat gu yang cukup signifikan. Angka itu bisa
kesulitan butir empirik untuk metode Ebel. mengatakan bahwa metode Ebel memiliki
Tabel 12 menunjukkan adanya nilai potensi ragu 3 kali lebih besar dari potensi
korelasi yang cukup tinggi antara tingkat ragu yang mungkin timbul pada metode
kesulitan butir statistik dan representasi Extended Angoff. Meski masih perlu dibuk-
tingkat kesulitan butir empirik baik pada tikan lagi, tapi angka itu sebanding dengan
metode Extended Angoff maupun pada proporsi banyaknya estimasi antara kedua
metode Ebel. Keseluruhan nilai korelasi metode. Jika metode Extended Angoff ha-
tersebut sudah jauh di atas angka yang di- nya membutuhkan satu jenis estimasi maka
persyaratkan Alderson yaitu 0,3. Ini me- pada metode Ebel dibutuhkan tiga jenis
nunjukkan bahwa para panelis baik pada estimasi.
metode Extended Angoff maupun metode Intra-judge consistency within rounds di-
Ebel, baik pada putaran 1 maupun putaran tentukan berdasarkan pemetaaan keputus-
2 telah memiliki nilai intra-judge consistency an rating setiap butir pada tabel tingkat ke-
within rounds yang memuaskan. Atau dengan sulitan item. Pemetaan itu akan diuji melalui
kata lain, tingkat konsistensi penjurian para nilai korelasinya. Nilai korelasi yang tinggi
panelis dalam tiap putaran sudah memuas- mengindikasikan tingkat konsistensi yang
kan.
memuaskan, sebaliknya nilai korelasi yang
Komparasi Metode Standard Setting untuk Penentuan KKM − 381
Susi Anto, Djemari Mardapi
Tabel 12. Pemetaan Tingkat Kesulitan Butir Statistik dan Representasi Tingkat Kesulitan Butir Empirik Metode Extended Angoff dan Metode Ebel
Representasi Tingkat Kesulitan Butir Empirik No Urut No Butir
Kategori
Putaran I
Putaran II
Ext. Angf
Ebel
Ext. Angf Ebel
382 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 17, Nomor 2, 2013
Tabel 12 juga memberi informasi ten- Kesimpulan di atas juga terlihat jelas tang kekurangtepatan estimasi beberapa bu-
pada Gambar 1 dan Gambar 2. Pada kedua tir oleh para panelis. Kekurangtepatan esti-
gambar tersebut sumbu aksis menunjukkan masi butir oleh para panelis itu terlihat
nomor urut berdasar tingkat kesulitan butir kongruen baik pada metode Extended An-
secara statistik. Sumbu ordinat mayor me- goff maupun pada metode Ebel. Butir-butir
nunjukkan representasi tingkat kesulitan bu- tersebut adalah butir nomor13, 19, 21, 31,
tir secara empirik untuk metode Extended
32, dan 36. Para panelis baik pada pada me- Angoff dan metode Ebel, sementara sumbu tode Extended Angoff maupun metode Ebel
ordinat minor menunjukkan tingkat kesulit- menganggap butir nomor 13, 19, 21, 31,
an butir secara statistik (p). dan 32 sulit sementara secara statistik butir
Pada kedua gambar, baik Gambar 1 terse-but termasuk dalam tingkat kesulitan
maupun Gambar 2 terlihat bahwa grafik se-dang. Begitu pula sebaliknya, para panelis
tingkat kesulitan butir secara statistik berge- baik pada pada metode Extended Angoff
rak secara tenang (garis tidak putus-putus) maupun metode Ebel menganggap butir
sementara grafik representasi tingkat ke- no-mor 36 mudah sementara secara statistik
sulitan butir secara empirik baik pada me- bu-tir tersebut termasuk dalam butir yang
tode Extended Angoff maupun metode Ebel sulit.
bergerak secara fluktuatif (garis putus-putus Jika kita bandingkan nilai korelasinya,
pendek dan panjang). Namun demikian, terlihat bahwa metode Extended Angoff me-
dari kedua gambar tersebut terlihat juga miliki nilai korelasi lebih tinggi dibanding
bahwa grafik nilai representasi tingkat ke- metode Ebel baik pada putaran 1 maupun
sulitan butir secara empirik pada metode putaran 2. Ini menunjukkan bahwa konsis-
Ebel selalu lebih fluktuatif dibanding me- tensi intra-judge dalam masing-masing putar-
tode Extended Angoff. Hal inilah yang an pada metode Extended Angoff lebih baik
menjelaskan mengapa nilai korelasi pada dibanding metode Ebel. Atau dengan kata
metode Ebel selalu lebih rendah dibanding lain, panelis pada metode Extended Angoff
nilai korelasi pada metode Extended Angoff. lebih konsisten dalam melakukan penjurian
Fluktuasi nilai ini berbanding terbalik de- di dalam setiap putaran dibanding panelis
ngan tingkat konsistensi penjurian. Semakin pada metode Ebel.
fluktuatif berarti semakin tidak konsisten.
Gambar 1. Pemetaan Tingkat Kesulitan Gambar 2. Pemetaan Tingkat Kesulitan Butir Statistik dan Representasi
Butir Statistik dan Representasi Tingkat Kesulitan Butir Empirik
Tingkat Kesulitan Butir Empirik Metode Extended Angoff dan
Metode Extended Angoff dan Metode Ebel Putaran 1
Metode Ebel Putaran 2
Komparasi Metode Standard Setting untuk Penentuan KKM − 383
Susi Anto, Djemari Mardapi
Inter-judge consistency dilihat dari sim- yang tersarang pada tiap selnya, baru pangan baku cutscore. Tabel 13 memperlihat-
kemudian menjumlahkan hasil perkalian kan simpangan baku cutscore panelis pada
dari 12 sel yang ada tersebut. metode Extended Angoff dan metode Ebel.
Kedua, metode Extended Angoff Tabel 13 tersebut menunjukkan bahwa sim-
membutuhkan waktu yang relatif lebih sedi- pangan baku cutscore metode Extended An-
kit dibandingkan metode Ebel. Pada meto- goff selalu lebih kecil dibanding metode
de Extended Angoff para panelis hanya di- Ebel baik pada putaran 1, putaran 2, mau-
minta membuat estimasi satu kali banyak pun gabungan putaran 1 dan 2. Hal itu
butir soal. Estimasi itu hanya mengenai mengindikasikan bahwa inter-judge consistency
mampu atau tidaknya siswa dalam men- metode Extended Angoff selalu lebih baik
jawab benar suatu butir. Sementara pada dibanding metode Ebel. Dengan kata lain
metode Ebel para panelis diminta setidak- rating cutscore individual masing-masing pa-
nya membuat estimasi dua kali jumlah butir nelis pada metode Extended Angoff selalu
soal. Dua jenis estimasi itu mengenai tingkat lebih konsisten dibanding rating cutscore indi-
kesulitan dan tingkat relevansi butir. Di vidual masing-masing panelis pada metode
samping itu panelis juga masih harus me- Ebel baik pada putaran 1 maupun putaran
nentukan estimasi proporsi butir terjawab
2. benar untuk 12 sel yang ada. Selain itu Tabel 13. Simpangan Baku Penjurian
tahapan sesudah estimasi pada metode Ebel Metode Extended Angoff dan
membutuhkan waktu yang lebih banyak Metode Ebel
dibanding metode Extended Angoff. Ketiga, tingkat akurasi nilai proporsi
Simpangan Baku Putaran
metode Extended Angoff cenderung lebih Ext. Angoff
tinggi dibanding metode Ebel. Sebab pada Pertama
Ebel
metode Extended Angoff proporsi ditentu- Kedua
3,977
6,476
kan untuk setiap butirnya sementara pada Total
metode Ebel, nilai proporsi ditentukan un- tuk setiap selnya. Hal ini membawa implika-
Jika kedua metode tersebut diban- si nilai proporsi pada metode Ebel kemung- dingkan, manakah yang lebih disarankan
kinan lebih bias dibanding nilai proporsi atau direkomendasikan untuk digunakan?
pada metode Extended Angoff. Penelitian ini menyimpulkan metode Ex- tended Angoff lebih disarankan dibanding
Umpan Balik Panelis
metode Ebel. Argumen yang mendasari Dengan menggunakan metode Exten- rekomendasi itu adalah sebagai berikut:
ded Angoff diperoleh cutscore 59 sementara Pertama, metode Extended Angoff