ANALISIS METODE CHEATING PADA TES BERSKALA BESAR
ANALISIS METODE CHEATING PADA TES BERSKALA BESAR
1)
Yance Manoppo, 2) Djemari Mardapi
1)
Universitas Pattimura, 2) Universitas Negeri Yogyakarta
1)
molucanano@yahoo.com, 2) djemarimardapi@gmail.com
Abstrak
Penelitian ini bertujuan untuk mengetahui: (1) karakteristik butir soal Kimia Ujian Nasional berdasarkan teori tes klasik dan teori respon butir; (2) besarnya kecurangan yang terjadi dengan menggunakan Metode Angoff's B-index, Metode Pair1, Metode Pair2, Metode Modified Error Similarity Analysis (MESA) dan Metode G2; (3) metode yang lebih banyak mendeteksi adanya kecurangan dalam pelaksanaan UN Kimia tingkat SMA/MA Negeri tahun pelajaran 2011/2012 di Provinsi Maluku. Hasil analisis dengan pendekatan teori tes klasik menunjukkan 77,5% butir memiliki tingkat kesulitan butir berfungsi baik, 55% butir daya bedanya belum memenuhi syarat, dan 70% butir memiliki pengecoh berfungsi baik dengan indeks reliabilitas tes 0,772. Analisis dengan pendekatan teori respons butir menunjukkan 14 (35%) butir cocok dengan model, fungsi informasi maksimum 11,4069 pada θ = -1,6, dan besarnya kesalahan pengukuran 2,296. Jumlah pasangan yang diduga curang adalah: menurut Metode Angoff's B- index ada 13 pasangan, menurut Metode Pair1 ada 212 pasangan, menurut Metode Pair2 ada 444 pasangan, menurut Metode MESA ada 7 pasangan, dan menurut Metode G2 ada 102 pasangan. Metode yang paling banyak mendeteksi kecurangan secara berturut-turut adalah: Metode Pair2, Metode Pair1, Metode G2, Metode Angoff's B-index, dan Metode MESA.
Kata kunci : ujian nasional, karakteristik butir, metode kecurangan
AN ANALYSIS OF METHOD OF CHEATING ON LARGE TEST SCALE
1)
Yance Manoppo, 2) Djemari Mardapi
1)
Universitas Pattimura, 2) Universitas Negeri Yogyakarta
1)
molucanano@yahoo.com, 2) djemarimardapi@gmail.com
Abstract
This study aimed to reveal: (1) the characteristics of items of Chemistry Test in National Examination by using the classical test theory and item response theory; (2) the amount of cheating which occured by using Angoff's B-index Method, Pair 1 Method, Pair 2 Method, Modified Error Similarity Analysis (MESA) Method, and G2 Method; (3) the methods that detected more cheating in the implementation of the Chemistry Test in National Examination
for high schools in the academic year 2011/2012 in Maluku Province. The results of the analysis with the classical test theory approach show that 77.5% items have item difficulty functioning well, 55% items have discrimination that has not met the requirement yet, and 70% items have distractor that works well with the index reliability test of 0,772. The analysis using the item response theory approach shows that 14 (35%) items fit with the model, the maximum function information is 11,4069 at θ = -1,6, and the magnitude of the error of measurement is 2,296. The number of pairs who are suspected of cheating is as follows: 13 pairs according to Angoff's B-index Method, 212 pairs according to Pair 1 Method, 444 pairs according to Pair 2 Method, 7 pairs according to MESA Method, and 102 pairs according to G2 Method. The most widely detecting cheating in a row is a Pair 2 Method, Pair 1 Method, G2 Method, Angoff's B-index Method, and MESA Method.
Keywords: national examination, items characteristics, methods of cheating
Analisis Metode Cheating pada Tes Berskala Besar − 115
116 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 1, 2014
Pendahuluan
Pendidikan nasional bertujuan untuk mengembangkan potensi peserta didik agar menjadi manusia yang beriman dan ber- takwa kepada Tuhan Yang Maha Esa, ber- akhlak mulia, sehat, berilmu, cakap, kreatif, mandiri, dan menjadi warga negara yang demokratis serta bertanggung jawab. Tujuan tersebut tercantum dalam Undang-Undang Nomor 20 Tahun 2003 Bab 2 pasal 3 yang ditetapkan oleh Pemerintah Indonesia me- lalui Direktorat Jenderal Pendidikan Dasar
dan Menengah Departemen Pendidikan dan Kebudayaan yang kemudian ditegaskan kem-
bali dalam Peraturan Pemerintah Republik Indonesia Nomor 19 Tahun 2005 Bab 2 pasal 4, mengenai tujuan standar pendidikan nasional.
Ujian Nasional (UN) merupakan sis- tem evaluasi standar pendidikan dasar dan menengah secara nasional. UN dilakukan oleh Depdiknas (Undang-Undang Republik Indonesia Nomor 20 Tahun 2003). Evaluasi UN dilakukan oleh lembaga yang mandiri secara berkala, menyeluruh, transparan, dan sistematik untuk menilai pencapaian standar nasional pendidikan. Proses pemantauan evaluasi UN harus dilakukan secara berke- sinambungan. Pelaksanaan UN diharapkan dapat dipetakan tingkat kemampuan se- kolah sehingga dapat menentukan skala prioritas penanganan proses pendidikan. Kejujuran dan prestasi menjadi kata kunci dalam pelaksanaan UN. Untuk mengukur objektivitas, validitas, dan reliabilitas mutu hasil UN, dapat ditelusuri dengan mengem- bangkan metode analisis pola jawaban pe- serta ujian. Analisis pola jawaban dapat mengidentifikasi adanya intervensi dari luar atau ketidakjujuran peserta ujian dalam menjawab soal sewaktu penyelenggaraan UN. Salah satu teknik untuk mendeteksi kejujuran dalam pelaksanaan UN yaitu de- ngan melihat pola jawaban peserta ujian yang bersumber dari Badan Standar Nasio- nal Pendidikan (BSNP).
Kenyataan bahwa sistem pendidikan Indonesia yang menggunakan nilai dari tes atau evaluasi belajar terhadap materi yang diberikan sebelumnya untuk menunjukkan
kemajuan dan penguasaan ilmu anak didik, menyebabkan masyarakat memandang pres- tasi belajar hanya dari pencapaian nilai yang tinggi, bukan pada prosesnya. Pandangan tersebut menimbulkan tekanan pada siswa untuk mencapai nilai yang tinggi. Tekanan yang dirasakan akan membuat siswa lebih berorientasi pada perolehan nilai, bukan pada pemahaman ilmu. Siswa dapat mem- persepsi ujian sebagai alat untuk menyusun peringkat dan dapat menyebabkan dirinya mengalami kegagalan, bukan sebagai instru- men yang dapat menunjukkan kemajuan dalam proses belajar.
Cheating (ketidakjujuran) pada tes biasanya sering terjadi di semua tingkat dan situasi tes, dari mulai tingkat kelas (Lim & Sean, 2001; Einsenberg, 2004; William, 2002; Anderman, Griesinger & Westerfild, 1998) sampai high school atau academic institution (Anderman, Cupp & Lane, 2010; Storm & Storm, 2007; Lama, 2008; Chula, Guyette & Piotrowoski, 2009; Williams, Craig & Paulhus, 2010; McCabe, Trevino & Butterfield, 2001). Cheating berakibat buruk pada rasa keadilan dan kejujuran dari pe- serta tes serta dapat merusak tujuan tes tersebut di lakukan. Untuk high-stake assess- ments akibat dari ketidakjujuran ini sangat besar karena akan menurunkan tingkat ke- percayaan masyarakat terhadap penyeleng- garaan tes itu sendiri.
Perilaku cheating banyak diakibatkan oleh pengaruh kelompok yang orang cen- derung berani melakukan karena melihat orang lain di kelompoknya juga melakukan. Apabila kecenderungan ini berlangsung se- cara terus-menerus, maka cheating akan men- jadi kebiasaan seseorang, yang akan di- transfer tidak hanya pada kegiatan sekolah lainnya tetapi kepada kegiatan kemasyara- katan pada umumnya berdasarkan prinsip transfer of learning. Pada akhirnya, cheating akan menimbulkan kehancuran di masa mendatang. Hal ini sesuai dengan apa yang dinyatakan Cizek (2001, pp.3-4) sebagai berikut:
There are many forms of cheating that can occur on such tests. In general, cheating can be defined as any action that violates the rules for There are many forms of cheating that can occur on such tests. In general, cheating can be defined as any action that violates the rules for
porkan bahwa di antara mahasiswa, pria examinees, or any action on the part of an
melaporkan kecurangan lebih daripada wa- examinee or test administrator that decreases
nita, siswa yang lebih muda melaporkan the accuracy of the intended inferences arising
kecurangan lebih daripada siswa yang lebih from the examinee's test score or performance.
tua, dan siswa kemampuan rendah melapor- Berdasarkan pendapat Cizek tersebut, diper-
kan kecurangan lebih daripada kemampuan oleh bahwa kecurangan secara umum dapat
siswa yang lebih tinggi. Dalam internasional didefinisikan sebagai perilaku yang menya-
studi tentang kecurangan, Evans, Craig & lahi aturan dalam penyelenggaraan tes, peri-
Mietzel (Anderman, Griesinger & Wester- laku apa pun yang memberikan peserta uji-
field, 1998, p.85) menemukan bahwa siswa an keuntungan yang tidak wajar atas peserta
dari berbagai negara ditafsirkan memiliki ujian lainnya, atau tindakan lain dari penye-
kecurangan dalam cara yang berbeda. lenggara ujian yang mengurangi keakuratan
Perilaku cheating tidak hanya terjadi hasil dimaksud yang berasal dari skor tes
pada siswa di SMP atau SMA tetapi terjadi atau kinerja peserta ujian.
pula di bangku kuliah atau universitas. Storm Sementara Lewkowicz (2007, p.147)
& Storm (2007, pp.105-106) menyatakan mengatakan bahwa :
beberapa data yang memprihatinkan adalah Cheating, defined as
“to full by trickery,” is survei nasional yang dilakukan oleh Josephson seen as behavior that seems to be based, at
Institute of ethics di Amerika pada tahun 2006 least partly, on several assumptions, including,
dengan responden 36.000 siswa Sekolah “I don’t have to work hard at school. I’ll be Menegah Pertama menemukan 60% siswa
lucky and wi n the lottery or become famous,” menerima dan mengakui pernah melakukan
and “I will never succeed so why bother to kecurangan pada saat ujian dan pengerjaan
try, ” and “It is awful, and I must no accept tugas. Terjadi peningkatan sebesar 1% da-
myself until I measure up to everyone else. lam kurun waktu 2 tahun, 95% di antaranya
mengaku bahwa tidak pernah ketahuan ke- Pendapat Lewkowicz menjelaskan bahwa
tika melakukan kecurangan. permasalahan kecurangan didefinisikan sebagai sesuatu
ini dalam berbagai kajian dan penelitian per- yang penuh dengan tipu daya yang meng-
lu untuk segera mendapatkan penanganan. ajarkan siswa tidak perlu belajar keras di
Temuan hasil penelitian lain yang sekolah atau siswa menganggap dirinya
menarik adalah dari The Epoch Time 2005 tidak akan berhasil jadi mengapa harus
yang mengambil data dari 90 mahasiswa. bersusah payah mencoba. Kondisi ini dapat
Dari jumlah tersebut, 83% mengaku pernah menghilangkan rasa kepercayaan diri dari
cheating ketika pelaksanaan tes atau ujian. siswa untuk sama seperti teman-teman
(Strom & Strom, 2007, p.105). Selain itu, di lainnya. China akhirnya diterapkan adanya sanksi
Permasalahan cheating merupakan ma- bagi mahasiswa yang cheating akan dihukum salah yang dihadapi oleh semua negara.
dengan 7 tahun penjara. Menurut Callahan cheating pada akhirnya menjadi perhatian
(Strom & Storm, 2007, p.105), perilaku internasional. Cheating sudah tidak asing lagi
cheating juga ditemukan pada siswa di bagi pelajar dan mahasiswa (Bogle, 2000;
Australia, Inggris, India, Jepang, Korea, Milliron & Sandoe, 2008). Setiap orang pasti
Spanyol, dan Skotlandia. Anderman, Griesi- ingin mendapat nilai yang baik dalam ujian,
nger & Westerfield (1998: 84) menjelaskan dan sudah tentu berbagai macam cara di-
bahwa menyontek merupakan hal yang lakukan untuk mencapai tujuan itu. Masalah
biasa di kalangan remaja karena siswa seko- cheating selalu terkait dengan tes atau ujian.
lah lanjutan lebih berfokus pada peringkat Penelitian sebelumnya tentang cheating
dan performa dibandingkan dengan siswa sering terfokus pada deskriptif isu-isu se-
sekolah dasar. Brades (Cizek, 1999, p.15) perti gender dan perbedaan budaya. Sebagai
menemukan bahwa 65% dari siswa sekolah contoh, Newstead et al. (Anderman, Griesi-
Analisis Metode Cheating pada Tes Berskala Besar − 117
Yance Manopo, Djemari Mardapi Yance Manopo, Djemari Mardapi
tuk pilihan berganda. Tes seperti ini mem- Sementara itu Widiatmo (2009, p.219)
butuhkan pemahaman yang komprehensif menjelaskan bahwa untuk mengurangi ke-
dan mendalam dari peserta UN sehingga mungkinan peserta uji melakukan kecurang-
mampu memberikan jawaban yang benar an, banyak usaha preventif yang dilakukan
pula. Dengan demikian, perangkat tes harus untuk mengurangi kesempatan peserta tes
memiliki kehandalan, kesahihan, daya pem- dalam melakukan cheating. Usaha-usaha ter-
beda, distraktor untuk mendeteksi kemam- sebut antara lain dengan menambah proctors
puan siswa secara objektif. Adanya perang- (pengawas tes) sehingga peserta uji dapat
kat tes yang kurang baik menyebabkan diawasi, dengan membagikan lebih dari satu
praktik-praktik cheating (kecurangan) lebih paket tes, dan memperlebar jarak tempat
mudah dilakukan oleh karena kesulitan sis- duduk antarpeserta tes. Sebagai ilustrasi,
wa dalam menjawab soal dengan benar di- American College Testing (ACT), sebuah lem-
samping adanya tekanan untuk harus lulus baga testing ternama di United State of Ame-
dalam Ujian Nasional.
rica, membagikan secara random 8 sampai Berdasarkan uraian di atas maka yang
12 paket tes setiap kali tes dilaksanakan. Jika dimaksud dengan cheating dalam tulisan ini ada 30 peserta uji dalam satu ruangan dan
adalah segala perbuatan atau trik-trik yang ada 10 paket tes yang dibagikan, maka ke-
tidak jujur, perilaku tidak terpuji atau mungkinan ada 3 orang yang akan memper-
perbuatan curang yang dilakukan oleh sese- oleh paket tes yang sama. Lebih lanjut,
orang untuk mencapai keberhasilan dalam kemungkinan dua peserta uji yang duduk
menyelesaikan tugas-tugas akademik ter- berdekatan memperoleh paket tes yang
utama yang terkait dengan evaluasi/ujian sama sangat kecil 0,01 (satu berbanding
hasil dengan mengabaikan aturan dan ke- 100). Dengan usaha-usaha preventif seperti
sepakatan yang ada. Perilaku cheating terjadi itu kemungkinan peserta uji melakukan
karena masyarakat memiliki pandangan kecurangan sangat kecil. Kenyataan lapang-
bahwa prestasi belajar tercermin dari pen- an membuktikan usaha-usaha preventif ter-
capaian nilai yang tinggi, sehingga membuat sebut tidak efektif.
siswa terpaku untuk memperoleh nilai tinggi Faktor kemajuan teknologi juga mem-
dengan cara apa pun. Masyarakat cenderung berikan kontribusi terhadap cheating pada
semakin permisif sehingga menyebabkan jalannya UN di sekolah-sekolah. Menurut
perilaku cheating semakin sulit dihilangkan. Aziz (2012, p.3) yang dimuat pada Tempo
Fakta-fakta tersebut menunjukkan bahwa Online soal UN 2012 untuk Sekolah Me-
cheating merupakan suatu permasalahan yang nengah Pertama (SMP) di Kota Sukabumi,
menarik untuk dianalisis lebih lanjut. Untuk Jawa Barat, diduga bocor. Hal itu ditandai
itu, melalui penelitian ini penulis akan dengan beredarnya kunci jawaban di kala-
meneliti beberapa metode yang dipakai ngan siswa melalui short message service (SMS)
untuk mendeteksi kemungkinan peserta uji- padahal pihak dinas pendidikan setempat
an melakukan cheating atau sering diidentik- menjamin UN di Kota Sukabumi tidak ada
kan dengan collusion dengan melihat pola kebocoran. Dengan kecanggihan alat komu-
respon jawaban dari peserta tes (examines). nikasi, tentunya peristiwa yang sama dapat
Oleh karena itu, penelitian ini bertujuan terjadi di setiap daerah yang telah terjangkau
untuk mengetahui: (1) karakteristik butir sarana komunikasi seluler ini.
soal Kimia Ujian Nasional berdasarkan teori Selain permasalahan bocornya tes,
tes klasik dan teori respon butir; (2) besar- pencapaian kualitas soal sesuai dengan ka-
nya kecurangan yang terjadi dengan meng- rakteristik butir tes yang baik sangat dipeng-
gunakan Metode Angoff's B-index, Metode aruhi sumber daya penyusun tes. Sebagai-
Pair1, Metode Pair2, Metode Modified Error mana yang diketahui bersama, perangkat tes
Simila-rity Analysis (MESA) dan Metode G2; UN disusun dalam bentuk tes objektif de-
(3) metode yang lebih banyak mendeteksi
118 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 1, 2014 118 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 1, 2014
4. Mendeteksi cheating dengan Metode Kimia tingkat SMA/MA Negeri tahun
Angoff's B-index, Metode Pair 1, Metode pelajaran 2011/2012 di Provinsi Maluku.
Pair 2, Metode MESA, dan Metode G2 dengan software Integrity TM .
Metode Penelitian
5. Menentukan keakuratan dari kelima Jenis Penelitian
metode deteksi cheating dengan melihat Penelitian ini merupakan penelitian
metode mana yang dapat mendeteksi kuantitatif menggunakan pendekatan ex-post
cheating lebih banyak. facto.
Data, Intrumen, dan Teknik Pengumpulan Waktu dan Tempat Penelitian
Data
Penelitian ini dilakukan di Lab Kom- Data yang digunakan dalam penelitian puter Pascasarjana Universitas Negeri Yog-
ini adalah respon peserta UN di Propinsi yakarta setelah memperoleh data respon
Maluku khususnya mata pelajaran kimia sampel (LJK) dari Puspendik Kemdikbud
tingkat SMA/MA sekolah Negeri Paket soal Jakarta. Kegiatan penelitian ini dilaksanakan
C72 sebanyak 1620 siswa. Pengumpulan pada Maret 2013.
data dalam penelitian ini dilakukan dengan menggunakan teknik dokumentasi, yakni
Target/Subjek Penelitian mengutip respon siswa (LJK) pada perang- Target dalam penelitian ini adalah
kat tes UN Kimia Paket C72 SMA/MA perangkat tes UN Kimia tingkat SMA/MA
Negeri di Provinsi Maluku tingkat 2011/ Negeri tahun pelajaran 2011/2012 di Prov-
2012. Data-data berupa LJK diperoleh dari insi Maluku.
Puspendik Jakarta.
Prosedur
Teknik Analisis Data
1. Menganalisis butir tes dengan perangkat Analisis Karakteristik Butir Soal
lunak Iteman versi 3.0 untuk melihat Analisis terhadap butir soal secara karakteristik butir tes yang meliputi kuantitatif (empiris) menggunakan pende-
tingkat kesukaran butir, daya pembeda katan teori tes klasik dan teori respon butir butir, dan statistik sebaran jawaban. Se-
(IRT).
lain itu ditentukan juga kehandalan/relia-
1. Analisis Empiris dengan Teori Tes Klasik bilitas tes, kesalahan pengukuran (SE)
a. Tingkat Kesukaran Butir Soal dan distribusi skor.
2. Menganalisis butir dengan pendekatan dengan menghitung proporsi menja-
Tingkat kesukaran butir dianlisis
teori respons butir menggunakan prog- wab benar (p) sebuah butir soal. Apa- ram Bilog-MG 3.0. Dari analisis ini diper- bila indeks p<0,30 maka butir soal
oleh parameter butir, parameter peserta, termasuk sukar, apabila 0,30≤ p ≤0,70 fungsi informasi tes, dan grafik informasi maka butir soal memiliki tingkat kesu- tes. Dari analisis ini diperoleh besarnya karan yang sedang, jika p > 0,70 maka Fungsi Informasi maksimum tiap butir, soal termasuk soal yang mudah. Akan
yang diambil
tetapi oleh karena Ujian Nasional di- antara -4,0 dan 4,0 dengan interval 0,25.
dan skala kemampuan
kembangkan berdasarkan acuan krite-
3. Menaksir kecocokan data dengan model ria (tidak membedakan) bukan acuan
dan parameter butir dengan program norma (dapat membedakan), maka be- Bilog-MG 3,0. Kecocokan butir dengan
sarnya tingkat kesukaran memberikan model dapat dilihat dari harga p yang
makna jika minimal 75% (KKM= 75) muncul dari hasil analisis dengan prog-
siswanya bias menjawab butir dengan ram Bilog-MG. Untuk butir yang memiliki
benar maka siswa tersebut dikatakan harga p lebih kecil dari 0,01 dianggap
sudah “ berhasil” atau dengan kata lain tidak cocok dengan model logistik 2-
guru telah berhasil dalam mengajar. parameter.
Analisis Metode Cheating pada Tes Berskala Besar − 119
Yance Manopo, Djemari Mardapi
Menurut Shapiro (2011, p.17) acuan salah serta koefisien korelasi biserial. butir criteria juga dapat digunakan dalam
yang memiliki nilai koefisien biserial nega- mencari sejauhmana permasalahan yang tif dapat mengganggu proses analisis se-
dihadapi siswa dalam belajar sehingga lanjutnya, sehingga butir tersebut tidak dapat dicari jalan keluarnya.
diikutkan dalam analisis berikutnya. Jum-
b. Daya Pembeda Butir Soal lah butir yang tidak diikutkan untuk ta- Daya beda butir soal (item) adalah
hap analisis selanjutnya terdiri dari 2 butir korelasi antara skor butir soal dengan
tes Kimia UN SMA/MA Paket C72 tahun skor total, dihitung dengan rumus ko-
pelajaran 2011/2012 Provinsi Maluku. relasi point biserial. Besarnya daya beda
Fase kedua, estimasi parameter teori butir soal untuk menyatakan bahwa
respon butir. Pada fase ini diperoleh butir soal baik adalah minimal 0,3. Se-
tentang informasi parameter butir sesuai dangkan item soal dengan point biserial
dengan model teori tespon butir yang di bawah 0,3 termasuk item yang kurang digunakan. Selanjutnya, untuk model 1-
baik. PL didapatkan estimasi tingkat kesukar-
c. Keberfungsian Pengecoh an, model 2-PL diperoleh estimasi para- Untuk mengetahui suatu pengecoh
meter berupa tingkat kesukaran dan daya berfungsi secara baik dapat dilihat dari
beda, sedangkan model 3-PL didapatkan distribusi jawaban. Suatu pengecoh da-
informasi tentang tingkat kesukaran, daya pat dikatakan berfungsi baik jika paling
beda, dan tebakan semu. Selain para- sedikit pilihan jawaban dipilih oleh 5%
meter butir, pada fase kedua juga dihasil- peserta tes. Beberapa literatur pada pe-
kan statistik kecocokan suatu butir de- nelitian yang lain juga menyebutkan
ngan model atau goodness of fit statistic. 2%, tetapi sebenarnya jika ada yang
Model yang digunakan untuk estimasi menjawab saja sudah bisa dikategori-
parameter adalah model logistik yang kan bahwa pengecohnya (distractor) su-
banyak menerima butir yang cocok. dah berfungsi dengan baik.
Secara empiris, kualitas butir ditelaah
d. Indeks Reliabilitas. berdasarkan kecocokan data dengan mo- Nilai indeks reliabilitas tes dapat
del dan nilai parameter butir. Kecocokan dilihat pada nilai koefisien alpha. Se-
suatu butir dengan model dapat dilihat makin besar nilai alpha menunjukkan
dari nilai chi kuadrat butir dibandingkan semakin reliabel tes tersebut dan sema-
dengan harga kritik distribusi chi kuadrat kin kecil tingkat kesalahan pengukuran.
sesuai dengan dk butir yang bersangkutan Standar yang digunakan dalam peneliti-
pada taraf signifikansi α. Butir dikatakan an ini adalah yang mensyaratkan instru-
tidak cocok model jika nilai 2 butir lebih men yang reliabel haruslah memiliki
besar dari harga distribusi 2 pada nilai koefisien reliabilitas minimal 0,7.
2. Analisis Empiris Butir dengan Teori kritisnya, sebaliknya butir cocok dengan
Respon Butir 2 model jika nilai item lebih kecil atau
Analisis dengan program Bilog-MG sama dengan nilai distribusi 2 . Atau di- menghasilkan output dalam bentuk tiga
katakan cocok model jika probabilitas fase. Fase pertama merupakan estimasi
lebih besar dari 0,01. 2 butir berdasar teori klasik, fase kedua estimasi parameter butir berdasar Teori
Berdasarkan perbandingan ketiga mo- Respons Butir dan fase ketiga estimasi
del parameter logistik untuk uji kecocok- kemampuan peserta.
an model, maka model 2-PL pada Pada fase pertama diperoleh informa-
umumnya lebih banyak menghasilkan si tentang banyaknya peserta tes yang
butir yang fit (cocok). Untuk keseragaman menjawab benar, proporsi peluang men-
model analisis, estimasi parameter butir jawab benar dibagi peluang menjawab
untuk seluruh materi uji dianalisis meng- gunakan model 2-PL.
120 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 1, 2014
Fase ketiga didapatkan estimasi para- rata-rata dapat menjawab dengan benar se- meter kemampuan peserta dan fungsi in-
besar 31 butir soal (mean= 30,981), berarti formasi tes. Pada penelitian ini informasi
rata-rata lebih dari setengah (75%) dari yang digunakan hanya fungsi informasi
jumlah butir soal dapat dijawab dengan be- tes, sehingga estimasi parameter kemam-
nar oleh peserta ujian, skor tertinggi 38 dan puan peserta tidak dianalisis. Besarnya
terendah 6. Nilai rerata (30,981) yang ber- fungsi informasi tes dihitung mengguna-
dekatan dengan nilai median (32,00). Rata- kan program Excel.
rata tingkat kesukaran butir soal pada Berdasarkan kriteria di atas, untuk me- umumnya sedang (mean p=0,775), cende-
nentukan kualitas butir yang baik dengan rung banyak pada kisaran indeks 0,30 sampai pendekatan teori respon butir didasarkan
0,70. Butir soal cukup mampu membedakan pada kriteria: (1) butir cocok model, (2)
kelompok siswa berkemampuan tinggi de- mempunyai daya beda 0 sam-pai 2, dan
ngan kelompok siswa berkemampuan ren- (3) tingkat kesulitan -2 hingga +2 (Ham-
dah, hal tersebut dinyatakan oleh rerata bleton & Swaminathan, 1985, p.36). indeks daya pembeda 0,331.
Analisis Cheating Indeks reliabilitas soal 0,772 dapat di-
nyatakan baik, artinya 77,2% perbedaan skor Selanjutnya, untuk mendeteksi adanya
yang terdapat pada peserta ujian adalah ke- cheating maka digunakan software Integrity .
TM
mampuan yang sebenarnya, sedangkan Software ini adalah sebuah aplikasi interface
22,8% perbedaan skor yang ada merupakan online yang aman dan dirancang untuk
kesalahan pengukuran. Menurut Linn (Mar- menganalisis data ujian pilihan ganda.
dapi, 1999, p.14), kesalahan pengukuran Program ini mengevaluasi statistik kejujuran
bisa disebabkan oleh variasi acak dalam diri suatu tes dan kejujuran akademik siswa yang
manusia, faktor lingkungan, subjektivitas mengikuti tes. Integrity menggunakan file data
pengukur, dan alat ukur. Kesalahan baku yang dikirimkan oleh pengguna (client) untuk
pengukuran pada perangkat soal hasil ana- mendapatkan informasi statistik uji secara
lisis secara klasik adalah sebesar 2,209. rinci, serta laporan statistik deteksi penyalin-
an jawaban secara rinci. Tabel 1. Karakteristik Tes Kimia UN Paket
72 Tahun Pelajaran 2011/2012
Hasil Penelitian dan Pembahasan
dengan Program Iteman Karakteristik Butir Tes Klasik dengan
Nilai Program Iteman
Karakteristik
40 Statistik Butir Soal
N of Item
1620 Pada tampilan hasil statistik butir soal
N of Examinees
30,981 dapat diketahui hasilnya untuk soal yang di-
Mean
kategorikan sukar atau tidak mencapai ke-
21,441 berhasilan 4 butir, kategori kurang berhasil
Variance
Std. Dev.
-1,776 butir. Soal yang memiliki daya beda yang
5 butir, dan yang mencapai keberhasilan 31
Skew
4,593 baik 22 butir, tidak baik 18 butir sedangkan
Kurtosis
6,000 untuk pengecoh 28 butir yang tergolong
32,000 Statistik Tes/Skala
Median
0,772 Berdasarkan statistik hasil analisis
Alpha
2,209 program Microcat Iteman versi 3.0 terhadap
SEM
Mean P
40 butir soal Kimia UN Paket C72 tingkat SMA/MA tahun pelajaran 2011/2012 yang
0,331 direspon oleh peserta ujian sebanyak 1620
Mean Item-Tot.
0,527 orang pada Tabel 1 dapat bahwa peserta
Mean Biserial
Analisis Metode Cheating pada Tes Berskala Besar − 121
Yance Manopo, Djemari Mardapi
Berdasarkan Tabel 1, rerata tingkat ke- butir diikutkan pada analisis berikutnya atau sulitan dan daya pembeda soal yaitu 0,775
tidak. Fase pertama hasil output Bilog-MG dan 0,331 artinya soal tes ini rata-rata di-
menunjukan bahwa dari 40 butir yang jawab dengan benar butirnya sebesar 77,5%
dianalisis terdapat 16 butir soal dengan atau dengan kata lain apabila dengan Kri-
kategori yang tidak baik atau sukar (butir teria Ketuntasan Minimal (KKM) sebesar
soal nomor 3,21, 22, 33, 36, 39) sedangkan
75 maka dapat ditafsirkan bawa tingkat ke- sisanya adalah berada pada kategori sedang berhasilan guru dalam melaksanakan proses
dan mudah. Berdasarkan daya beda butir tes pembelajaran sudah berhasil, serta soal da-
terdapat 16 butir soal dengan kategori tidak pat membedakan siswa yang berkemampu-
baik (butir soal nomor 3, 9, 11, 14, 18, 19, an tinggi dan berkemampuan rendah se-
21, 22, 26, 27, 28, 33, 36, 38, 39 40), dan 24 besar 33,1%. Hasil analisis soal Kimia UN
butir soal berkategori baik (butir soal Paket C72 menunjukkan bahwa tes tersebut
nomor 1, 2, 4, 5, 6, 7, 8, 10, 12, 13, 15, 16, memiliki reliabilitas yang baik yaitu di atas
17, 20, 23, 24, 25, 29, 30, 31, 32, 34, 35, 37). 0,70. Kesalahan pengukuran dapat disebab-
Dalam konteks UN yang beracuan kriteria kan oleh beberapa faktor, seperti lingkung-
(criterion referenced test(CRT)) butir soal dengan an ketika ujian yang kurang mendukung,
tingkat kesulitan mudah dapat digunakan. kondisi psikologis maupun biologis peserta
Butir soal yang tidak diikutkan dalam tes atau terjadi kecurangan ketika pelaksana-
fase pertama disajikan pada Tabel 2.
Tabel 2. Butir Hasil Analisis Bilog Fase serta atau adanya bocoran kunci jawaban.
an ujian seperti saling kerja sama antara pe-
Pertama yang Tidak Dapat Berdasarkan analisis pogram Iteman, Dilanjutkan ke Fase Kedua soal UN Kimia Paket C72 memiliki kualitas
baik, karena 31 (77,5%) butir soal meme-
Correlation
Keterangan nuhi kriteria dan 9 (22,5%) butir soal yang
No
Biserial
tidak memenuhi kriteria. Hal ini didukung
Tidak Dilanjutkan juga dengan 70% pengecoh bekerja dengan
baik meskipun dari kategori daya beda
Tidak Dilanjutkan hanya 55%. Hasil temuan dari 18 butir
Tidak Dilanjutkan tersebut terdapat 2 butir soal dengan tanda
”check the key” dari print out program Iteman, Tidak Dilanjutkan yaitu butir soal nomor 21 dan 39. Tanda
Tidak Dilanjutkan tersebut merupakan suatu peringatan bagi
Tidak Dilanjutkan pembuat soal untuk melihat kembali pada
Tidak Dilanjutkan pilihan jawaban apakah sudah tepat atau
belum. Selanjutnya, dari 40 butir soal Kimia
Tidak Dilanjutkan Paket soal C72 yang diujikan secara nasional
Tidak Dilanjutkan tahun pelajaran 2011/2012 di Provinsi Ma-
luku ditemukan 9 butir soal yang perlu di- Tidak Dilanjutkan periksa kembali sebelum digunakan. De-
Tidak Dilanjutkan ngan demikian, berdasarkan kriteria yang
Tidak Dilanjutkan telah ditetapkan dalam penentuan penerima-
33 -0,032
an butir soal, maka butir soal yang tidak
Tidak Dilanjutkan sesuai dengan teori tes klasik adalah se-
Tidak Dilanjutkan banyak 5 (12,5%) butir perlu direvisi dan 4
Tidak Dilanjutkan (10%) butir perlu diganti.
39 -0,044
Tidak Dilanjutkan Karakteristik Butir Soal berdasarkan Pendekatan IRT
Suatu butir dengan biserial kurang dari Pada analisis fase pertama, nilai biserial
0,3 tidak diikutkan pada analisis berikutnya, digunakan untuk menentukan apakah suatu
karena akan mengganggu proses analisis
122 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 1, 2014 122 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 1, 2014
Paket C72 dengan IRT putusan bias. Keputusan bias yang terjadi
akan cenderung menolak butir pada sampel Kecocokan
a b Ket yang besar dan menerima butir pada sampel model
Butir
yang kecil. Menarik jika diperhatikan butir
Cocok Baik dengan biserial pada output tersebut yang me-
1 0,468 -1,910
TC TB miliki nilai negatif dimana setelah dikorelasi-
2 0,492 -4,105
Cocok TB kan dengan bentuk butir pertanyaan, ternya-
4 0,727 -2,689
ta opsi jawaban yang diberikan memberikan
Cocok TB sedikit kebingungan bagi siswa dalam men-
5 0,716 -2,474
Cocok TB jawab oleh karena terlalu sulit dibedakan
6 0,572 -2,863
TC TB butir jawabannya.
7 0,587 -3,432
Cocok Baik Pada fase kedua hasil analisis model
8 1,174 -1,596
Cocok Baik wa dari 24 butir soal yang dianalisis terdapat
teori respons-butir dapat dikemukakan bah-
10 0,808 -1,990
12 0,805 -1,040
Cocok Baik
Cocok Baik butir soal yang tidak baik atau 25%. Butir
14 butir soal yang baik atau 35 % dan 10
13 0,792 -1,628
TC TB soal yang baik adalah butir soal dengan
15 0,409 -3,551
tingkat kesukaran soal (b i ) terletak antara (-
16 0,763 -1,912
Cocok Baik
Cocok Baik (0, 2).
2, 2), daya pembeda soal (a i ) terletak antara
17 0,978 -1,694
Cocok Baik Hasil analisis estimasi parameter butir
20 0,887 -1,947
Cocok Baik soal UN Kimia paket C72 SMA/MA meng-
23 0,764 -1,896
TC gunakan model 2-PL. Hasilnya, jumlah butir TB soal kimia yang layak dianalisis mengguna-
24 1,279 -1,250
Cocok Baik kan IRT adalah sebanyak 24 butir. Rerata
25 0,592 -1,883
Cocok Baik tingkat kesukaran soal kimia ditunjukkan
29 1,417 -1,749
Cocok Baik oleh indeks -2,150 yang cenderung meng-
30 1,035 -1,893
arah ke soal dengan kategori yang mudah.
Cocok Baik Rerata daya pembeda ditunjukkan oleh
31 1,280 -1,273
Cocok TB indeks 0,807 yang berarti memiliki daya
32 0,507 -2,387
Cocok Baik pembeda yang kurang baik.
34 1,056 -1,827
Cocok TB Pada Tabel 3 diperoleh informasi
35 0,548 -2,146
TC bahwa seluruh butir yang dianalisis lanjut ke TB fase kedua terdapat butir cocok dengan
37 0,703 -2,458
Keterangan : TC=Tidak Cocok, TB=Tidak Baik model 2-PL yang berjumlah 19 butir dengan memiliki nilai parameter daya pembeda
Hasil estimasi parameter di atas dapat berada pada interval 0 sampai 2. Informasi
dijadikan informasi untuk menentukan ka- ini berarti kurang dari setengah dari ke-
rakteristik butir yang baik. Butir yang baik seluruhan butir soal Kimia UN paket C72
hendaknya memenuhi 3 persyaratan yaitu, memiliki cukup kemampuan untuk mem-
butir cocok model, mempunyai daya beda bedakan tingkat kemampuan peserta ujian.
0 sampai 2, dan tingkat kesulitan -2 sampai Hasil estimasi parameter tingkat
+2. Berdasarkan kriteria tersebut maka kesukaran menunjukkan terdapat 15 butir
dapat dikatakan bahwa untuk memilih soal yang berada pada interval -2 sampai 2, yang
yang baik terdapat 14 butir atau 35% butir berarti memiliki tingkat kesukaran yang
soal yang memenuhi persyaratan sebagai baik. Sebanyak 9 butir soal memiliki indeks
butir yang baik. Butir soal tersebut adalah kesukaran dibawah -2,0, sehingga dapat di-
butir nomor 1, 8, 10, 12, 13, 16, 17, 20, 23, katakan sebagai butir yang mudah.
25, 29, 30, 31, dan 40. Analisis Metode Cheating pada Tes Berskala Besar − 123
Yance Manopo, Djemari Mardapi
Estimasi parameter butir dengan (θ) sebesar -1,60. Perhitungan fungsi infor- model 2 parameter logistik pada tes Kimia
masi tes dihitung dengan bantuan program UN paket C72, menghasilkan nilai infor-
Excel 2007 for windows. Grafik nilai fungsi in- masi tes sebesar 11,4069 dengan tingkat ke-
formasi tes dengan parameter kemampuan salahan pengukuran 0,2961. Nilai tersebut
peserta yang sesuai disajikan pada Gambar 1. tercapai jika parameter kemampuan siswa
Subtest: UN_C72
fo In 0.61 o rr E r 4
Scale Score
Gambar 1. Grafik Nilai Fungsi Informasi, Sekor Kemampuan dan Kesalahan Baku Kesalahan pengukuran perangkat UN
metode Pair 1 dan G2 sedangkan metode B- Kimia Paket C72 tingkat SMA/MA Negeri
Index dan MESA tidak ada pasangan yang tahun pelajaran 2011/2012 di Provinsi Ma-
didapati melakukan cheating. Besarnya fre- luku berdasarkan hasil analisis menunjukkan
kuensi kasus cheating pada metode Pair 2 bahwa besarnya kesalahan pengukuran se-
menerangkan bahwa terdapat sebanyak 52 besar 0,296. Kesalahan pengukuran diper-
pasangan yang terindikasi melakukan cheating gunakan untuk memahami kesalahan yang
dengan model jumlah soal terbanyak yang bersifat acak yang mempengaruhi skor pe-
memiliki jawaban yang sama pada soal-soal serta yang sebenarnya dalam pelaksanaan
berurutan. Sebanyak 14 pasangan memiliki tes. Hasil perhitungan kesalahan pengukur-
intensitas melakukan kecurangan yang tinggi an, diperoleh kesalahan pengukuran sebesar
diikuti 15 pasangan pada level sedang se- 0,296 dan skor maksimum yang dapat di-
dangkan sisanya sebanyak 23 pasangan pada capai oleh peserta adalah 38, maka skor pe-
level yang rendah. Adanya kemungkinan serta UN Kimia Paket C72 tingkat SMA/
penyebaran kunci jawaban pada sekolah- MA tahun pelajaran 2011/2012 di Provinsi
sekolah di kota Ambon dibandingkan pada
Maluku sebenarnya berkisar pada X i ±0,296.
kota Tual juga sangat besar hal ini dapat dilihat pada tingginya frekuensi dari data
Analisis Cheating benchmark group pada Tabel 5. Deteksi cheating dalam penelitian ini
menggunakan lima metode antara lain me- Hasil Cheating pada Kelompok Kota
Tabel 4.
(Ambon dan Tual) Berdasarkan tode Angoff's B-index, metode Pair 1, metode Kedekatan Tempat Duduk Pair 2, metode MESA dan metode G2.
Hasil keseluruhan cheating untuk ke- Metode Cheating
lompok kota dapat dilihat pada Tabel 4 yang Kategori B-Index Pair 1 Pair 2 MESA G2
menyajikan frekuensi cheating masing-masing metode pada pelaksanaan UN Kimia SMA/
0 0 14 0 0 MA untuk paket tes C72 berdasarkan tiga
Tinggi
0 1 15 0 1 kategori tingkat cheating yakni tinggi, sedang
Sedang
0 6 23 0 4 dan rendah. Metode Pair 2 yang memiliki
Rendah
0 7 52 0 5 frekuensi terbanyak dalam cheating ini setelah
Jumlah
124 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 1, 2014
Tabel 5. Hasil Cheating pada Kelompok Ambon memiliki jawaban yang seragam Kota Ambon Berdasarkan
yang mengindikasikan kemungkinan terjadi Benchmark Group
penyebaran kunci jawaban. Hasil analisis cheating pada pelaksanaan UN Kimia SMA/
Metode Cheating Kategori
MA Negeri Paket tes C72 di Provinsi Malu-
ku untuk kelompok kota dengan memper- Tinggi
B-Index Pair 1 Pair 2 MESA G2
0 0 4 0 0 hitungkan keseluruhan pasangan yang di- Sedang
0 0 duga melakukan cheating dengan pasangan terdekat atau yang termasuk dalam bench-
Rendah
0 3 14 0 1 mark group adalah berjumlah 16 pasangan Jumlah
0 1 pada metode Pair 1, 239 pasangan pada metode Pair 2, 6 pasangan untuk metode
Data benchmark group pada Tabel 5 G2, sedangkan untuk metode Angoff's B- menjelaskan bahwa sebanyak 177 pasangan
index dan metode MESA tidak terdapat pada sekolah-sekolah yang tersebar di kota
pasangan yang melakukan cheating.
Gambar 2. Grafik Total Sekor Tes Peserta untuk Kota Ambon Gambar 2 memperlihatkan histogram
Hasil analisis cheating untuk daerah dari total skor tes pada salah satu kelompok
luar kota yang meliputi 9 Kabupaten yakni kota yakni kota Ambon diperoleh skor rata-
Kabupaten Maluku Tengah, Buru, Buru Se- rata (mean) sebesar 31,53 yang menunjuk-
latan, Maluku Tenggara Barat, Maluku Barat kan rata-rata peserta tes memiliki kemampu-
Daya, Maluku Tenggara, Seram Bagian Ba- an yang tinggi dengan kemampuan men-
rat, Seram Bagian Timur dan Kepulauan jawab soal cukup baik.
Aru. Tabel 6 menyajikan frekuensi cheating Cheating yang terjadi pada beberapa
masing-masing metode pada pelaksanaan pasangan peserta tes membuktikan bahwa
UN Kimia SMA/MA untuk Paket tes C72 tidak semua peserta mampu menjawab de- pada daerah diluar kota dengan frekuensi ngan kemampuannya sendiri tetapi kemung- terbesar pada metode Pair 2 sebanyak 392
kinan diduga terjadi kecurangan sewaktu pasangan diikuti dengan metode Pair 1 se- pelaksanaan UN.
banyak 205 pasangan, metode G2 sebanyak Analisis Metode Cheating pada Tes Berskala Besar − 125
Yance Manopo, Djemari Mardapi
97 pasangan, metode B-Index sebanyak 13 Tabel 7. Hasil Cheating pada Kelompok Luar dan metode MESA sebanyak 7 pasangan.
Kota Berdasarkan Benchmark Group Metode Cheating
Tabel 6. Hasil Cheating pada Kelompok
Kategori
Luar Kota Berdasarkan Kedekatan B-Index Pair 1 Pair 2 MESA G2 Tempat Duduk
Tinggi
0 76 64 0 93 Metode Cheating Kategori
B-Index Pair 1 Pair 2 MESA G2
Selanjutnya, kemungkinan terjadi pe- Sedang
nyebaran jawaban pada 9 kabupaten (luar Rendah
94 6 26 kota), maka Tabel 7 menjelaskan dengan Jumlah
7 97 frekuensi yang berbeda-beda yang dilihat berdasarkan data Benchmark Group, metode
Tabel 6 memberikan informasi bahwa Pair 2, Pair 1, G2, B-Index dan MESA me- kategori cheating tertinggi dalam metode Pair
nunjukkan menunjukkan frekuensi indikasi
2 yang mengindikasikan sebanyak 245 pa- penyebaran jawaban sangat besar. Hasil ana- sangan kemungkinan melakukan cheating
lisis cheating pada pelaksanaan UN Kimia sangat besar sekali dengan memperhatikan
SMA/MA Negeri Paket C72 tahun pelajar- jumlah soal terbanyak yang memiliki jawaban an 2011/2012 di Provinsi Maluku untuk
yang sama pada soal-soal berurutan. Se- kelompok luar kota (kabupaten) dengan banyak sedangkan metode Pair 1 yang men-
memperhitungkan keseluruhan pasangan gindikasikan tingkat penyalinan jawaban
yang diduga melakukan cheating dengan pa- pada pasangan terdekat tergolong sedang
sangan terdekat atau yang termasuk dalam dan rendah. Sementara metode G2 yang
benchmark group adalah terdapat 16 pasangan mendasarkan pada jumlah jawaban yang
untuk metode Angoff's B-index, 480 pasang- benar dan jumlah jawaban yang salah hasil
an untuk metode Pair 1, 917 pasangan untuk salinan pada pasangan yang terlibat cheating.
metode Pair 2, 10 pasangan untuk metode Hasilnya sebanyak 97 pasangan yang terlibat
MESA, dan 210 pasangan untuk metode cheating untuk metode ini.
G2.
Metode B-Index membandingkan jum- Secara keseluruhan untuk kelompok lah jawaban salah untuk semua pasangan
kota dan luar kota berdasarkan analisis me- peserta ujian yang masuk dalam interval
tode cheating ditampilkan pada Gambar 3. sama dari hasil tes. interval ini didasarkan
Dari grafik tersebut ditampilkan terdapat pada perkalian jumlah jawaban yang salah
jumlah pasangan yang diduga melakukan untuk sepasang peserta ujian kemudian
cheating untuk metode Angoff's B-index ter- diamati apakah signifikan berbeda dari nilai
dapat 13 pasangan, metode Pair 1 terdapat rata-rata jawaban salah untuk semua peserta
212 pasangan, metode Pair 2 terdapat 444 ujian pada interval itu. Frekuensi yang ter-
pasangan, metode MESA terdapat 7 pasang- deteksi melalui metode ini adalah sebanyak
an, dan metode G2 terdapat 102 pasangan.
13 pasangan dengan kategori yang rendah. Pasangan yang diambil adalah pasangan Selain metode yang sudah disampaikan di
yang duduknya paling berdekatan sehingga atas terdapat metode MESA yang men-
adanya indikasi terjadinya cheating. Selanjut- deteksi sebanyak 7 pasangan yang terlibat
nya, bagi pasangan yang terindikasi cheating cheating dengan 1 pasangan pada kategori se-
tetapi pada lokasi tempat duduk yang sudah dang dan 6 pasangan pada kategori rendah.
berjauhan, pasangan ini dimasukkan ke Hal ini mengindikasikan bahwa probabilitas
dalam kelompok benchmark group untuk men- pasangan yang memiliki jawaban yang sama
duga terjadinya kebocoran atau penyebaran tetapi salah terdapat pada 7 pasangan ter-
kunci jawaban pada sekolah maupun pada sebut.
daerah tersebut.
126 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 1, 2014 126 − Jurnal Penelitian dan Evaluasi Pendidikan Tahun 18, Nomor 1, 2014
Angoff's B-index terdapat 13 pasangan, meto-
de Pair 1 terdapat 212 pasangan, metode Pair
2 terdapat 444 pasangan, metode MESA Gambar 3. Grafik Pasangan yang Ter- terdapat 7 pasangan, dan metode G2 terda- indikasi Cheating pada UN SMA/ MA pat 102 pasangan yang terdeteksi cheating; (4) Kimia Paket C72 Tahun Pelajaran berdasarkan hasil analisis, metode yang le- 2011/2012 di Provinsi Maluku bih banyak mendeteksi adanya cheating da-
Ketidakjujuran siswa menghadapi UN lam Ujian Nasional Kimia secara berturut- memupuk ketidak jujuran siswa menghadapi
turut adalah metode Pair 2, metode Pair 1, kehidupan bermasyarakat, yang pada akhir-
metode G2, metode Angoff's B-index dan me- nya akan melahirkan generasi-generasi muda tode MESA.
yang tidak jujur. Ironisnya adanya kemung-
Saran
kinan terjadinya cheating pada UN 2011/ 2012 ini yang kemungkinan terjadi penyon-
Berdasarkan hasil penelitian, disaran- tekan jawaban dan penyebaran jawaban
kan beberapa hal yang berkaitan dengan oleh pihak-pihak sekolah (bahkan pemerin-
perangkat Ujian Nasional Kimia Paket C72 tah daerah) mengizinkan (bahkan memban- SMA/MA Negeri di Provinsi Maluku se-
tu) cheating tersebut berlangsung sebagai tu- bagai berikut: (1) agar dapat memenuhi juan agar kelulusannya mencapai 100%.
standar perangkat tes yang baik dalam upaya Akar permasalahan dari cheating UN
mengestimasi kemampuan peserta tes, maka menurut peneliti adalah UN sebagai alat
pada perakitan perangkat tes dan ujicoba di untuk menentukan kelulusan yang hanya di
waktu mendatang Dinas Provinsi perlu administrasikan satu kali dalam setahun.
mengusulkan ke Pemerintah Pusat agar pe- Pihak-pihak tertentu (siswa, guru, kepala
laksanaan ujicoba soal Ujian Nasional perlu sekolah, orang tua, atau kepala daerah) yang
dilaksanakan juga pada daerah-daerah yang merasa tidak siap menghadapi kemungkinan
sulit/jauh dari pusat; (2) sekolah dan guru siswa-siswinya tidak lulus akan tergoda un-
perlu menanamkan sikap kejujuran kepada tuk melakukan kecurangan.
setiap peserta didik dalam menghadapi Uji- an Nasional sebab praktik-praktik cheating
Simpulan dan Saran
bukanlah alternatif yang baik dalam men- dongkrak nilai Ujian Nasional dari sekolah
Simpulan melainkan dengan melakukan dan melaksa- Berdasarkan hasil penelitian dan pem-
nakan sistem pembelajaran yang baik, me- bahasan pada perangkat Ujian Nasional
tode pengajaran yang tepat dan efektif se- Kimia Paket C72 tingkat SMA/MA Negeri
hingga semuanya itu akan menjadi solusi tahun pelajaran 2011/2012 di Provinsi Ma-
yang positif untuk peserta didik; (3) dalam luku dapat disimpulkan sebagai berikut: (1)
mendeteksi adanya perilaku cheating yang berdasarkan pendekatan teori tes klasik ter-
berdampak negatif pada dunia pendidikan, dapat 77,5% butir memiliki tingkat kesulitan
maka perlu dikembangkan metode cheating butir berfungsi baik, 55% butir daya beda-
yang tepat berdasarkan kriteria yang baik nya belum memenuhi syarat dan 70% butir
sehingga data yang diperoleh lebih akurat. pengecoh (distractor) berfungsi baik dengan
Analisis Metode Cheating pada Tes Berskala Besar − 127
Yance Manopo, Djemari Mardapi
Daftar Pustaka
Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: principles and
Anderman, E. M., Griesinger, T., & Wester- applications. Boston, MA: Kluwer Aca-
field, G. (1998). Motivation and cheat-
demic Publishers. ing during early adolescence. Journal of
Educational Psychology. 90, 84-93. Lama, M. Al. (2008). Student’s attitudes toward cheat and relation to demo-
Anderman, E. M., Pamela, K. C., & Derek, graphyc factors. European Journal of
L. (2010). Impulsivity and academic Social Science. 7, 1, 140-146. cheating. Journal of Educational Psycho-
logy. 90, 84-93. Lewkowicz, A. B. (2007). Teaching emotional intelligence, California: Corwin Press.
Aziz, Deden Abdul. (September 2012). Soal Ujian Nasional SMP Diduga Bocor.
Lim, V. K. G., Sean, K. B. S. (2001). Tempo Online diakses pada tanggal 30
Attitudes toward, and intentions to September 2012, dari: http://www.
report, academic cheating among stu- tempo.co/read/news dents in Singapure. Ethnic & Behavior, Lawrence Erlbaum Associates, 11(3),
Bogle, K. D. (2000). Effect of perspective,
261-274
type of student, and gender on the attribution of cheating. Proceedings of Mardapi, Djemari. (1999). Estimasi kesalah- Oclahoma Academic Science. Ocla-
an pengukuran dalam bidang pen- homa City, 80, 91-97.
didikan dan implikasinya pada ujian nasional. Yogyakarta: UNY.
Chula, G. K., Roger, W.G., & Chris, P. (2009). Online exams and cheating:
McCabe, D. L., Linda K. T., & Kenneth, an empirical analysis of business stu-
D.B. (2001). Cheating in academic dents’ views. The Journal of Educators
institutions: a decade of research. Online, 6, 1.
Ethnic & Behavior, 11(3), 219-232. Cizek, G. J. (1999). Cheating on tests: How to