Kualitas Instrumen yang Baik

50 untuk mencapai BEP. Menurut Ari Fadiati 2011:155 rumus untuk menentuka BEP yaitu: Keterangan : BEP : Break Event Point Titik Impas TR : Total Revenue Total Pendapatan TC : Total Cost Total Biaya

5. Kualitas Instrumen yang Baik

Persyaratan instrumen penilaian hasil belajar yang digunakan pendidik menurut Permendiknas No 20 2007 adalah: a. Substansi, adalah mempresentasikan kompetensi yang dinilai. b. Konstruksi, adalah memenuhi persyaratan teknis sesuai bentuk instrumen yang digunakan. c. Bahasa, adalah menggunakan bahasa yang baik dan benar serta komunikatif sesuai dengan taraf perkembangan peserta didik. Menurut Departemen Pendidikan dan Kebudayaan 1999 teknik yang digunakan untuk menganalisis kualitas instrumen penilaian, diantaranya: a. Analisis Kualitatif Analisis secara kualitatif pada dasarnya adalah menelaah butir soal dengan meninjau dari segi kaidah penulisan yaitu: 51 1 Telaah Materi Tujuan dari telaah materi ini yaitu untuk mengetahui kesesuaian materi yang ditanyakan dengan tujuan pertanyaan yang tersirat dalam indikator. Selain itu telaah materi juga untuk mengetahui apakah tingkat kesulitan soal sudah cocok dengan jenjang siswa yang akan mengerjakan, kebenaran isi pokok soal dan kunci jawaban. 2 Telaah Konstruksi Tujuan dari telaah konstruksi yaitu untuk mengetahui apakah soal sudah memenuhi kaidah-kaidah penulisan soal . 3 Telaah Bahasa Tujuan telaah bahasa adalah untuk melihat apakah bahasa yang digunakan jelas dan dapat dimengerti siswa dan tidak menimbulkan penafsiran yang berbeda. b. Analisis Kuantitatif 1 Validitas Suharsimi Arikunto 2016:80 mengemukakan “sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur”. Jika suatu tes dapat memberikan informasi yang sesuai dan dapat digunakan untuk mencapai tujuan tertentu, maka tes itu valid untuk tujuan tersebut. Selanjutnya, Kerlinger di dalam Zainal Arifin 2016:248 menyatakan ada tiga kriteria yang dapat dilihat untuk mengukur validitas instrumen selain derajat ketepatan instrumen untuk mengukur apa yang seharusnya 52 diukur, diantaranya appropriatness, meaningfulness, dan usefulness. Appropriatness menunjukkan kelayakan dari tes sebagai suatu instrumen. Meaningfulness menunjukkan kemampuan instrumen dalam memberikan keseimbangan soal-soal pengukurannya berdasar tingkat kepentingan dari setiap fenomena. Usefulness menunjukkan sensitif tidaknya instrumen dalam mennagkap fenomena perilaku dan tingkat ketelitian yang ditunjukkan dalam membuat kesimpulan. Ada empat jenis validitas menurut Suharsimi Arikunto 2016:82-84 yaitu 1 validitas isi, 2 validitas konstruksi, 3 validitas “ada sekarang”, 4 validitas predictive. Validitas isi terkait kesesuaian isi suatu tes dengan materi pelajaran yang diberikan. Validitas konstruksi berkaitan dengan kemampuan tes dalam mengukur setiap aspek berpikir yang menjadi tujuan pengukuran. Kemudian validitas “ada sekarang” atau dikenal juga dengan validitas empirik, yaitu kesesuaian hasil tes dengan pengalaman. Pengalaman yang dimaksudkan disini yaitu merujuk pada hasil tes yang lalu. Terakhir, validitas predictive terkait dengan kemampuan tes dalam memprediksi apa yang akan terjadi masa yang akan datang.

2 Reliabilitas

Zainal Arifin 2013: 258 mengemukakan “reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen”. Konsistensi dalam hal ini 53 maksudnya kapanpun suatu tes digunakan maka akan memberikan hasil yang sama. 3 Taraf Kesukaran Zainal Arifin 2013: 258 menyatakan “perhitungan tingkat kesukaran soal adalah pengukuran seberapa besar derajat kesukaran suatu soal”. Suatu butir soal dikatakan memiliki tingkat kesukaran rendah apabila banyak siswa yang menjawab benar. Begitu juga sebaliknya butir soal memiliki tingkat kesukaran tinggi apabila banyak siswa yang menawab salah. Soal dapat dikategorikan baik apabila tingkat kesukaran soal tersebut seimbang. 4 Daya Pembeda Suharsimi Arikunto 2016:226 mengemukakan, “ daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang pandai berkemampuan tinggi dengan siswa yang bodoh berkemampuan rendah”. Seluruh peserta tes dikelompokkan menjadi dua yaitu kelompok siswa berkemampuan tinggi atau kelompok atas dan kelompok siswa berkemampuan rendah atau kelompok bawah. Suatu soal dikategorikan memiliki daya pembeda yang baik apabila soal tersebut dijawab benar hanya oleh kelompok atas. 5 Fungsi Pengecoh Distractor Zainal Arifin 2013: 258 mengemukakan “ butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik yang 54 menjawab salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata”. Pengecoh dapat dikatakan berfungsi dengan baik jika setidaknya dipilih oleh 5 peserta tes. Pengecoh dianggap baik jika memiliki daya tarik yang menyebabkan peserta tes merasa benar bila memilihnya, padahal kenyataannya salah.

B. Hasil Penelitian yang Relevan

Penelitian yang dilakukan oleh Fristian Dwi Christanty dan Prihastusi Ekawatiningsih tahun 2012- 2013 yang berjudul “Pengembangan Instrumen Penilaian Pembelajaran Melayani Makan Dan Minum Kelas XI Program Keahlian Jasa Boga”. Penelitian tersebut bertujuan untuk mengetahui kualitas instrumen penilaian yang mengukur tiga aspek kemampuan yaitu kognitif, afektif, dan psikomotor. Instrumen kognitif dan afektif dianalisis dengan menggunakan program komputer sedangkan instrumen psikomotor dinilai dengan teknik expert judgement. Dari hasil penelitian diketahui bahwa kualitas ketiga instrumen penilaian dinyatakan valid dan reliabel. Selanjutnya penelitian yang dilakukan oleh Dwi Rahayu dam Utiya Azizah pada tahun 2012 yang berjudul “Pengembangan Instrumen Penilaian Kognitif Berbasis Komputer Dengan Kombinasi Permainan “Who Wants To Be A Chemist” pada Materi Pokok Struktur Atom untuk Kelas X SMA RSBI ”. Penelitian tersebut mengembangkan instrumen penilaian kognitif berbasis komputer dengan menguji kelayakan instrumen berdasarkan pada komponen kesesuaian