Ciri- ciri Tes yang Berkualitas Baik

50 Hasil tes menghasilkan data kuantitaif yang nerupa skor. Skor ini kemudian ditafsirkan menjadi nilai, yaitu rendah, menengah dan tinggi. Tinggi rendahnya nilai ini selalu dikaitkan dengan acuan penilaian.

5. Ciri- ciri Tes yang Berkualitas Baik

Sebuah tes dikatakan baik sebagai alat pengukur harus memenuhi persyaratan tes, yaitu memiliki :1 validitas, 2 reliabilitas, 3 obyektivitas, 4 praktikabilitas, 5 ekonomis Suharsimi Arikunto, 1995:56. Keterangan dari masing-masing ciri akan diberikan dengan lebih terperinci sebagai berikut: 1. Validitas Sebuah tes disebut valid apabila tes itu dapat tepat mengukur apa yang hendak diukur. Validitas secara umum dibagi menjadi tiga jenis yaitu: validitas isi contet validity, valisitas konstrak construct validity dan valisitas kriteria criterion-relate validity Thorndike, R.L. Hagen. E.P, 1977: 57; Azwar, 2002: 175; Arikunto, 2011: 67. Validitas isi berkenaan dengan sejauh mana item-item mencakup keseluruhan kawasan isi yang hendak diukur. Pengujian validitas isi menggunakan analsisi rasional. Cara yang sering digunakan untuk menganalisis validitas tes adalah melihat apakah item-item yang ditulis sesuai dengan kisi-kisinya. Validitas konstruk adalah validitas yang mengukur sejauh mana suatu tes mengukur trait atau konstruk teoritik yang hendak diukurnya. Pengujian validitas konstruk menggunakan statistika kompleks seperti analisis faktor. Pengujian validitas kriteria dilakukan dengan cara membandingkan skor pada tes yang bersangkutan dengan skor suatu kriteria. Untuk melihat hubungan antara kedua skor dilakukan analisis korelasional. Jika tes yang digunakan untuk mengukur performasi di masa datang digunakan validitas prediktif dengan cara menganalisis koralasi antara skor tes dengan skor performasi yag hendak diprediksikan .

2. Reliabilitas

51 Tes dikatakan dapat dipercaya reliabel jika memberikan hasil yang tetap apabila diteskan berkali-kali. sebuah tes dikatakan reliable apabila hasil-hasi tes tersebut menunujukkan ketetapan. Jika kepada para siswa diberikan tes yang sama pada waktu yang berlainan, maka setiap siswa akan tetap berada pada urutan rangking yang sama dalam kelompoknya. Reliabilitas merujuk pada konsistensi dari suatu pengukuran. Artinya, bagaimana skor tes konsisten dari pengukuran yang satu ke lainnya. Karakteristik reliabilitas yaitu: Pertama, reliabilitas merujuk pada hasil yang didapat melalui instrumen tes, bukan merujuk kepada instrumennya sendiri. Kedua, reliabilitas merupakan syarat perlu, tetapi belum cukup untuk syarat validitas. Ketiga, reliabilitas utamanya berkaitan dengan statistik Kusaeri,2012:82. Tenik analisis reliabilitas yang digunakan dalam penelitian ini adalah teknik formula Kuder-Richardson-20 atau KR-20, karena penskoran tes Fisika yang dikembangkan berbentuk dikotomi. Untuk mengetahui reliabilitas butir soal menggunakan rumus alpha KR-20 adalah sebagai berikut:               2 2 1 - k 20 SD xq p SD k KR i i Kusaeri, 2012:89 di mana : KR-20 = reliabilitas tes secara keseluruhan SD 2 = varian skor tes total p i = proporsi jawaban benar pada sebuah butir soal q i = proporsi jawaban salah pada sebuah butir tes k = banyak item kriteria keputusan reliabilitas adalah sebagai berikut: 0,800 ≤ 1,00 Sangat tinggi 0,600 ≤ 0,800 Tinggi 52 0,400 ≤ 0,600 Cukup tinggi 0,200 ≤ 0,400 Rendah 0,000 ≤ 0,200 Sangat rendah Suharsimi Arikunto, 2011:71 3. Objektivitas Sebuah tes dikatakan memiliki objektivitas apabila dalam melaksanakan tes itu tidak ada faktor subyektivitas yang mempengaruhi. apabiladikaitka dengan reiliabilitas, maka objektivitas menekankan ketetapan consistency dalam scoring sedangkan reliabilitas menekankan tetetapan dalam hasil tes. 4. Praktikabilitas Sebuah tes dikatakan memiliki praktikabilitas tinggi apabila tes tersebut bersifat praktis, tes yang praktis adalah tes yang sebagai berikut : a Mudah dilaksanakan, misalnya tidak menuntut peralatan yang banyak dan memberi kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap mudah oleh siswa. b Mudah pemeriksaannya, artinya tes itu dilengkapi dengan kunci jawaban maupun pedoman skoringnya. Untuk soal bentuk objektif, pemeriksaan akan lebih mudah dialkukan jika dikerjakan oleh siswa dalam lembar jawaban. c Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat diberikan oleh orang lain. 5. Ekonomis Ekonomis yang dimaksudkan disini ialah pelaksanaan tes tersebut tidak membutuhkan biaya yang mahal, tenaga yang banyak dan waktu yang lama Suharsimi Arikunto, 1995:56-61. Secara umum ada beberapa prinsip dasar yang perlu dicermati dalam menyusun tes hasil belajar agar tes tersebut dapat mengukur tujuan instruksional khusus untuk mata pelajaran yang telah diajarkan atau 53 mengukur kemampuan dan keterampilan peserta didik yang diharapkan, setelah mereka menyelesaikan suatu unit pengajaran tertentu, yaitu : a Tes hasil belajar harus dapat mengukur secara jelas hasil belajar learning outcomes yang telah ditetapkan sesuai dengan tujuan instruksional. b Butir-butir soal tes harus merupakan sampel yang representatif dari populasi bahan pelajaran yang telah diajarkan. c Bentuk soal yang dikeluarkan dalam tes hasil belajar harus dibuat bervariasi. d Tes hasil belajar harus didesain sesuai dengan kegunaannya untuk memperoleh hasil yang diinginkan. e Tes hasil belajar harus memiliki reliabilitas yang dapat diandalkan. f Tes hasil belajar disamping harus dapat dijadikan alat pengukur keberhasilan belajar siswa, juga harus dapat dijadikan alat untuk mencari informasi yang berguna untuk memperbaiki cara belajar siswa dan cara mengajar guru itu sendiri Anas Sudijono, 1995: 97- 98. Suatu tes dapat dikatakan baku jika tes tersebut telah diujikan terlebih dahulu. Kriteria yang harus terpenuhi dari sebuah tes yang baku atau baik adalah sebagai berikut: 1 Tingkat Kesukaran P Tingkat kesukaran soal adalah peluang menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Menurut Aiken 1994:66 yang dikutip oleh Kusaeri 2012:174 indeks tingkat kesukaran ini umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0 sampai 1. Semakin besar indeks tingkat kesukaranyang diperoleh dan hasil hitungan, berarti semakin mudah soal itu. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal.Pada prinsipnya,skor rata-rata yang diperoleh peserta didik 54 pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal. Rumus yang digunakan untuk menghitung indeks kesukaran soal, yaitu : P = B JS di mana : P = indeks kesukaran B = banyaknya siswa yang menjawab soal dengan benar JS = jumlah seluruh siswa peserta tes Suharsimi, 2010:212. Taraf kesukaran soal dapat ditentukan berdasarkan hasil perhitungan indeks kesukaran dengan ketentuannya seperti pada Tabel 2.2 sebagai berikut : Tabel 2.2 kriteria Taraf Kesukaran No. Range Tingkat Kesukaran Kategori Keputusan 1. 0,7 ≤ p ≤ 1,0 Mudah Ditolak direvisi 2. 0,3 ≤ p ฀ 0,7 Sedang Diterima 3. 0,0 ≤ p ฀ 0,3 Sulit Ditolak Direvisi Kusaeri, 2012:175 2 Daya Beda D Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara siswa yang telah menguasai materi yang ditanyakan dan siswa yang belum menguasai materi yang diujikan. Daya pembeda butir soal memiliki manfaat berikut: pertama, untuk meningkatkan mutu setiap butir soal melalui data empirik. Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi atau ditolak. Kedua, untuk mengetahui seberapa jauh masing- masing butir soal dapat mendeteksi atau membedakan kemampuan siswa, yaitu siswa yang telahmemahami materi yang diajarkan guru atau belum. 55 Berikut rumus yang biasa digunakan untuk menghitung daya beda soal yaitu: = Atau = Kusaeri, 2012:175-176 di mana: D : daya pembeda soal BA : jumlah jawaban benar pada kelompok atas BB : jumlah jawaban benar pada kelompok bawah N : jumlah siswa yang mengerjakan soal Kriteria Daya Pembeda Soal dapat dilihat pada Tabel 2.3 berikut: Tabel 2.3 Kriteria Daya Pembeda Besarnya D Kategori Interpretasi Kurang dari ≤D฀ 0,20 Poor jelek Butir item yang bersangkutan daya pembeda lemah sekali jelek, dianggap tidak memiliki daya pembeda yang baik. 0,20 ≤D฀ 0,40 Satisfactory cukup Butir item yang bersangkutan telah memiliki daya pembeda yang cukup sedang. 0,40 ≤D฀ 0,70 Good baik Butir item yang bersangkutan telah memiliki daya pembeda yang baik. 0,70 ≤D≤ 1 Excellent baik sekali Butir item yang bersangkutan telah memiliki daya pembeda yang baik sekali. Bertanda negative - Butir item yang bersangkutan daya pembedanya negatif jelek sekali Anas Sudijono, 2005 :389 3 Keefektifan Pengecoh Penyebaran pilihan jawaban dijadikan dasar dalam penelaahaan soal. Hal ini dimaksudkan untuk mengetahui berfungsi tidaknya pilihan jawaban yang tersedia. Suatu pilihan jawaban pengecoh dapat dikatakan berfungsi apabila: a pengecoh paling tidak dipilih oleh 5 dari peserta tes atau siswa, b pengecoh lebih banyak dipilih oleh kelompok siswa yang belum memahami materi yang diujikan. Kusaeri, 2012:177 Dalam analisis menggunakan program ITEMAN daya beda pilihan jawaban ditunjukkan oleh prop endorsing atau proporsi pemilih jawaban 56 dan nilai alternative biser dimana distraktor dikatakan baik jika prop endorsing bernilai lebih dari 0,02 atau minimal dipilih oleh 2 testee serta alternative biser bernilai negatif tinggi. Keputusan suatu item soal layak digunakan, perlu direvisi atau ditolak didasarkan pada kriteria keputusan untuk penilaian item soal oleh Elvin Yusliana Ekawati 2010 sebagai berikut 1 Item soal diterima, apabila karakteristik item soal memenuhi semua kriteria. Item soal yang terlalu sukar atau mudah, tetapi memiliki daya beda dan sistribusi pengecoh item yang memenuhi kriteria, butir soal tersebut dapat diterima atau dipilih. 2 Item soal direvisi, apabila salah satu atau lebih dari ketiga kriteria karakteristik item soal tidak diterima. 3 Item soal ditolak, jika item soal memiliki karakteristik yang tidak memenuhi semua kriteria 2010:336.

B. Penelitian yang Relevan

Berdasarkan Winda Fitrifitanofa 2012 mengembangkan instrumen tes formatif Fisika kelas XI semester gasal program akselerasi. Penelitian tersebut menggunakan metode pengembangan. Prosedur penyusunan tes yang telah dilakukan yaitu: 1 menyusun spesifikasi tes yang terdiri dari tujuan tes, kisi-kisi tes, bentuk tes, dan panjang tes, 2 menulis soal tes, 3 menganalisis soal secara kualitatif yang dilakukan oleh ahli, 4 uji coba tes, 5 menganalisis secara kuantitatif, 6 melakukan revisiperbaikan tes, dan 7 merakit tes. Instrumen tes yang dikembangkan memenuhi validitas isi yang baik, reliabilitas soal yang tergolong tinggi, untuk soal materi Kinematika dengan Analisis Vektor Paket 1 memiliki reliabilitas 0,810701 yang tergolong sangat tinggi, untuk soal materi Gravitasi Paket 2 memiliki reliabilitas 0,6844 yang tergolong tinggi, dan untuk soal materi Gerak Harmonik dengan Benda Elastik memiliki reliabilitas 0,824764 yang tergolong sangat tinggi. Daya beda yang diukur menggunakan indeks diskriminasi menunjukkan hasil semuanya diterima,