Reliabilitas Kajian Teori 1. Evaluasi Pembelajaran dan Analisis Butir Soal

disebutkan dalam tujuan instruksional khusus. Analisis validitas konstruksi dilakukan dengan cara melakukan pencocokan antara aspek-aspek berpikir yang terkandung dalam tes hasil belajar tersebut, dengan aspek-aspek berpikir yang dikehendaki untuk diungkapkan menjadi tujuan instruksional. 2 Validitas empirik Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empirik Anas Sudijono, 2011: 167.

b. Reliabilitas

Menurut Zainal Arifin 2013: 258, “Reliabilitas adalah tingkat atau derajat atau konsistensi dari suatu instrumen”. Begitu pula Suharsimi Arikunto 2013: 100 mengungkapkan bahwa “Suatu tes dapat dikatakan memiliki reliabilitas yang tinggi jika tes tersebut dapat memberikan hasil yang tetap”. Suharsimi Arikunto 2013: 105 dalam bukunya juga memaparkan 3 macam metode menghitung reliabilitas, yaitu: 1 Metode Bentuk Paralel Pada metode bentuk paralel atau tes ekuivalen, reliabilitas yang dihitung adalah reliabilitas dari dua buah tes yang paralel dimana dua buah tes tersebut mempunyai tujuan, tingkat kesukaran, dan susunan yang sama tetapi memiliki butir soal yang berbeda. Kelemahan dari metode ini adalah bahwa pekerjaan pengetes menjadi berat karena harus menyusun dua seri tes, selain itu juga membutuhkan waktu yang cukup lama untuk mencobakan dua seri tes tersebut. 2 Metode Tes Ulang Metode tes ulang merupakan metode dimana satu bentuk tes dicobakan atau diujikan sebanyak dua kali pada kelompok peserta didik yang sama namun pada waktu yang berbeda. Hasil dari kedua tes tersebut kemudian dihitung korelasinya untuk mendapatkan nilai reliabilitasnya. Pada umumnya hasil tes yang kedua cenderung lebih baik dari hasil tes yang pertama. Hal tersubut tidak menjadi masalah karena yang terpebting adalah kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh koefisiensi korelasi yang tinggi. 3 Metode Belah Dua Metode tes belah dua merupakan metode satu bentuk tes diujikan dalam satu kelompok siswa pada waktu tertentu, kemudian kelompok tersebut dibagi ke dalam dua kelompok. Reliabilitas tes untuk soal bentuk pilihan ganda dapat dihitung dengan rumus K- R.20 yaitu: r 11 = Keterangan: r 11 = reliabilitas tes secara keseluruhan p = proporsi subjek yang menjawab item dengan benar q = proporsi subjek yang menjawab item dengan salah q = 1-p Ʃ pq = jumlah hasil perkalian antara p dan q n = banyaknya item S = standar deviasi dari tes standar deviasi = akar varians Suharsimi Arikunto, 2013: 115 Setelah didapatkan hasil analisis, maka hasil perhitungan interpretasi terhadap koefisien Reliabilitas tes r 11 pada umumnya digunakan patokan sebagai berikut: a Apabila r 11 sama dengan atau lebih besar daripada 0,70 berarti tes hasil belajar yang sedang diuji Reliabilitasnya dinyatakan telah memiliki Reliabilitas yang tinggi =reliable. b Apabila r 11 lebih kecil daripada 0,70 berarti tes hasil belajar yang sedang diuji Reliabilitasnya dinyatakan belum memiliki Reliabilitas yang tinggi un-reliable. Anas Sudijono, 2011: 209

c. Daya Pembeda