instrumen secara rasional bisa menggambarkan apa yang sedang diukur. Validitas internal dibedakan menjadi dua yaitu validitas isi
dan validitas konstruksi. Validitas eksternal berkaitan dengan fakta empiris atau pengalaman. Validitas eksternal menggunakan
kriteria pembanding yaitu yang sudah ada sekarang dan yang akan terjadi pada masa yang akan datang. Validitas eksternal juga
dibedakan menjadi dua yaitu validitas ada sekarang dan validitas prediksi.
c. Reliabilitas
Hasil reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan tinggi jika tes tersebut
dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tesberhubungan dengan masalah ketetapan hasil tes atau seandainya
berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti. Reliabilitas memiliki dua keajegan. Keajegan yang pertama adalah
keajegan internal, yakni tingkat sejauhmana butir soal itu homogen baik dari segi tingkat kesukaran maupun bentuk soalnya. Keajegan yang kedua
yaitu keajegan eksternal yakni tingkat sejauhmana skor dihasilkan tetap sama sepanjang kemampuan orang yang diukur belum berubah Sumarna
Surapranata, 2005: 90. Reliabilitas untuk soal pilihan ganda dihitung dengan rumus
:
Keterangan: r
11
= reliabilitas secara keseluruhan = proporsi subjek yang menjawab item dengan
benar = proporsi subjek yang menjawab item dengan
salah = jumlah hasil perkalian antara dan
= banyaknya item = standar deviasi dari tes standar deviasi adalah
akar varians Suharsimi Arikunto, 2013: 115
Reliabilitas merupakan keajegan atau stagnan. Tes yang baik harus memiliki tingkat reliabilitas yang baik. Reliabilitas berkaitan dengan
kepercayaan. Dengan tingkat reliabilitas yang baik menandakan tes memiliki tingkat kepercayaan yang baik pula. Dengan demikian,
perhitungan tingkat reliabilitas suatu tes sangat penting dilakukan. Suatu tes dikatakan memiliki tingkat reliabilitas yang baik apabila tes mampu
memberikan hasil yang tetap walaupun diuji ke subyek yang berbeda atau di waktu berbeda.
d. Daya Pembeda
Daya pembeda soal akan mengkaji soal-soal tes dari segi kemampuan tes tersebut dalam membedakan siswa yang masuk
dalamkategori prestasi rendah maupun tinggi. Soal yang memiliki daya pembeda akan mampu menunjukkan hasil yang tinggi bila diberikan
kepada siswa dengan prestasi tinggi dan hasil yang rendah bila diberikan kepada siswa berprestasi rendah.
Untuk menghitung daya pembeda perlu dibedakan antara dua kelompok kecil kurang dari 100 dan kelompok besar lebih dari 100.
1 Kelompok kecil
Seluruh kelompok testee dibagi menjadi dua sama besar, 50 kelompok atas J
A
dan kelompok bawah J
B
. Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah lalu dibagi dua.
2 Kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu
27 skor teratas ssebagai kelompok atas J
A
dan 27 skor terbawah sebagai kelompok bawah J
B
. Setelah dibedakan antara kelompok kecil dengan kelompok besar,
maka untuk menghitung daya beda adalah:
B A
B B
A A
P P
J B
J B
D Keterangan :
D : Indeks daya beda
J
A
: banyaknya peserta kelompok atas J
B
: banyaknya peserta kelompok bawah B
A
: banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
B
B
: banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar
P
A
: Proporsi peserta kelompok atas yang menjawab benar P
B
: Proporsi peserta kelompok bawah yang menjawab benar Suharsimi, 2012: 228
Butir soal yang baik adalah butir soal yang mempunyai indeks diskriminasi lebih dari 0,30. Berikut ini klasifikasi daya beda dan
keterangannya.
Tabel 1. Klasifikasi Daya Beda Nilai Daya Beda Keterangan
Kurang dari 0,20 Tidak Baik
0,20 – 0,30
Cukup Baik Lebih dari 0,30
Baik Ali Muhson, 2015: 10
e. Tingkat Kesukaran