kriterium atau alat banding. Maka, hasil tes merupakan sesuatu yang dibandingkan.
d. Validitas prediksi predictive validity Validitas prediksi adalah kemampuan sebuah instrumen untuk meramalkan apa
yang akan terjadi pada masa yang akan datang. Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran
di Perguruan Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dahulu nilai tesnya lebih
rendah, maka tes masuk yang dimaksud tidak memiliki validitas prediksi.
b. Reliabilitas
Menurut Arifin, Zaenal 2009: 254 mengemukakan bahwa reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen. Reliabilitas tes berkenaan
dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetepkan. Suatu tes dapat dikatakan reliabel jika selalu memberikan
hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Menurut Purwanto 2009: 153 keandalan reliability
berasal dari kata rely yang artinya percaya dan reliabel yang artinya dapat dipercaya. Keterpercayaan berhubungan dengan ketetapan dan konsistensi. Tes Hasil Belajar
dikatakan dapat dipercaya apabila memberikan hasil pengukuran hasil belajar yang relatif tetap secara konsisten. Masidjo 1995: 209 menjelaskan bahwa reliabilitas
adalah taraf kemampuan tes mampu menunjukkan konsistensi hasil pengukurannya yang diperlihatkan dalam taraf ketetapan dan ketelitian hasil. Berdasarkan
pernyataan di atas dapat disimpulkan bahwa reliabilitas adalah konsistensi suatu tes yang akan memberikan hasil yang sama bila diteskan pada kelompok yang sama
pada waktu dan kesempatan yang berbeda. Sukardi 2009: 160 mengemukakan berdasarkan cara-cara melakukan pengujian
tingkat reliabilitas instrumen, ada dua reliabilitas, yaitu 1 reliabilitas eksternal atau external reliability dan 2 reliabilitas internal atau internal realibility
1. Reliabilitas Eksternal Eksternal Reliability a. Metode bentuk paralel equivalent method
Metode parallel dilakukan dengan cara menyusun dua instrumen yang hampir sama equivalent. Kemudian diujicobakan kepada dua kelompok
responden yang sama responden mengerjakan dua kali. Misalnya tes Bahasa Inggris Seri A yang akan dicari reliabilitasnya dan tes Seri B diujikan kepada
sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien dari dua hasil tes inilah yang menunjukkan koefisien reliabilitas tes Seri A.
Apabila r
hitung
lebih besar atau sama dengan r
tabel
dikatakan ada korelasi yang signifikan, instrument dianggap reliabel. Sebaliknya apabila r
hitung
lebih kecil dari r
tabel
dikatakan tidak ada korelasi yang signifikan, instrumen dianggap tidak reliabel. Kelemahan metode ini adalah membutuhkan waktu dan biaya
yang lebih karena harus menyusun dua instrumen dan harus mencoba dua kali tes.
b. Metode tes berulang test-retest method Metode tes berulang dilakukan untuk menghindari penyusunan instrumen
dua kali. Dengan menggunakan metode ini kita hanya menyusun satu perangkat instrumen. Instrumen tersebut diberikan kepada responden untuk
diujicobakan, kemudian hasilnya dicatat. Pada kesempatan yang lain instrumen tersebut diberikan pada kelompok responden yang sama untuk
dikerjakan lagi dan hasil yang kedua juga dicatat. Kemudian kedua hasil tersebut dikorelasikan.
2. Reliabilitas Internal Internal Reability a. Instrumen skor diskrit
Instrumen skor diskrit, nominal atau pilah adalah instrumen atau skor jawaban hanya dua, yaitu 1 satu dan 0 nol. Hal yang perlu ditegaskan untuk
menghindari kesalahan karena yang dibagi dua kelompok adalah jumlah responden. Oleh karena itu, untuk memudahkan dalam membagi menjadi dua
kelompok jumlah butir instrumen harus genap, jangan ganjil karena akan menyulitkan dalam pengelompokan. Kelemahan metode ini adalah
membutuhkan waktu dan biaya yang lebih karena harus menyusun dua instrumen dan harus tersedia waktu yang lama untuk mencoba dua kali tes.
b. Instrumen skor non diskrit Instrumen skor non diskrit adalah instrumen pengukuran yang dalam sistem
skoringnya bukan 1 dan 0 satu dan nol, tetapi bersifat gradual, yaitu ada penjenjangan skor, mulai dari skor tertinggi sampai skor terendah. Hal ini
biasanya terdapat pada instrumen tes bentuk uraian dan pilihan ganda, dan instrumen non tes bentuk angket dengan skala likert dan skala lanjutan rating
scale.
c. Karakteristik Butir Soal