Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan
apa yang akan terjadi pada masa yang akan datang.
b. Reliabilitas
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability. Dalam bahasa Inggris, reliabilitas berasal dari kara reliable
yang artinya dapat dipercaya. Menurut Sudjana 1990: 16, reliabilitas merupakan ketetapan atau keajegan alat penilaian dalam menilai apa
yang dinilainya. Sudaryono, dkk 2013: 120, mengatakan bahwa reliabilitas
berarti sejauh mana hasil pengukuran dapat dipercaya. Sedangkan Jihad dan Haris 2012: 180 mengemukakan bahwa reliabilitas soal
merupakan ukuran yang menyatakan tingkat keajegan atau kekonsistenan suatu soal tes.
Dari pendapat para ahli di atas, dapat disimpulkan bahwa reliabilitas adalah ukuran ketetapan atau kekonsistenan suatu
instrumen dalam mengukur sesuatu. Instrumen tes dikatakan dapat dipercaya reliable jika memberikan hasil yang tetap atau ajeg
konsisten apabila diteskan berkali-kali Widoyoko, 2015: 157. Berdasarkan cara-cara melakukan pengujian tingkat reliabilitas
instrumen, secara garis besar ada dua jenis reliabilitas, yaitu reliabilitas PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
eksternal external reliability dan reliabilitas internal internal reliability Widoyoko, 2015: 158 – 165.
1 Reliabilitas Eksternal External Reliability Reliabilitas eksternal diperoleh jika ukuran atau kriteria
tingkat reliabilitas berada di luar instrumen yang bersangkutan. Ada dua cara untuk menguji reliabilitas eksternal suatu instrumen
yaitu dengan metode bentuk paralel equivalent method dan metode tes berulang test-retest method
a Metode bentuk paralel equivalent method Metode paralel dilakukan dengan cara menyusun
instrumen yang
hampir sama
equivalen, kemudian
diujicobakan pada sekelompok responden yang sama responden mengerjakan dua kali kemudian dari hasil uji coba
tersebut dikorelasikan dengan teknik korelasi product moment. Data dari hasil dua kali uji coba, yang satu dianggap sebagai
nilai X, sedangkan yang lainnya dianggap sebagai nilai Y. karena dalam metode ini ada dua instrumen dan dilakukan dua
kali tes, maka disebut dengan metode tes berulang atau test retest. Metode ini pada umumnya untuk menguji reliabilitas
instrumen bentuk tes. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Instrumen paralel atau ekuivalen adalah dua buah instrumen yang mempunyai kesamaan tujuan, tingkat kesulitan
dan susunan, tetapi butir-butir pertanyaanpernyataan berbeda. Kelemahan metode ini adalah membutuhkan waktu dan
biaya yang lebih karena harus menyusun dua instrumen dan harus tersedia waktu yang lama untuk mencoba dua kali tes.
b Metode Tes Berulang test retest method Metode ini dilakukan untuk menghindari penyusunan
instrumen dua kali. Dalam menggunakan metode ini kita hanya menyusun satu perangkat instrumen. Instrumen tersebut
diujicobakan pada sekelompok responden dan hasilnya dicatat. Pada kesempatan lain, instrumen tersebut diberikan pada
kelompok responden yang sama untuk dikerjakan lagi, dan hasil yang kedua tersebut dicatat. Kemudian kedua hasil
tersebut dikorelasikan. Metode ini pada umumnya juga untuk menguji reliabilitas instrumen bentuk tes.
2 Reliabilitas Internal Internal Reliability Reliabilitas internal diperoleh jika ukuran atau kriteria
tingkat reliabilitas didasarkan pada instrumen itu sendiri. Berdasarkan sistem pemberian skor scoring system instrumen,
ada dua metode analisis reliabilitas internal, yaitu: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
a Instrumen skor diskrit Instrumen skor dikrit, nominal atau pilah adalah
instrumen yang skor jawabannyaresponden hanya dua, yaitu 1 satu dan 0 nol. Dengan kata lain, hanya dua jawaban yaitu
benar dan salah. Jawaban benar diberikan skor 1 satu dan jawaban salah diberikan skor 0 nol.
Metode ini dapat digunakan untuk menguji reliabilitas instrumen baik bentuk tes maupun non tes.
b Instrumen skor non diskrit. Instrumen
skor non
diskrit adalah
instrumen pengukuran yang dalam sistem skoringnya bukan 1 dan bukan
0, tetapi bersifat gradual, yaitu ada penjenjangan skor, mulai dari skor tertinggi hingga skor terendah. Hal ini biasanya
terdapat pada instrumen tes bentuk uraian dan pilihan ganda, serta instrumen non tes bentuk angket dengan skala Likert dan
skala lanjutan rating scale.
c. Karakteristik Butir Soal