q p
SDt Mt
Mp r
pbi
− =
J. Kalibrasi Instrumen
1. Pengujian Validitas Instrumen
Uji validitas adalah uji kesanggupan alat penilaian dalam mengukur isi yang sebenarnya. Uji coba ini dilakukan dengan melakukan skor masing-masing
item dengan skor total. Pengukuran validitas soal dalam penelitian ini menggunakan rumus korelasi biserial, karena butir soal yang digunakan berbentuk
diskontinum soal obyektif.
7
Dengan rumus:
Keterangan: r
pbi
= koefisien korelasi biserial Mp
= rerata skor pada tes yang memiliki jawaban benar M
t
= rerata skor total SD
t
= standar deviasi dari skor total p
= proporsi siswa yang menjawab benar q
= proporsi siswa yang menjawab salah Valid atau tidaknya suatu butir item, maka dilakukan perbandingan
perhitungan
pbi
r dan
tabel
r dengan
tabel
r yang digunakan yaitu 0.361. Jika hasil
perhitungan
tabel pbi
r r
maka butir soal tersebut dinyatakan valid, sedangkan jika hasil perhitungan
tabel pbi
r r
, maka butir item dinyatakan tidak valid. Hasil uji validitas instrumen test dapat dilihat pada tabel dibawah ini:
Tabel 3.3 Hasil Perhitungan Validitas Instrumen.
8
Statistik
Jumlah Soal 40
Jumlah Siswa 30
Nilai
tabel
r 0,361
Nomor Soal Valid 2, 5, 7, 8, 11, 12, 13, 14, 19, 20, 22, 23, 26,
28, 29, 30, 31, 33, 38, 40
Jumlah Valid 20
7
Ahmad Sofyan, dkk., Evaluasi Pembelajaran IPA Berbasis Kompetensi, Jakarta: UIN Jakarta Press, 2006 h. 109
8
Lampiran 4, hal. 96
−
−
=
∑
2 2
11
1
t i
i t
S q
p S
n n
r Berdasarkan tabel 3.3 dapat dilihat bahwa jumlah soal yang di uji
validitasya terdapat 40 butir soal, dengan banyaknya responden sebanyak 30 siswa dan r
tabel
yang digunakan adalah 0,361 dan diperoleh soal valid sebanyak 20 butir soal.
2. Pengujian Reliabilitas Instrumen
Pengujian reliabilitas ini menggunakan pendekatan single test trial dengan rumus Kuder-Richardson KR
20
. Seperti dikutip oleh Lilik Novijanti dalam evaluasi pembelajaran sebagai berikut:
9
Keterangan:
11
r =
koefisien reliabilitas tes n
= banyaknya butir item 1
= bilangan konstan S
t 2
= varian total p
i
= proporsi test yang menjawab benar q
i
= proporsi test yang menjawab salah Dimana S
t 2
adalah:
Selanjutnya dalam pemberian interpretasi terhadap koefisien reliabilitas tes
11
r , digunakan patokan sebagai berikut:
10
a. Apabila
11
r sama dengan atau lebih besar dari 0,70 berarti tes hasil belajar
yang diuji reliabilitasnya dinyatakan telah memiliki tingkat reliabilitas yang tinggi.
9
Lilik Novijanti, dkk., Evaluasi Pembelajaran, Lapis PGMI, 2008 h. 10-12
10
Lilik Novijanti, Ibid., h. 10-13
2 2
2 2
2 2
2
:
∑ ∑
∑ ∑
∑
− =
= N
X X
X adalah
X atau
N X
S
t t
t t
t
JS B
P =
b. Apabila
11
r lebih kecil dari 0,70 berarti tes hasil belajar yang sedang
diujikan reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi. Hasil uji reliabilitas instrumen test dapat dilihat pada tabel dibawah ini:
Tabel 3.4 Hasil Uji Reliabilitas Instrumen.
11
Statistik
tabel
r 0,36
hitung
r 0,71
Kesimpulan Reliabel
Berdasarkan tabel 3.4 di atas dapat disimpulkan bahwa data hasil belajar yang diujikan mempunyai reliabilitas yang tinggi, karena mempunyai
tabel
r
hitung
r .
3. Pengujian Taraf Kesukaran Instrumen
Taraf kesukaran tes adalah kemampuan tes tersebut dalam menjaring banyaknya subjek peserta tes yang dapat mengerjakan dengan benar.
12
soal yang dibuat terlalu mudah tidak merangsang siswa untuk meningkatkan tingkat
berfikirnya, sebaliknya soal yang terlalu sulit membuat siswa menjadi putus asa dan tidak mempunyai semangat yang tinggi untuk mencoba mengerjakannnya,
karena terlalu jauh dari jangkauan berfikirnya. Adapun rumus untuk menentukan tingkat kesukaran soal sebagai berikut:
Dimana: P
= Indeks kesukaran B
= Banyaknya siswa yang menjawab soal benar JS = Jumlah seluruh siswa yang mengik
11
Lampiran 4, hal. 96
12
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan Edisi Revisi, Jakarta: Bumi Aksara, 2002 h. 208
B A
B B
A A
P P
J B
J B
D −
= −
= Menurut ketentuan yang sering diikuti, taraf kesukaran sering
diklasifikasikan sebagai berikut:
13
a. Soal dengan P 0,00 sampai 0,30 adalah soal sukar.
b. Soal dengan P 0,30 sampai 0,70 adalah soal sedang.
c. Soal dengan P0,70 sampai 1,00 adalah soal mudah.
Hasil perhitungan tingkat kesukaran instrumen test dapat dilihat pada tabel dibawah ini:
Tabel 3.5 Hasil Uji Taraf Kesukaran Instrumen.
14
Kategori Soal Jumlah Soal
Persentase
Sukar 6
15 Sedang
23 57,5
Mudah 11
27,5
Jumlah 40
100
4. Pengujian Daya Pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai berkemampuan tinggi dengan siswa yang bodoh
berkemampuan rendah.
15
Rumus yang digunakan untuk menentukan daya pembeda adalah:
Dimana: D
= daya pembeda B
A
= banyaknya kelompok atas yang menjawab benar B
B
= banyaknya kelompok bawah yang menjawab benar J
A
= banyaknya peserta kelompok atas J
B
= banyaknya peserta kelompok bawah
13
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, Ibid., h. 210
14
Lampiran 4, hal. 97
15
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, Ibid., h. 211