2 2
11
S pq
S 1
n n
r
2
Y
= Jumlah kuadrat skor total,
XY
= Jumlah perkalian skor item dan skor total. Kriteria untuk melihat valid atau tidaknya dibandingkan dengan harga r
tabel dengan taraf signifikan 5 , dan N = 30 diperoleh r
tabel
=0.361. Jadi suatu butir dikatakan valid jika r
hitung
r
tabel.
Tabel 3.3 Analisis Validitas Butir Soal
Kriteria Nomor soal
Valid 1, 2, 3, 5, 6, 7, 10, 11, 12, 13, 14, 15, 16, 17, 19, 20, 21,
22, 23, 24, 25, 27, 28, 29, 30 Tidak valid
4, 8, 9, 18, 26 Sumber: data primer setelah diolah 2011 Lampiran 14
Sesuai hasil perhitungan diperoleh butir soal yang tidak valid adalah butir soal 4, 8, 9, 18, 26 sehingga 5 butir soal tersebut dibuang. Soal tersebut dibuang
karena setelah dilakukan uji coba dan di analisis didapatkan r hitung r tabel, jadi soal tersebut dikatakan tidak valid dan harus dibuang.
3.4.2. Reliabilitas
Sebuah tes dikatakan reliabel apabila hasil-hasil tes tersebut menunjukkan ketepatan Arikunto, 2007:60. Untuk menentukan reliabilitas soal pilihan ganda,
digunakan rumus KR-20 Arikunto, 2007:100 yaitu:
Jika r11 r tabel maka tes tersebut dikatakan reliabel. Keterangan:
r11 = Reliabilitas tes secara keseluruhan
p = Proporsi subjek yang menjawab item dengan benar,
q = Proporsi subjek yang menjawab item dengan salah q=1-p,
pq
= Jumlah hasil perkalian antara p dan q, n
= Banyaknya item, S
= Standar deviasi dari tes standar deviasi adalah akar varians. Kemudian hasil perhitungan koefisien reliabilitas dikonsultasikan dengan
tabel r product moment. Jika r
11
r
tabel
maka dapat disimpulkan bahwa soal tersebut reliabel. Dari perhitungan diperoleh reliabilitas tesnya adalah. Dengan
taraf signifikan 5 , dan N = 30 diperoleh r
tabel
= 0,361. dan r
11
= 0,839 Karena r
11
dari r
tabel
maka dapat disimpulkan bahwa instrumen tes reliabel.
3.4.3. Daya Pembeda D
Menurut Arikunto 2007:211 daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai berkemampuan tinggi dengan
peserta didik yang berkemampuan rendah. Daya beda dicari dengan mengambil 50 skor teratas sebagai kelompok atas J
A
dan 50 skor terbawah sebagai kelompok bawah J
B
. Dan jika jumlah peserta tes lebih dari 100, maka hanya diambil kedua kutubnya saja 27 untuk kelompok atas dan 27 untuk kelompok
bawah. Seluruh peserta tes dibagi menjadi dua sama besar yaitu 50 untuk
kelompok atas dan 50 untuk kelompok bawah. Hal ini disebabkan karena peserta tes berjumlah 32 orang yang berarti kurang dari 100. Menurut Arikunto
2009:213 rumus yang digunakan yaitu:
Keterangan: D
= Daya pembeda, J
A
= Banyaknya peserta kelompok atas, J
B
= Banyaknya peserta kelompok bawah, B
A
= Banyaknya peserta kelompok atas yang menjawab soal itu dengan benar,
B
B
= Banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar,
A A
A
J B
P
= Proporsi peserta kelompok atas yang menjawab benar,
B B
B
J B
P
= Proporsi peserta kelompok bawah yang menjawab benar. Kriteria soal-soal yang dapat dipakai sebagai instrumen berdasarkan
pembedanya diklasifikasikan sebagai berikut: D : 0,00
– 0,20 : jelek poor, D : 0,20
– 0,40 : cukup satisfactory, D : 0,40
– 0,70 : baik good, D : 0,07
– 1,00 : baik sekali excellent, D : negatif, semuanya tidak baik.
Sehingga butir soal yang mempunyai D negatif sebaiknya dibuang Arikunto,2006:218.
B A
B B
A A
P P
J B
J B
D
Tabel 3.4 Analisis Daya Pembeda Butir Soal
Kriteria Nomor soal
Baik Sekali Baik
1, 5, 6, 10,11, 17, 19, 21, 24, 28 Cukup
2, 3, 7, 12, 13, 14, 15, 16, 20, 22, 23, 25, 27, 29, 30 Jelek
Sumber: data primer setelah diolah 2011 Sesuai perhitungan diketahui bahwa butir soal 1, 5, 6, 10,11, 17, 19, 21, 24,
28 mempunyai daya pembeda soal yang baik. Dan butir soal 2, 3, 7, 12, 13, 14, 15, 16, 20, 22, 23, 25, 27, 29, 30 mempunyai daya pembeda soal yang cukup.
3.4.4 Tingkat Kesukaran Butir Soal