Keterangan : r
11
: reliabilitas yang dicari k
: banyak butir soal valid St
: varians skor total Si
2
: jumlah varians skor item skor total Kriteria koefisien reliabilitas adalah sebagai berikut:
0,80 ≤ 1,00
Derajat reliabilitas sangat baik 0,60
≤ 0,80 Derajat reliabilitas baik
0,40 ≤ 0,60
Derajat reliabilitas cukup 0,20
≤ 0,40 Derajat reliabilitas rendah
0,00 ≤ 0,20
Derajat reliabilitas sangat rendah Berdasarkan kriteria koefisian reliabilitas, nilai r
11
= 0,78 berada diantara kisaran 0,60 r
11
0,80 yang menerangkan bahwa dari 10 soal yang valid, memiliki derajat reliabilitas baik.
c. Indeks Kesukaran
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu dengan langkah-langkah sebagai berikut :
8
a. Menghitung rata-rata skor untuk tiap butir soal dengan rumus : Rata-rata =
b. Menghitung tingkat kesukaran dengan rumus : Tingkat kesukaran P =
Menurut ketentuannya indeks kesukaran sering diklasifikasikan sebagai berikut :
Soal dengan P 0,00 – 0,30 adalah soal sukar
Soal dengan P 0,31 – 0,70 adalah soal sedang
Soal dengan P 0,71 – 1,00 adalah soal mudah
8
Zaenal Arifin, Evaluasi Pembelajaran, Bandung : PT.Remaja Rosda Karya, 2012, cet
ke-2, h. 147
Dari hasil perhitungan diperoleh hasil 1 butir soal dinyatakan memiliki indeks kesukaran sukar, dan 9 butir soal memiliki indeks kesukaran sedang. Pada
penelitian ini tidak menggunakan soal yang mudah karena kemampuan matematik yang diteliti adalah kemampuan berpikir kreatif matematik siswa.
d. Daya Pembeda Analisis daya pembeda, mengkaji butir-butir soal dengan tujuan untuk
mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu tinggi dengan siswa yang tergolong kurang lemah prestasinya.
Untuk mengetahui daya pembeda butir soal bentuk uraian adalah sebagai berikut
9
:
DP
XKA XKB
Skor Maks
Keterangan : DP
: Indeks daya pembeda butir soal
XKA XKB
: Nilai rata-rata kelompok atas : Nilai rata-rata kelompok bawah
Skor Maks : Skor Maksimum
Adapun kriteria daya pembeda sebagai berikut: ≥ 0.40
= Sangat Baik 0,30
– 0,39 = Baik
0,20 – 0,29
= Cukup, soal perlu perbaikan ≤ 0,19
= Kurang baik, soal harus dibuang Berdasarkan kriteria daya pembeda, dari 10 butir soal yang diujicobakan
terdapat 3 soal kurang baik namun masih digunakan pada penelitian karena soal tersebut valid dan indeks kesukaran tergolong sedang, dan kekurangan soal
terdapat pada pengecoh yang kurang baik. Berdasarkan hasil perhitungan uji validitas, daya pembeda, dan tingkat
kesukaran dari tiap butir soal, dapat dibuat rekapitulasi analisis butir sebagai berikut:
9
Ibid, h.146