Kriteria  pengujian  reliabilitas  tes  yaitu  nilai  r
11
dikonsultasikan  dengan  harga rtabel. Apabila r
hitung
r
tabel
, maka tes yang  diujicobakan reliabel. Berdasarkan  analisis  tes  ujicoba  yang  telah  dilakukan,  diperoleh  r
hitung
= 0.7283.  Dari  tabel  r product moment diperoleh r
tabel
untuk  N  = 23 dengan  taraf signifikansi  α  =  5  adalah  0,3365.  Karena  r
hitung
r
tabel
dapat  disimpulkan instrument yang telah diujicobakan reliabel. Proses perhitungan dapat dilihat pada
lampiran 10.
3.5.2.3 Tingkat Kesukaran Soal
Ditinjau dari segi tingkat kesukaran, soal yang baik adalah soal yang tidak terlalu  mudah  juga  tidak  terlalu  sukar  Arikunto,  2007:  207.  Bilangan  yang
menunjukkan sukar atau mudahnya suatu soal tersebut antara 0,00 sampai dengan 1,00. Indeks kesukaran ini menunjukkan tingkat kesukaran soal.
Rumus untuk menghitung tingkat kesukaran soal adalah: =
ℎ ℎ
= Klasifikasi indeks kesukaran soal adalah sebagai berikut.
1 Soal dengan TK = 0,00 sampai 0,30 adalah soal sukar. 2 Soal dengan TK = 0,31 sampai 0,70 adalah soal sedang.
3 Soal  dengan  TK  =  0,71  sampai  1,00  adalah  soal  mudah.  Arikunto, 2007:210.
Berdasarkan  hasil  ujicoba  dari  10  butir  soal,  diperoleh  satu  soal  dengan kriteria  sukar  yaitu  nomor  6.  Diperoleh  lima  soal  dengan  kriteria  sedang  yaitu
nomor  3,  7  ,8,  9,  dan  10.  Sedangkan  soal  dengan  kriteria  mudah  adalah  soal nomor 1, 2, 4, dan 5. Proses perhitungan dapat dilihat pada lampiran 11.
3.5.2.4 Daya Pembeda Soal
Daya  pembeda  adalah  kemampuan  suatu  soal  untuk  membedakan  siswa yang  pandai  berkemampuan  tinggi  dengan  siswa  yang  kurang  pandai
berkemampuan rendah. Soal dikatakan baik apabila daya pembeda soal semakin besar.  Angka  yang  menunjukkan  besarnya  daya  pembeda  disebut  indeks
diskriminasi D Arikunto, 2007: 211. Rumus yang digunakan untuk menentukan  indeks diskriminan pada butir
soal uraian adalah:
= −
= −
. Keterangan:
D = daya beda soal, J
A
= banyaknya siswa kelompok atas, J
B
= banyaknya siswa kelompok bawah, B
A
= total nilai pada butir soal dari siswa kelompok atas, B
B
= total nilai pada butir soal dari siswa kelompok bawah, P
A
= proporsi jawaban benar dari siswa kelompok atas, P
B
= proporsi jawaban benar dari siswa kelompok bawah. Kalsifikasi D:
0,00  D ≤ 0,20 maka daya bedanya jelek, 0,20  D ≤ 0,40 maka daya bedanya cukup,
0,40  D ≤ 0,70 maka daya bedanya baik, 0,70  D ≤ 1,00 maka daya bedanya baik sekali, Arikunto, 2007: 211.
Apabila  nilai D negatif maka soal termasuk kriteria  yang tidak baik. Jadi semua butir soal yang mempunyai nilai D negatif sebaiknya dibuang saja.
Dari hasil ujicoba soal yang telah dilaksankan, diperoleh tujuh soal dengan daya  pembeda  yang  baik,  yaitu  soal  nomor  1,  2,  5,  6,  7,  8,  dan  10.  Satu  soal
mempunyai daya pembeda dengan kriteria cukup, yaitu soal nomor 3. Sedangkan dua soal mempunyai daya pembeda dengan kriteria jelek, yaitu soal nomor 4 dan
9. Proses perhitungan dapat dilihat pada lampiran 12.
3.5.2.5 Instrumen Tes yang Digunakan