Keterangan : r
11
: reliabilitas yang dicari k
: banyak butir soal valid St
: varians skor total Si
2
: jumlah varians skor item skor total Kriteria koefisien reliabilitas adalah sebagai berikut:
0,80 ≤ 1,00
Derajat reliabilitas sangat baik 0,60
≤ 0,80 Derajat reliabilitas baik
0,40 ≤ 0,60
Derajat reliabilitas cukup 0,20
≤ 0,40 Derajat reliabilitas rendah
0,00 ≤ 0,20
Derajat reliabilitas sangat rendah Berdasarkan kriteria koefisian reliabilitas, nilai r
11
= 0,78 berada diantara kisaran  0,60    r
11
0,80  yang  menerangkan  bahwa  dari  10  soal  yang  valid, memiliki derajat reliabilitas baik.
c. Indeks Kesukaran
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu dengan langkah-langkah sebagai berikut :
8
a.  Menghitung rata-rata skor untuk tiap butir soal dengan rumus : Rata-rata =
b. Menghitung tingkat kesukaran dengan rumus : Tingkat kesukaran P  =
Menurut  ketentuannya  indeks  kesukaran  sering  diklasifikasikan  sebagai berikut :
  Soal dengan P 0,00 – 0,30 adalah soal sukar
  Soal dengan P 0,31 – 0,70 adalah soal sedang
  Soal dengan P 0,71 – 1,00 adalah soal mudah
8
Zaenal Arifin, Evaluasi Pembelajaran, Bandung : PT.Remaja Rosda Karya, 2012, cet
ke-2, h. 147
Dari  hasil  perhitungan  diperoleh  hasil  1  butir  soal  dinyatakan  memiliki indeks kesukaran sukar, dan 9 butir soal memiliki indeks kesukaran sedang. Pada
penelitian ini tidak menggunakan soal yang mudah karena kemampuan matematik yang diteliti adalah kemampuan berpikir kreatif matematik siswa.
d. Daya Pembeda Analisis  daya  pembeda,  mengkaji  butir-butir  soal  dengan  tujuan  untuk
mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu tinggi dengan siswa yang tergolong kurang lemah prestasinya.
Untuk mengetahui daya pembeda butir soal bentuk uraian adalah sebagai berikut
9
:
DP 
XKA  XKB
Skor Maks
Keterangan : DP
: Indeks daya pembeda butir soal
XKA XKB
: Nilai rata-rata kelompok atas : Nilai rata-rata kelompok bawah
Skor Maks : Skor Maksimum
Adapun kriteria daya pembeda sebagai berikut: ≥ 0.40
= Sangat Baik 0,30
– 0,39 = Baik
0,20 – 0,29
= Cukup, soal perlu perbaikan ≤ 0,19
= Kurang baik, soal harus dibuang Berdasarkan kriteria daya pembeda, dari 10 butir soal yang diujicobakan
terdapat 3 soal kurang baik namun masih digunakan pada penelitian karena soal tersebut  valid  dan  indeks  kesukaran  tergolong  sedang,  dan  kekurangan  soal
terdapat pada pengecoh yang kurang baik. Berdasarkan  hasil  perhitungan  uji  validitas,  daya  pembeda,  dan  tingkat
kesukaran  dari  tiap  butir  soal,  dapat  dibuat  rekapitulasi  analisis  butir  sebagai berikut:
9
Ibid, h.146