untuk mengukur reliabilitas suatu tes yang berbentuk uraian adalah dengan menggunakan rumus Alpha Cronbach
8
:
Dimana: = reabilitas yang dicari
n = banyaknya butir soal yang valid
∑ = jumlah varians skor tiap-tiap item
= varians total
Kriteria koefisien reliabilitas adalah sebagai berikut: 0,80
≤ 1,00 Derajat reliabilitas sangat baik 0,60
≤ 0,80 Derajat reliabilitas baik 0,40
≤ 0,60 Derajat reliabilitas cukup 0,20
≤ 0,40 Derajat reliabilitas rendah 0,00
≤ 0,20 Derajat reliabilitas sangat rendah
Berdasarkan hasil perhitungan reabilitas instrument, diperoleh nilai 0,552. Jika dilihat dari kriteria reabilitas, maka dapat disimpulkan bahwa
instrument penelitian memiliki reabilitas yang cukup.
3. Taraf Kesukaran dan Daya Pembeda
Uji taraf kesukaran digunakan untuk mengetahui soal-soal yang sukar, sedang dan mudah. Bilangan yang menunjukkan sukar, sedang dan
mudahnya suatu soal disebut indeks kesukaran.
9
Uji taraf kesukaran instrumen penelitian dihitung dengan menghitung indeks besarannya dengan
rumus :
8
Ibid, h. 122.
9
Ibid, h. 222-223.
Dimana: P = Indeks Kesukaran
B = Jumlah skor yang diperoleh responden pada item ke-i
JS = Jumlah skor maksimum item soal ke-i
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut:
10
0,00 P ≤ 0,30 : soal sukar 0,30
P ≤ 0,70 : soal sedang 0,70 P ≤ 1,00 : soal mudah
Berdasarkan hasil perhitungan tingkat kesukaran, dari 8 butir soal yang valid, diperoleh hasil 8 butir soal tergolong dalam kategori soal sukar.
Pengujian daya pembeda soal digunakan untuk mengetahui kemampuan suatu soal dalam membedakan antara peserta tes yang
berkemampuan tinggi dengan peserta tes yang berkemampuan rendah.
11
Rumus yang digunakan untuk pengujian daya pembeda adalah sebagai berikut:
Dimana: = Indeks daya pembeda suatu butir soal
= Banyaknya siswa kelompok atas yang menjawab benar = Banyaknya siswa kelompok bawah yang menjawab benar
= Banyak siswa pada kelompok atas = Banyak siswa pada kelompok bawah
Tolok ukur untuk menginterpretaikan daya pembeda tiap butir soal digunakan kriteria sebagai berikut :
12
10
Ibid, h. 225.
11
Ibid, h. 226.
12
Ibid, h. 232.
D = 0,00 : sangat jelek
0,00 DP ≤ 0,20 : jelek 0,20 DP ≤ 0,40 : cukup
0,40 DP ≤ 0,70 : baik 0,70 DP ≤ 1,00 : baik sekali
Berdasarkan hasil perhitungan daya pembeda soal, dari 8 butir soal valid yang diujikan, 1 soal dikategorikan
“cukup”, dan 7 soal dikategorikan “jelek”.
Tabel 3.5 Rekapitulasi Analisis Butir Soal
No. Soal
Validitas Taraf
Kesukaran Daya Pembeda
Keterangan
1 Valid
Sukar Cukup
Digunakan 2
Valid Sukar
Buruk Digunakan
3 Tidak Valid
- -
Tidak Digunakan 4
Valid Sukar
Buruk Digunakan
5 Valid
Sukar Buruk
Digunakan 6
Tidak Valid -
- Tidak Digunakan
7 Valid
Sukar Buruk
Diperbaiki 8
Valid Sukar
Buruk Digunakan
9 Valid
Sukar Buruk
Digunakan 10
Valid Sukar
Buruk Digunakan
Reliabilitas 0,552
Berdasarkan kesimpulan hasil uji validitas tersebut penulis memutuskan hanya 8 butir soal yang akan digunakan dalam tes yang akan
dilakukan di kelas eksperimen dan kontrol pada akhir penelitian yaitu butir soal nomor 1, 2, 4, 5, 7, 8, 9, dan 10.
Terdapat 7 soal yang penulis perbaiki pada butir soal nomor 2, 4, 5 , 7, 8, 9 dan 10. Pada semua soal tersebut penulis memperbaiki redaksi perintah dalam
soal serta menambahkan informasi tambahan dalam soal yang diharapkan tingkat