kalimat dan melihat kembali pilihan jawaban yang telah dibuat. Peneliti mengubah pilihan jawaban yang belum urut abjad dan
merevisi pilihan jawaban yang mudah ditebak. Guru SD K Kadirojo menyatakan bahwa perangkat tes hasil belajar sudah baik dan layak
untuk digunakan uji coba lapangan dengan diperbaiki sesuai saran. Skor yang diperoleh adalah 3,2 dengan kategori baik. Perbaikan yang
harus dilakukan oleh peneliti adalah peneliti melihat kembali soal yang telah dibuat dan mengganti dengan kalimat yang efektif. Guru SD N
Denggung menyatakan bahwa perangkat tes hasil belajar sudah baik dan layak untuk digunakan uji coba lapangan dengan diperbaiki
sesuai saran. Skor yang diperoleh adalah 3,2 dengan kategori baik. Perbaikan yang harus dilakukan oleh peneliti adalah peneliti
memperbaiki soal sesuai dengan estimasi kesulitan. Konversi kategori skor untuk menyatakan kelayakan produk tes hasil belajar pada tabel
3.4 halaman 50.
e. Revisi Desain
Peneliti melakukan revisi terhadap kisi-kisi soal yang telah divalidasi. Revisi dilakukan berdasarkan kritik dan saran dari para ahli yang dapat
dilihat pada lampiran lima. Perbaikan yang harus dilakukan oleh peneliti adalah peneliti memperbaiki estimasi kesulitan pada setiap
butir soal. Peneliti meninjau kembali soal yang terlalu sukar dari segi bahasa dan pemahaman siswa dan memperbaikinya. Peneliti membuat
instruksi soal agar lebih jelas. Peneliti mengubah kalimat yang terdapat kata penghubung di awal kalimat dan melihat kembali pilihan jawaban
yang telah dibuat. Peneliti mengubah pilihan jawaban yang belum urut abjad dan mengganti pilihan jawaban yang mudah ditebak. Peneliti
melakukan revisi soal yang telah dibuat dan memperbaiki soal dengan kalimat yang efektif.
f. Uji coba Produk
Peneliti melakukan uji coba produk di SD N Condongcatur pada hari Sabtu, 14 November 2015. Uji coba produk dilakukan pada siswa
kelas VA dan kelas VB yang masing-masing kelas terdiri dari 30 siswa. Uji coba produk dilaksanakan selama 2 jp setelah istirahat
pertama. Hasil uji coba dianalisis menggunakan TAP untuk mengetahui validitas, reliabilitas, daya beda, tingkat kesukaran, dan
pengecoh. Hasil analisis menggunakan aplikasi TAP soal tipe A dan soal tipe B dapat dilihat pada lampiran 10 dan 11 halaman 151
– 159.
g. Revisi Produk
Produk yang telah diujicobakan akan dihitung validitas, reliabilitas, dan karakteristik butir soal. Penentuan validitas
berdasarkan nilai r tabel pada taraf signifikansi 5 dengan jumlah responden 30 siswa diperoleh r
xy
= 0,361, maka soal yang lebih dari 0,361 dikatakan valid dan yang kurang dari 0,361 dikatakan tidak
valid. Jadi soal yang valid akan digunakan oleh peneliti dan soal yang tidak valid akan dibuang. Soal yang valid akan dihitung tingkat
reliabilitas soal yang dapat dilihat pada tabel 3.5 tentang kriteria reliabilitas. Karakteristik butir soal mencakup daya beda, tingkat
kesukaran dan pengecoh. Kriteria daya beda dapat dilihat pada tabel 3.6. Peneliti menggunakan daya beda dengan kriteria baik dan kriteria
baik sekali,sedangkan daya beda yang mempunyai kriteria cukup dan jelek tidak digunakan. Soal yang mempunyai daya beda 0,41 akan
digunakan oleh peneliti dan soal yang mempunyai daya beda 0,41 tidak digunakan. Tingkat kesukaran mempunyai kategori sukar,
sedang, dan mudah yang dapat dilihat pada tabel 3.8 halaman 54. Tingkat kesukaran pada kategori sukar mempunyai rentang nilai antara
0,00 – 0,30. Tingkat kesukaran pada kategori sedang mempunyai
rentang nilai antara 0,31 – 0,70. Tingkat kesukaran pada kategori
mudah mempunyai rentang nilai antara 0,71 – 1,00. Pengecoh dapat
berfungsi baik apabila dipilih minimal 5 dari peserta tes. Pengecoh tidak berfungsi jika dipilih kurang dari 5 dari peserta tes tidak
memilih pengecoh tersebut, maka pengecoh tersebut harus direvisi.
2. Kualitas Tes