Uji coba Instrumen Penelitian Analisis Perangkat Tes
korelasi tersebut. Jika r
hitung
r
tabel
, maka korelasi tersebut tidak signifikan Arikunto, 2009:78.
3.2.3.4.2 Reliabilitas Seperangkat tes dikatakan reliabel apabila tes tersebut dapat memberikan
hasil yang tetap. Artinya apabila tes tersebut dikenakan pada sejumlah subjek yang sama pada lain waktu, maka hasilnya akan tetap sama atau relatif sama.
Untuk mencari reliabilitas soal bentuk uraian digunakan rumus Alpha sebagai berikut.
Keterangan: r
11
: reliabilitas yang dicari : jumlah varians skor tiap-tiap item
: varians total Suharsimi Arikunto, 2009:109
Selanjutnya dalam pemberian interpretasi terhadap koefisien reliabilitas tes r
11
pada umumnya digunakan patokan sebagai berikut. 1 Apabila r
11
sama dengan atau lebih besar daripada 0,70 berarti tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki reliabilitas
yang tinggi = reliable. 2 Apabila r
11
lebih kecil daripada 0,70 berarti bahwa tes hasil belajar yang sedang diuji reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi
un-reliable.
3.2.3.4.3 Tingkat Kesukaran. Menganalisis tingkat kesukaran berarti mengkaji soal tes dari segi
kesulitannya sehingga diperoleh soal yang termasuk mudah, sedang, dan sukar. Teknik perhitungannya adalah dengan menghitung besarnya prosentase testee
yang menjawab benar untuk tiap-tiap item. Untuk soal uraian, teknik perhitungan dengan menghitung berapa persen
peserta didik yang gagal menjawab benar atau ada di bawah batas lulus passing grade untuk tiap-tiap item. Dalam skripsi ini penyusun tes menetapkan batas
kelulusan sebagai berikut. Skor tiap butir soal uraian adalah 1 sampai dengan 10, maka siswa dikatakan menjawab benar bila mendapat skor 6 sampai dengan 10,
selain itu jawaban dikategorikan salah. Menurut Witherington, angka indek kesukaran item besarnya berkisar
antara 0,00 sampai dengan 1,00. Angka indek kesukaran item dapat diperoleh dengan menggunakan rumus yang dikemukakan oleh Du Bois, yaitu:
dimana P : Proportion = proporsi = angka indek kesukaran item
N
P
: banyaknya testee yang dapat menjawab dengan benar terhadap butir item yang bersangkutan.
N : banyaknya testee yang mengikuti tes. Selanjutnya dalam pemberian interpretasi terhadap angka indeks
kesukaran item P menurut Robert L. Thorndike dan Elizabeth Hagen sebagai berikut.
Tabel 3.1 Interpretasi Indeks Kesukaran Item
Besarnya P Interpretasi
Kurang dari 0,30 Terlalu sukar
0,30 – 0,70
Cukup sedang Lebih dari 0,70
Terlalu mudah Annas Sudijono, 2009:327
3.2.3.4.4 Daya Pembeda. Daya pembeda soal diperlukan untuk mengetahui seberapa akurat butir
pertanyaaan itu membedakan subjek yang lebih mampu dari subjek yang kurang mampu. Artinya jika soal dikerjakan peserta didik yang pandai hasilnya akan
menunjukkan prestasi yang tinggi dan apabila soal diberikan pada peserta didik berkemampuan rendah maka hasilnya akan rendah.
Menurut Arifin 1991: 136, rumus yang digunakan untuk menghitung daya pembeda soal berbentuk uraian adalah sebagai berikut.
n WH
- WL
D
Keterangan : WL
= jumlah testi yang gagal menjawab benar dari kelompok bawah.
WH =
jumlah testi yang gagal menjawab benar dari kelompok atas. n
= 27 x jumlah testi
Hasil perhitungan dengan menggunakan rumus di atas dapat menggambarkan tingkat kemampuan soal dalam membedakan antar peserta didik
yang sudah memahami materi yang diujikan dengan peserta didik yang
belumtidak memahami materi yang diujikan. Adapun klasifikasinya adalah seperti berikut ini.
0,00 - 0,19 = soal jelek
0,20 - 0,29 = soal diperbaiki
0,30 - 0,39 = soal diterima cukup baik
0,40 ke atas = soal diterima baik
Selanjutnya kita perlu menghitung signifikansi daya pembeda dari tiap-tiap butir soal untuk mengetahui bahwa suatu butir soal itu dapat membedakan testi
yang pandai dan kurang pandai. Rumus yang digunakan sebagai berikut.
t =
1
2 2
2 1
i i
n n
x x
ML MH
Di mana: MH
= rata-rata kelompok atas ML
= rata-rata kelompok bawah x
1 2
= jumlah kuadrat deviasi individual kelompok atas ∑ x
2 2
= jumlah kuadrat deviasi individual kelompok bawah ni
= 27 × N, dimana N adalah jumlah peserta tes Hasil perhitungan nilai t dikonsultasikan dengan nilai t pada tabel dengan
dk = n
1
-1 + n
2
- 1 dan α = 5. Soal memiliki daya pembeda yang signifikan jika
t t
tabel
. Jadi perangkat tes atau instrumen dikatakan baik apabila memiliki butir-
butir soal yang baik. Sedangkan butir-butir soal baik jika valid butir soal dapat menjalankan fungsi pengukurannya dengan baik, reliabel hasil pengukuran
relatif sama jika dilakukan pengujian butir soal berkali-kali, tingkat kesukarannya dapat diketahui tidak terlalu mudah dan tidak terlalu sukar serta kesanggupan
instrumen dalam membedakan siswa yang tergolong mampu tinggi prestasinya dengan siswa yang tergolong kurang lemah prestasinya.