52
Keterangan :
r
ix
: koefisien korelasi item total : skor item
: skor total : banyaknya subjek
Priyatno 2010: 91 Pengujian menggunakan uji dua sisi dengan taraf signifikansi 0,05 dengan
kriteria pengambilan keputusan yaitu jika r hitung r tebel uji 2 sisi dengan sig. 0,05 maka instrumen atau item-item pertanyaan dinyatakan valid. Namun jika r
hitung r tabel uji 2 sisi dengan sig. 0,05 maka instrumen atau item-item
pertanyaan dinyatakan tidak valid Priyatno 2010: 91. Untuk membantu penghitungan validitas soal digunakan program SPSS Statistical Product and
Service Solution versi 17.
3.5.3.2 Reliabilitas
Sama halnya dengan validitas, kata reliabilitas berasal dari bahasa inggris “reliability” yang berarti kemantapan atau keajegan. Sehingga secara sederhana
pengertian reliabilitas merujuk pada masalah keajegan tetap atau kemantapan alat ukur yang dipakai. Ada tiga aspek penting dalam reliabilitas, yaitu dapat
diandalkan dependability, dapat diramalkan predictability dan menunjukan ketepatan Aslichati 2010: 6.6. Jadi suatu alat ukur yang reliabel adalah alat ukur
yang dapat digunakan untuk memprediksi atau meramalkan karena hasilnya selalu
53 konstan tetap dari pengukuran satu ke pengukuran berikutnya. Untuk
mengetahui reabilitas perangkat tes soal bentuk pilihan ganda digunakan metode alpha dengan rumus sebagai berikut:
Keterangan: r
11
: nilai reliabilitas : jumlah varians skor tiap-tiap item
: varians total k :
jumlah item
Riduwan, 2012: 115 Besar r
11
dikonsultasikan dengan nilai tabel r product moment dengan dk = N – 1, signifikansi 5 dan uji 2 sisi. Keputusan dengan membandingkan r
11
dengan . Kaidah keputusan yaitu jika r
11
berarti reliabel dan jika r
11
berarti tidak reliabel Riduwan 2012: 118. Untuk mengetahui reliabilitas instrumen, digunakan program SPSS versi 17.
3.5.3.3 Tingkat kesukaran
Dihitung dengan rumus:
P
Keterangan: P
: Indeks kesukaran B
: Banyaknya jumlah siswa yang menjawab soal itu dengan betul JS
: Jumlah seluruh siswa peserta tes
54 Arikunto 2012: 223.
Harga tingkat kesukaran yang diperoleh, kemudian dikonsultasikan dengan ketentuan sebagai berikut:
Soal dengan P 0,00 sampai 0,30 adalah soal sukar. Soal dengan P 0,31 sampai 0,70 adalah soal sedang.
Soal dengan P 0,71 sampai 1,00 adalah soal mudah. Arikunto 2012: 225.
3.5.3.4 Daya pembeda butir soal
Menurut Sugihartono dkk. 2007: 138 daya pembeda atau “discriminating power”
soal adalah seberapa jauh suatu butir soal mampu membedakan tentang keadaan aspek yang diukur apabila keadaannya memang berbeda. Tes yang baik
harus dapat membedakan kemampuan anak sesuai dengan tingkat kepandaiannya Sugihartono dkk., 2007: 138. Rumus daya pembeda butir soal yaitu:
Keterangan: : daya beda soal
: Jumlah peserta tes : banyaknya peserta pada kelompok atas
: banyaknya peserta pada kelompok bawah : banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
: banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar : Proporsi peserta kelompok atas yang menjawab benar.
: Proporsi peserta kelompok bawah yang menjawab benar
55 Arikunto 2012: 229
Klasifikasi daya pembeda: : 0,00 – 0,20
: jelek poor : 0,21 – 0,40
: cukup satistifactory : 0,41 – 0,70
: baik good : 0,71 – 1,00
: baik sekali excellent : negatif, semuanya tidak baik. Jadi semua butir soal yang mempunyai nilai
negatif sebaiknya dibuang saja Arikunto 2012: 232.
3.6 Metode Analisis Data