32
b. Analisis Butir Soal
Berangkat dari fungsi tes sebagai alat ukur, maka sebuah tes baru dapat dianggap berhasil menjalankan fungsinya jika ia mampu
memberikan informasi yang sesuai dengan keadaan sebenarnya dari objek yang diukur. Tes yang tidak mampu memberikan informasi
yang diinginkan tidak lebih dari sampah. Oleh karena itu, sebelum digunakan tes hasil belajar harus dianalisis terlebih dahulu sehingga
dapat memberikan hasil yang memuaskan. Menurut Ngalim Purwanto 2010:118-120 Analisis soal tes
ialah mencari soal tes mana yang baik dan mana yang tidak baik, dan mengapa soal itu dikatakan baik atau tidak baik. Dengan mengetahui
soal-soal yang tidak baik itu selanjutnya kita dapat mencari kemungkinan sebab-sebab mengapa soal itu tidak baik. Dengan
membuat analisis soal, sedikitknya kita dapat mengetahui tiga hal
penting yang dapat di peroleh dari tiap soal, yaitu :
a Sampai di mana tingkat atau taraf kesukaran soal itu defficulty level of an item
b Apakah soal itu mempunyai daya beda discriminating power sehingga dapat membedakan kelompok peserta didik yang pandai
dengan kelompok peserta didik yang bodoh c Apakah semua alternatif jawaban options menarik jawaban-
jawaban, ataukah ada yang demikian tidak menarik sehingga tidak perlu dimasukkan ke dalam soal.
Menurut Ngalim Purwanto 2010:119 untuk menghitung taraf kesukaran dan daya pembeda tiap soal dari suatu tes, kita perlu
33 terlebih dahulu mengelompokkan hasil tes tersebut menjadi tiga
kelompok berdasarkan peringkat dari keseluruhan skir yang kita peroleh. Ketiga kelompok yang di maksud ialah :
a kelompok pandai atau upper group 25 dari peringkat bagian atas
b kelompok kurang atau lower group 25 dari peringkat bagian bawah
c kelompok sedang atau middle group 50 dari peringkat bagian tengah.
Yang diperlukan dalam analisis soal selanjutnya ialah kelompok pandai upper group dan kelompok kurang lower group
, sedangkat kelompok sedang middle group di biarkan
a Taraf Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak
mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.
Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan rumus :
T L
U TK
Sumber : Ngalim Purwanto 2010 : 119-120
34
Keterangan :
TK : indeks TK atau tingkattaraf kesukaran yang dicari. U
: Jumlah peserta didik yang termasuk kelompok pandai upper group yang menjawab benar untuk tiap soal
L : Jumlah peserta didik yang termasuk kelompok kurang lower
group yang menjawab benar untuk tiap soal T
: Jumlah peserta didik dari kelompok pandai dan kelompok kurang jumlah upper group dan lower group.
Untuk pilihan ganda dengan option 5, jika tingkat kesukarannya sama atau lebih kecil dari 0,27 , dikategorikan soal
yang sukar, sedangkan jika tingkat kesukarannya sama atau lebih besar dari 0,73 , dikategorikan soal yang mudah.
Alternatif lain untuk melihat indeks kesukaran adalah besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran
ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran
0,00 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soal itu terlalu mudah
0,00 0,1
sukar mudah
Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P p besar, singkatan dari kata “proporsi”. Dengan demikian maka
soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P = 0,20
Rumus mencari P adalah JS
B P
35 Sumber : Suharsimi Arikunto 2013 : 222-225
Keterangan : P = Indeks kesukaran
B = Banyaknya siswa yang menjawab soal itu dengan betul JS = jumlah seluruh siswa peserta tes
Menurut ketentuan yang sering diikuti, indeks kesukaran
sering diklarifikasikan sebagai berikut :
P : Indeks kesukaran
Dilihat dari dua sumber di atas, dapat ditarik kesimpulan bahwa Suharsimi Arikunto 2013 : 222-225 dapat menjadi acuan
yang dipakai oleh penulis.
b Daya beda discriminating power suatu soal
Daya beda soal tes ialah bagaimana kemampuan soal itu untuk membedakan peserta didik -peserta didik yang termasuk kelompok
pandai upper group dengan peserta didik -peserta didik yang termasuk kelompok kurang lower group. Daya pembeda suatu soal
tes dapat dihitung dengan menggunakan rumus seperti berikut :
Sumber : Ngalim Purwanto 2010 : 120-124 Keterangan :
DP : indeks DP atau daya pembeda yang dicari U : Jumlah peserta didik yang termasuk kelompok pandai upper
group yang menjawab benar untuk tiap soal 1. Soal dengan P 0,00 sampai 0,30 adalah soal sukar
2. Soal dengan P 0,31 sampai 0,70 adalah soal sedang 3. Soal dengan P 0,71 sampai 1,00 adalah soal mudah
36 L : Jumlah peserta didik yang termasuk kelompok kurang lower
group yang menjawab benar untuk tiap soal T : Jumlah peserta didik dari kelompok pandai dan kelompok
kurang jumlah upper group dan lower group
Jika daya pembeda soal itu adalah 0 nol atau negatif minus maka soal itu perlu direvisidiperbaiki.
Teknik lain untuk menentukan nilai daya beda adalah dengan menggunakan teknik korelasi phi. Anas Sudijono 2013: 391
menuliskan rumus tentang teknik korelasi phi sebagai berikut :
adalah angka indeks diskriminasi phi yang dianggap sebagai angka indeks diskriminasi butir. P
H
adalah proporsi orang yang menjawab benar kelompok atas. P
L
adalah proporsi orang yang menjawab benar kelompok bawah. p adalah proporsi seluruh peserta
tes yang menjawab betul dan q adalah 1 dikurangi p. Alternatif lain untuk melihat indeks daya beda adalah
dibedakan antara kelompok kecil kurang dari 100 dan kelompok besar 100 orang ke atas.
1 Untuk Kelompok kecil Seluruh kelompok testee dibagi dua sama besar, 50
kelompok atas dan 50 kelompok bawah.
37 2 Untuk Kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu
27 skor keatas sebagai kelompok atas Ja dan 27 skor terbawah sebagai kelompok bawah Jb.
Ja = Jumlah kelompok atas Jb = Jumlah kelompok bawah
Sumber : Suharsimi Arikunto 2013 : 227-232 Keterangan :
J = Jumlah peserta tes Ja = Banyaknya peserta kelompok atas
Jb = Banyaknya peserta kelompok bawah Ba= Banyaknya peserta kelompok atas yang menjawab soal itu
dengan benar Bb= Banyaknya peserta kelompok bawah yang menjawab soal itu
dengan benar Pa = Proporsi peserta kelompok atas yang menjawab benar ingat, P
sebagai indeks kesukaran Pb = Proporsi peserta kelompok bawah yang menjawab benar.
Suharsimi Arikunto 2013 : 232 memberikan patokan untuk menentukan daya beda yang dapat diterima sebagai berikut :
Besarnya angka Indeks daya beda
Klasifikasi Interpretasi
Kurang dari 0,2 0,21
– 0,4 0,41
– 0,7 0,71
– 1 Poor
Satisfactory Good
Excellent Jelek
Cukup Baik
Baik sekali
38 Indeks daya beda D : Negatif, semua nya tidak baik. Jadi
semua butir soal yang mempunyao nilai D negatif sebaiknya di buang saja.
Dilihat dari dua sumber di atas, dapat ditarik kesimpulan bahwa Ngalim Purwanto 2013 : 227-232 dijadikan acuan yang
dipakai oleh penulis
c Validitas
Tes hasil belajar yang baik selain reliabel juga harus valid. Sebuah tes dikatakan valid jika ia memang mengukur apa yang
seharusnya diukur. Suharsimi Arikunto 2013: 80 dalam bahasa yang hampir sama menyatakan bahwa validitas adalah ukuran
seberapa cermat suatu tes melakukan fungsi ukurnya.
Validitas, jika dikaitkan dengan bidang psikologi, dapat dijumpai dalam tiga konteks yaitu validitas penelitian, validitas soal
dan validitas alat ukur. Validitas penelitian merupakan derajat kesesuaian hasil penelitian dengan keadaan sebenarnya. Validitas
soal berkaitan dengan kesesuaian antara suatu soal dengan soal lain. Sedangkan validitas alat ukur merujuk pada kecermatan ukurnya
suatu tes Sumadi Suryabrata, 2004: 40.
Penelitian ini membahas tentang karakteristik butir, oleh karena itu jenis validitas yang menjadi pembahasan utama adalah
validitas tes. menurut Suharsimi Arikunto 2013: 82-84 validitas tes
39 dapat dibagi kedalam empat kelompok utama yaitu: a. validitas isi
content validity, b. validitas konstruk construct validity, c. validitas kriteria criterion related validity, dan d.validitas prediksi
predictive validity.
Validitas isi menunjuk pada sejauh mana isi perangkat soal tersebut mengukur apa yang seharusnya diukur. Suharsimi Arikunto
2013: 82, dalam kaitannya dengan kegiatan pembelajaran, validasi isi suatu tes
harus menjawab pertanyaan “sejauh mana item test itu
mencakup keseluruhan situasi yangingin diukur oleh tes tersebut.”.
Validitas konstruk merujuk pada sejauhmana suatu tes mengukur suatu konstruk teoretik atau trait yang hendak diukurnya
Ngalim Purwanto, 2010: 138 konstruk dalam pengertian ini adalah berkaitan dengan aspek-aspek psikologi seseorang khususnya aspek
kognitif, afektif dan psikomotor.
Validitas kriteria
merupakan validitas
yang disusun
berdasarkan kriteria yang telah ada sebelumnya. Kesahihan alat ukur, dalam validitas kriteria, dilihat dari sejauhmana hasil
pengukuran tersebut sama dengan hasil pengukuran alat lain yang dijadikan kriteria.
40
C. Hasil Penelitian yang Relevan