24
a Validitas Isi
Content
Validitas isi menunjukkan sejauhmana item-item dalam tes mencakup keseluruhan kawasan isi yang hendak diukur oleh tes tersebut. Selain harus
komprehensif, tetapi isinya juga harus relevan dan tidak keluar dari batasan tujuan pengukuran. Dalam validitas isi terdapat validitas format penulisan
face validity
dimana analisis berdasarkan format penampilan tes dan validitas logis
logical validity
dimana analisis berdasarkan representatasi atribut yang hendak diukur. Pengujian validitas isi tidak menggunakan statistika melainkan menggunakan
analisis rasional.
b Validitas Konstruk
Construct
Validitas konstruk adalah validitas yang menunjukkan sejauh mana tes mengukur trait atau konstruk teoritis yang hendak diukurnya. Untuk pengujian
konstruk diperlukan analisis statistika yang komplek seperti prosedur analisis faktor. Salah satu prosedur yang sederhana adalah melalui pendekatan
multi-trait- multi-method.
c Validitas Kriteria
Criterium
Dalam pengujian berdasarkan kriteria, bukti validitas suatu tes diperlihatkan oleh adanya hubungan skor pada tes yang bersangkutan dengan skor
suatu kriteria. Apabila suatu tes disusun untuk memprediksi performansi dimasa yang akan datang maka lebih ditekankan pada validitas prediktif. Validitas
prediktif dapat dilihat dari analisis korelasional antara skor tes dengan skor performansi yang hendak diukur. Dalam kasus lain adakalanya kriteria untuk
pengulangan validitas telah tersedia. Dengan demikian tentu saja komputansi korelasi antara tes dan kriteria dapat langsung dilakukan. Komputasi koefisien
korelasi akan menghasilkan koefisien validitas konkuren. Selain telaah secara kualitatif, untuk mengetahui kualitas butir soal juga
dilakukan telaah secara kuantitatif.
b. Analisis Butir Soal Secara Kuantitatif
Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir soal yang bersangkutan. Salah satu
25 pendekatan pada analisis butir soal secara kuantitatif adalah pendekatan secara
klasik. Pada pendekatan ini proses penelaahan melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan. Kelebihan
analisis butir soal secara klasik adalah murah, dapat dilaksanakan sehari-hari dengan cepat, sederhana, familier dan dapat mengunakan data dari beberapa
peserta. Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah telaah dari segi reliabilitas, daya pembeda, tingkat kesukaran soal dan
penyebaran pilihan jawaban.
1 Reliabilitas
Reliabilitas merupakan penerjemahan dari kata
reliability
yang mempunyai asal kata
rely
dan
ability
. Pengukuran yang mempunyai reliabilitas tinggi disebut sebagai pengukuran yang reliabel. Walaupun reliabilitas
mempunyai berbagai nama seperti keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi dan sebagainya namun ide pokok yang terkandung dalam
konsep reliabilitas adalah sejauhmana hasil suatu pengukuran dapat dipercaya Azwar, 1997: 4.
Konsep keajegan atau kestabilan pada reliabilitas kurang tepat jika diartikan sebagai “sama”. Keajegan atau kestabilan tidak selalu harus sama, tetapi
mengikuti perubahan secara ajeg. Jika keadaan si A mula-mula berada dibawah si B , maka jika diadakan pengukuran ulang, si A juga berada dibawah si B. itulah
yang dikatakan ajeg atau tetap yaitu sama dalam kedudukan siswa diantara anggota kelompok yang lain Arikunto, 2008 : 86.
Tinggi rendahnya reliabilitas, secara empirik ditunjukkan oleh suatu angka yang disebut koefisien reliabilitas. Tinggi rendahnya reliabilitas dicerminkan oleh
tinggi rendahnya korelasi antara dua distribusi skor dari dua alat ukur yang paralel yang dikenakan pada kelompok individu yang sama. Analisis reliabilitas dapat
menggunakan pendekatan Tes-Ulang
test-retest
, pendekatan Tes Sejajar a
lternate-forms
dan pendekatan Konsistensi Internal
internal consistency
.
a Pendekatan Tes Ulang
Pendekatan ini menunjukkan konsistensi pengukuran dari waktu ke waktu dan menghasilkan koefisien reliabilitas. Prinsip estimasinya adalah dengan
26 mengenakan instrument pengukur dua kali dengan tenggang waktu tertentu
terhadap kelompok subjek yang sama. Kelemahan pendekatan ini adalah kurang praktisnya pengenaan tes dua kali dan besarnya kemungkinan terjadi efek bawaan
dari pengenaan tes ke pengenaan yang kedua.
b Pendekatan Tes Sejajar
Pendekatan ini hanya dapat dilakukan apabila terdapat dua bentuk instrument pengukur yang diasumsikan parallel. Salah satu indikator terpenuhinya
asumsi parallel adalah setaranya korelasi antara skor kedua instrument tersebut dengan skor suatu ukuran lain. Kedua instrument dikenakan pada kelompok
subjek. Kelemahan pendekatan ini terletak pada sulitnya menyusun dua alat ukur yang memenuhi syarat paralel.
c Pendekatan Konsistensi Internal
Estimasi reliabilitas dengan pendekatan ini didasarkan pada data dari sekali pengenaan satu bentuk alat ukur pada sekelompok subjek. Komputasi
koefisien reliabilitasnya dilakukan setelah keseluruhan instrument yang telah dikenakan pada subjek dibelah menjadi beberapa bagian. Diantara teknik-teknik
komputasi reliabilitas konsistensi internal adalah penggunaan Formula Spearmen- Brown, Formula Rulon, Formula Alpha, Formula Kuder-Richardson, Formula
kristof dan sebagainya Arikunto, 2008 : 90.
2 Daya Pembeda
Daya pembeda soal adalah kemampuan suatu butir soal untuk membedakan antara siswa yang telah menguasai materi dan siswa yang belum
menguasai materi yang ditanyakan. Manfaat daya pembeda butir soal antara lain: a Untuk meningkatkan kualitas butir soal berdasarkan data empiriknya.
Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal baik, direvisi atau ditolak.
b Untuk mengetahui seberapa jauh setiap butir soal dapat membedakan kemampuan siswa yaitu siswa yang telah memahami atau belum memahami
materi yang diajarkan oleh guru. Apabila suatu butir soal tidak dapat membedakan kedua kemampuan siswa maka terdapat kemungkinan seperti
berikut:
27 1. Kunci jawaban butir soal tidak tepat.
2. Butir soal mempunyai 2 atau lebih jawaban yang benar 3. Kompetensi yang diukur tidak jelas
4. Pengecoh tidak berfungsi 5. Materi yang ditanyakan terlalu sulit, sehingga banyak siswa yang
menebak. 6. Sebagian siswa yang memahami materi yang ditanyakan berfikir ada
yang salah informasi dalam butir soalnya. Angka yang menunjukkan besarnya daya pembeda disebut indeks daya
pembeda DP. Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang bersangkutan membedakan siswa yang sudah memahami dan belum
memahami materi. Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu soal maka semakin baik soal tersebut.
Jika daya pembeda negatif berarti lebih banyak kelompok siswa yang belum memahami materi menjawab benar soal tersebut Depdiknas, 2009: 11.
3 Tingkat Kesukaran
Tingkat kesukaran soal adalah peluang untuk menjawab benar soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks.
Indeks kesukaran umumnya dinyatakan dalam bentuk proporsi yang besarnya antar 0,00 – 1,00. Semakin besar indeks kesukaran berarti semakin mudah soal
tersebut dan sebaliknya. Fungsi tingkat kesukaran butir biasanya dikaitkan dengan tujuan tes. Misalnya untuk ujian akhir semester digunakan soal dengan tingkat
kesukaran sedang, untuk keperluan seleksi digunakan soal dengan tingkat kesukaran tinggi, dan untukn keperluan diagnostic digunakan soal dengan tingkat
kesukaran mudah Depdiknas, 2009: 9. Soal yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu
sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha pemecahannya. Sebaliknya soal yang terlalu sukar akan menyebabkan
siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena diluar jangkauannya Arikunto , 2008: 207.
28
4 Efektivitas Kunci dan Efektivitas Pengecoh
Pada soal pilihan ganda terdapat option atau pilihan jawaban yang terdiri dari kunci jawaban dan pengecoh. Kunci jawaban dan pengecoh pada suatu soal
perlu diketahui berfungsi tidaknya kunci jawaban atau pengecoh tersebut. Kunci jawaban dikatakan berfungsi efektif apabila:
a paling tidak dipilih oleh 25 peserta, b lebih banyak dipilih oleh siswa yang sudah memahami materi.
Sedangkan pengecoh dapat dikatakan berfungsi apabila pengecoh: a paling tidak dipilih oleh 5 peserta,
b lebih banyak dipilih oleh kelompok siswa yang belum memahami materi Depdiknas, 2009: 14.
6. Tingkat Pencapaian Kompetensi Dasar dan Standar Kompetensi Kelulusan