9
BAB II LANDASAN TEORI
Bab II ini akan menjelaskan empat hal yaitu kajian teori, penelitian yang relevan, kerangka berpikir dan pertanyaan penelitian.
A. Kajian Teori
Kajian teori ini berisi tentang teori-teori relevan yang berhubungan dengan tes hasil belajar, konstruksi tes hasil belajar, dan pengembangan tes hasil belajar.
1. Tes Hasil Belajar
a. Definisi Tes Hasil Belajar
Tes adalah sejumlah pertanyaan yang memiliki jawaban benar atau salah. Tes diartikan juga sebagai sejumlah pertanyaan yang membutuhan jawaban, atau
sejumlah pernyataan yang harus diberikan tanggapan dengan tujuan mengukur kemampuan seseorang atau mengungkapkan aspek tertentu dari orang yang
dikenai tes Mardapi, 2008: 67. Nurkancana dan Sumartana Suwandi, 2010: 39 menyatakan hal yang senada bahwa tes adalah suatu cara penilaian dalam bentuk
tugas-tugas yang harus dikerjakan siswa untuk mendapatkan data tentang nilai dan prestasi siswa yang dapat dibandingkan dengan standar yang ditetapkan.
Widoyoko 2015: 57 memaparkan bahwa tes merupakan bagian tersempit dari penilaian. Berdasarkan tiga pendapat ahli di atas dapat disimpulkan jika tes
merupakan salah satu cara yang dapat digunakan untuk mengukur tingkat kemampuan seseorang yang diperoleh melalui respon dari pertanyaan yang
diberikan pada orang yang dikenai tes.
Mudjijo dalam Kinanthi, 2006: 13 memaparkan bahwa tes hasil belajar adalah bentuk pertanyaan maupun pernyataan yang diberikan kepada individu
yang dites testee yang harus dijawab dan atau dipecahkan. Tes hasil belajar menurut Purwanto 2009: 64 sama halnya dengan tes penguasaan. Tes hasil
belajar berfungsi mengukur penguasaan siswa terhadap materi yang diajarkan guru atau materi yang telah dipelajari oleh siswa. Berdasarkan dua pendapat di
atas dapat disimpulkan bahwa tes hasil belajar merupakan pertanyaan atau pernyataan yang diberikan kepada siswa untuk mengukur penguasaan siswa
terhadap materi yang telah diajarkan. b.
Jenis Tes Nurgiyantoro dalam Suwandi, 2009: 40 memaparkan bahwa tes dapat
dibedakan menjadi berbagai macam bergantung pada dasar yang digunakan antara lain: berdasarkan individu yang dites, jawaban yang dikehendaki,
penyusun tes, dan bentuk tes. Pertama, tes menurut individu yang dites dibedakan menjadi dua yaitu tes
individual dan tes kelompok. Tes individual terjadi saat pelaksanaan kegiatan tes guru hanya menghadapi seorang siswa. Sebaliknya, dalam tes kelompok yang
dihadapi guru adalah sejumlah siswa misalnya siswa dalam satu kelas. Kedua, tes menurut jawaban yang dikehendaki dibedakan menjadi dua yaitu
tes perbuatan dan tes verbal. Tes perbuatan adalah tes yang menuntut respon siswa yang berupa tingkah laku yang melibatkan gerakan otot. Tes perbuatan
dimaksudkan untuk mengukur tujuan-tujuan yang berkaitan dengan aspek psikomotor. Tes verbal memiliki makna sebaliknya, yaitu tes yang menghendaki
jawaban siswa yang berupa tingkah laku verbal yang berbentuk bahasa yang berisi kata-kata dan kalimat. Tes verbal jika dilihat dari segi menjawabnya dibagi
menjadi dua yaitu tes lisan dan tes tertulis. Tes lisan menghendaki jawaban siswa diberikan secara lisan. Pertanyaan ataupun pernyataan yang diberikan tidak selalu
direspon dalam bentuk menulis jawaban namun dapat pula dalam bentuk lain seperti memberi tanda, mewarnai menggambar dan lain sebagainya. Tes tertulis
menuntut jawaban siswa diberikan secara tertulis. Tes tertulis merupakan tes yang baik soal maupun jawaban diberikan dalam bentuk tulisan.
Ketiga, tes menurut penyusun tes dibedakan menjadi dua yaitu tes buatan guru dan tes standar. Tes buatan guru merupakan tes yang dibuat oleh guru kelas itu
sendiri. Tes tersebut dimaksudkan untuk mengukur tingkat keberhasilan siswa mencapai tujuan pembelajaran yang dikelola oleh guru kelas yang bersangkutan.
Tes standar adalah kebalikan dari tes buatan guru. Tes standar adalah tes yang telah distandarkan. Tes standar dibedakan menjadi dua macam yaitu tes bakat
aptitude test dan tes prestasi achievement test. Perbedaan antara tes buatan guru dengan tes standar selain dari penjelasan di atas ialah terletak pada
kelayakan tes appropriateness test, kesahihan tes validity test, keajegan tes reliability test, dan ketertafsiran tes interpretability test.
Keempat, tes menurut bentuknya dibedakan menjadi dua yaitu tes subjektif dan tes objektif. Bentuk tes subjektif sering juga disebut sebagai tes bentuk esai
Inggris: essay. Tes esai adalah suatu bentuk pertanyaan yang menuntut jawaban siswa dalam bentuk uraian dengan mempergunakan bahasa sendiri. Tes bentuk
esai memberi kebebasan yang kepada siswa untuk menyusun dan mengemukakan
jawabannya sendiri dengan lingkup yang relatif dibatasi. Tes bentuk esai juga menuntut siswa untuk dapat menghubungkan fakta-fakta dan konsep-konsep,
mengorganisasikannya ke dalam koherensi yang logis dan kemudian menuangkannya dalam bentuk ekspresi tulis dengan bahasa sendiri. Tes objektif
memiliki pengertian yang kontras dengan tes bentuk esai. Tes objektif juga disebut dengan tes jawab singkat short answer test. Sesuai dengan namanya, tes
jawab singkat menuntut siswa hanya dengan memberikan jawaban singkat, bahkan hanya dengan memilih kode-kode tertentu yang mewakili alternatif-
alternatif jawaban yang telah disediakan. Jawaban terhadap tes objektif bersifat pasti, hanya ada satu kemungkinan jawaban yang benar. Jenis tes objektif yang
banyak digunakan antara lain jawaban benar salah true-false, pilihan ganda multiple choice, isian completion, dan penjodohan matching.
Keempat jenis tes yang telah dipaparkan di atas ada pula jenis tes sebagai pengukur keberhasilan. Tes pada dasarnya digunakan untuk mengukur tingkat
keberhasilan siswa dalam mencapai tujuan dalam kegiatan belajar mengajar. Nurgiyantoro dalam Suwandi, 2010: 44 menyebutkan jika tes pengukur
keberhasilan yang biasa digunakan terbagi menjadi empat yaitu: 1 tes kemampuan awal, 2 tes diagnostik, 3 tes formatif, dan 4 tes sumatif. Tes
kemampuan awal dimaksudkan sebagai tes yang dilakukan sebelum siswa mengalami proses belajar mengajar. Tes diagnostik dilakukan sebelum atau
selama berlangsungnya kegiatan belajar mengajar untuk menemukan bahan- bahan pelajaran yang masih menyulitkan siswa. Tes formatif dilakukan selama
kegiatan belajar mengajar masih berlangsung, pada setiap akhir suatu bahasan
untuk mengukur tingkat kemampuan siswa berkaitan dengan pokok bahasan yang baru saja diselesaikan. Tes sumatif dilakukan setelah semua kegiatan belajar
mengajar atau program yang direncanakan selesai yang lazimnya dilaksanakan pada akhir semester dengan sebutan Ulangan Umum atau Ulangan Akhir
Semester. Berdasarkan uraian di atas dapat disimpulkan bahwa jenis tes yang disusun
dalam penelitian ini jika ditinjau berdasarkan individu yang dites merupakan tes kelompok, ditinjau dari jawaban yang dikehendaki termasuk tes verbal dengan
cara menjawabnya termasuk tes tertulis. Sedangkan jika dilihat dari penyusun tes termasuk tes standar yaitu tes prestasi dengan bentuk tes objektif tipe pilihan
ganda. c.
Kelebihan dan Kekurangan Tes Tes yang biasa digunakan untuk mengukur hasil belajar siswa dibagi menjadi
dua yaitu tes objektif dan tes subjektif Widoyoko, 2015: 57. Tes objektif maupun tes subjektif memiliki beberapa kelebihan dan kekurangan. Widoyoko
2015: 60- 88 memaparkan kelebihan dan kekurangan tes objektif dan tes subjektif sebagai berikut:
1 Tes Objektif
a Kelebihan Tes Objektif
1 Lebih representatif mewakili isi dan luas bahan.
2 Lebih mudah dan cepat dalam memeriksa jawaban karena dapat
menggunakan kunci jawaban bahkan dapat menggunakan alat-alat kemajuan teknologi misalnya mesin scanner.
3 Pemeriksaannya dapat diserahkan pada orang lain.
4 Pemeriksaan dan penskoran tidak ada unsur subjektif yang
mempengaruhi, baik segi guru maupun responden. b
Kekurangan Tes Objektif 1
Membutuhkan persiapan yang lebih sulit daripada tes subjektif karena butir soal atau item tesnya banyak dan harus teliti untuk menghindari
kelemahan-kelemahan yang lain. 2
Butir-butir soal cenderung hanya mengungkapkan ingatan dan pengenalan kembali memahami, dan sulit untuk mengukur
kemampuan berpikir tinggi seperti menganalisa dan mencipta. 3
Banyak kesempatan bagi responden untuk melakukan spekulasi atau untung-untungan dalam menjawab soal tes.
4 Kerjasama antar responden pada waktu mengerjakan soal tes lebih
terbuka. 2
Tes Subjektif a
Kelebihan Tes Subjektif 1
Tes objektif dapat digunakan mengukur hasil belajar yang kompleks seperti menganalisa dan mencipta.
2 Meningkatkan motivasi peserta tes untuk belajar dibandingkan bentuk
tes objektif. 3
Mudah disiapkan dan disusun, sehingga tidak membutuhkan waktu yang lama bagi guru untuk mempersiapkannya.
4 Tidak banyak kesempatan untuk berspekulasi atau untung-untungan.
5 Mendorong responden untuk berani mengemukakan pendapat serta
menyusun dalam bentuk kalimat yang baik. 6
Memberi kesempatan kepada responden untuk mengutarakan maksudnya dengan gaya bahasa dan caranya sendiri.
b Kekurangan Tes Subjektif
1 Reliabilitas tes rendah karena skor yang dicapai tidak konsisten bila
tes yang sama diuji beberapa kali. 2
Membutuhkan waktu yang lebih lama untuk mengoreksi lembar jawaban dan tidak dapat diwakilkan kepada orang lain.
Berdasarkan penjelasan mengenai kelebihan dan kekurangan tes dapat disimpulkan bahwa tes yang biasa digunakan baik tes objektif maupun tes subjektif
sama-sama memiliki kelebihan dan kekurangnya masing-masing. Sub-pokok bahasan mengenai tes hasil belajar membahas tiga hal yaitu definisi
tes hasil belajar, jenis tes serta kelebihan dan kekurangan tes. Tes hasil belajar merupakan pertanyaan atau pernyataan yang diberikan kepada siswa untuk mengukur
penguasaan siswa terhadap materi yang telah diajarkan. Tes dapat dibedakan menjadi empat antara lain: berdasarkan individu yang dites, jawaban yang dikehendaki,
penyusun tes, dan bentuk tes. Ada pula jenis tes yang digunakan untuk mengukur keberhasilan antara lain tes kemampuan awal, tes diagnostik, tes formatif, dan tes
sumatif. Tes hasil belajar yang biasa digunakan berupa tes objektif dan tes subjektif. Tes objektif maupun tes subjektif sama-sama memiliki kelebihan dan kekurangan.
2. Konstruksi Tes Hasil Belajar
Konstruksi tes hasil belajar meliputi tiga pokok bahasan yaitu: validitas, reliabilitas, dan karakteristik butir soal. Penjabaran tiga pokok bahasan tersebut
sebagai berikut. a.
Validitas Masidjo 1995: 242 memaparkan pengertian validitas adalah taraf
kemampuan tes mengukur yang seharusnya diukur. Validitas menurut Standard dalam Mardapi, 2008: 16 merupakan dukungan bukti dan teori terhadap
penafsiran skor tes sesuai dengan tujuan penggunaan tes. Penafsiran skor tes tercantum pada tujuan penggunaan tes, bukan tes itu sendiri. Apabila skor tes
yang digunakan ditafsirkan lebih dari satu makna, setiap penafsiran atau pemaknaan itu harus divalidasi. Validitas menurut Noor 2012: 132 adalah suatu
indeks yang menunjukkan alat ukur yang digunakan benar-benar mengukur yang seharusnya diukur. Berdasarkan uraian di atas dapat disimpulkan bahwa validitas
adalah kemampuan tes menunjukkan ketepatannya dalam mengukur yang seharusnya diukur.
Validitas secara tradisional dapat digolongkan dalam tiga kategori besar, yaitu validitas isi content validity, validitas konstrak construct validity, dan validitas
yang berdasarkan kriteria criterion-related validity Azwar, 2014: 41. 1
Validitas Isi Content Validity Validitas isi merupakan validitas yang diestiminasi lewat pengujian terhadap
kelayakan atau relevansi isi tes melalui analisis rasional oleh panel yang berkompeten atau melalui expert judgement Azwar, 2014: 42. Hal senada juga
diungkapkan oleh Arikunto 2013: 81 bahwa validitas isi bagi sebuah instrumen menunjukkan kondisi instrumen berdasarkan isi materi pelajaran yang dievaluasi.
Secara lebih spesifik validitas isi dapat dibedakan menjadi dua tipe yaitu validitas muka face validity dan validitas logis logical validity.
a Validitas Muka Face validity
Validitas muka adalah bukti validitas yang walaupun penting namun paling rendah signifikansinya dikarenakan hanya didasarkan pada penilaian penampilan
tes dan kesesuaian konteks aitem dengan tujuan tes Azwar, 2014: 43. b
Validitas Logis Logical Validity Validitas logis atau validitas sampling adalah validitas yang menunjukkan
sejauhmana aitem tes merupakan representasi dari ciri-ciri atribut yang hendak diukur Azwar, 2014: 44. Validitas logis menurut Arikunto 2013: 80 adalah
kondisi sebuah instrumen yang memenuhi syarat valid berdasarkan hasil penalaran. Kondisi valid dipandang sudah memenuhi jika instrumen yang
bersangkutan telah dirancang dengan baik mengikuti teori dan ketentuan yang ada. Validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah
instrumen selesai disusun. 2
Validitas Konstrak Construct Validity AllenYen dalam Azwar, 2014: 45 menyatakan bahwa validitas konstrak
adalah validitas yang menunjukkan sejauhmana hasil tes mampu mengungkap sebuah trait atau suatu konstrak teoretik yang hendak diukur. Validitas konstrak
menurut Arikunto 2013: 81 adalah kondisi sebuah instrumen ditunjukkan berdasarkan aspek-aspek kejiwaan yang seharusnya dievaluasi.
3 Validitas Berdasarkan Kriteria
Validitas berdasarkan kriteria dibedakan menjadi dua macam yaitu validitas prediktif predictive validity dan validitas konkuren concurrent validity.
a Validitas Prediktif
Validitas prediktif atau predictive validity adalah kemampuan sebuah instrumen untuk meramalkan apa yang akan terjadi pada masa yang akan datang
Arikunto, 2013: 84. Yusuf 2014: 237 menyatakan hal yang yang senada mengenai validitas prediktif yaitu derajat kesesuaian antara hasil pengukuran dan
kinerja di masa depan dalam aspek yang diukur. Validitas prediktif didapat dengan mencari korelasi antara skor predictor dengan skor yang ada tentang
beberapa kriteria pada suatu waktu kemudian. b
Validitas Konkuren Validitas konkuren merupakan indikasi validitas yang layak ditegakkan bila
tes tidak dirancang untuk berfungsi sebagai prediktor dan merupakan validitas yang penting dalam situasi diagnostik Azwar, 2014: 49. Arikunto 2013: 83
memaparkan bahwa concurrent validity lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris ketika hasilnya sesuai
dengan pengalaman. Kata “sesuai” mengkaitkan dua hal yang dipasangkan. Hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang
telah lampau sehingga data pengalaman tersebut sekarang sudah ada ada sekarang. Membandingkan sebuah tes memerlukan suatu kriterium atau alat
banding. Oleh karena itu, hasil tes merupakan sesuatu yang dibandingkan.
Berdasarkan uraian mengenai validitas dapat disimpulkan bahwa validitas adalah kemampuan tes menunjukkan ketepatannya dalam mengukur yang
seharusnya diukur. Validitas secara garis besar dapat dibedakan menjadi tiga yaitu validitas isi content validity, validitas konstrak construct validity, dan
validitas yang berdasarkan kriteria criterion-related validity. Validitas isi dibedakan menjadi validitas tampang dan validitas logis. Validitas berdasarkan
kriteria dibedakan menjadi validitas prediktif dan validitas konkuren. b.
Reliabilitas Masidjo 1995: 208 menjelaskan pengertian reliabilitas adalah taraf kemampuan
tes dalam menunjukkan konsistensi hasil pengukurannya yang diperlihatkan dalam taraf ketepatan dan ketelitian hasil. Sudijono 2011: 95 menyatakan reliabilitas
sebagai keajegan atau kemantapan tes. Suatu tes yang baik harus memiliki reliabilitas atau bersifat reliabel. Suatu tes dinyatakan reliabel apabila hasil pengukuran dengan
menggunakan tes tersebut dilakukan berulang kali terhadap subjek yang sama senantiasa menunjukkan hasil yang tetap sama atau sifatnya ajeg dan stabil. Arikunto
2013: 100 menyatakan hal yang senada bahwa reliabilitas adalah ketetapan hasil tes. Instrumen yang baik adalah instrumen yang dapat dengan ajeg memberikan data yang
sesuai dengan kenyataan. Ajeg atau tetap tidak diartikan selalu sama, tetapi mengikuti perubahan secara ajeg. Berdasarkan pernyataan di atas dapat disimpulkan bahwa
reliabilitas terlihat dari hasil sebuah instrumen jika diujikan dalam kurun waktu yang berbeda menghasilkan hasil yang tidak jauh berbeda dengan hasil yang diperoleh
sebelumnya.
c. Karakteristik Butir Soal
Karakteristik butir soal meliputi tiga pokok bahasan yaitu daya pembeda, tingkat kesukaran, dan analisis pengecoh. Penjabaran ketiga pokok bahasan tersebut
dijabarkan sebagai berikut: 1
Daya Pembeda Daya pembeda adalah kemampuan item soal dalam membedakan kemampuan
siswa yang pandai dengan kemampuan siswa yang rendah Sulistyorini, 2011: 177. Masidjo 1995: 196 menyatakan bahwa daya pembeda adalah taraf jumlah jawaban
benar siswa yang tergolong kelompok atas pandai = upper group berbeda dari siswa yang tergolong kelompok bawah kurang pandai = lower group untuk suatu item.
Siswa yang tergolong kelompok atas KA adalah siswa yang mempunyai skor-skor tinggi, sedangkan siswa kelompok bawah KB adalah siswa yang mempunyai skor-
skor rendah. Sudjana 2009: 141 menyatakan hal yang senada dengan Sulistyorini dan
Masidjo bahwa daya pembeda merupakan kesanggupan soal dalam membedakan siswa yang tergolong mampu tinggi prestasinya dengan siswa yang tergolong
kurang lemah prestasinya. Soal memiliki daya pembeda yang baik apabila diberikan pada siswa yang mampu hasilnya menunjukkan prestasi yang tinggi, sedangkan
apabila diberikan pada siswa yang kurang mampu menunjukkan hasil yang rendah. Tes dikatakan tidak memiliki daya pembeda apabila tes tersebut jika diujikan pada
siswa yang mampu menunjukkan hasil yang rendah, namun jika dikerjakan oleh siswa yang kurang mampu menunjukkan hasil yang tinggi. Tes yang tidak memiliki
daya pembeda tidak akan menghasilkan gambaran hasil yang sesuai dengan kemampuan siswa yang sebenarnya.
Berdasarkan pendapat tiga ahli di atas dapat disimpulkan bahwa daya pembeda merupakan kemampuan tes dalam membedakan siswa kelompok atas siswa dengan
prestasi tinggi atau pandai dengan siswa kelompok bawah siswa dengan prestasi lemah atau kurang pandai. Tes yang memiliki daya pembeda akan menghasilkan
gambaran kemampuan siswa yang sebenarnya. Sebaliknya tes yang tidak memiliki daya pembeda tidak akan menghasilkan gambaran kemampuan siswa yang
sebenarnya. 2
Tingkat Kesukaran Tingkat kesukaran suatu item soal butir soal dapat diketahui dari banyaknya
siswa yang menjawab benar. Taraf kesukaran suatu item dinyatakan dengan suatu bilangan indeks yang disebut Indeks Kesukaran IK Masidjo, 1995: 189. Tingkat
kesulitan suatu item soal hendaknya memiliki keseimbangan yang proporsional antara soal dalam kategori mudah, sedang dan sukar Sulistyorini, 2009: 173.
Sudjana 2009: 135 memaparkan bahwa tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawab soal, bukan dari sudut guru
sebagai pembuat soal. Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan kategori soal yang termasuk mudah,
sedang, dan sukar. Perbandingan proporsi jumlah soal untuk tiga kategori tersebut didasarkan atas kurva normal Sudjana, 2009: 136. Sebagian besar soal berada pada
kategori sedang, sebagian lagi berada pada kategori mudah dan sukar dengan proporsi yang seimbang. Perbandingan antara soal yang mudah-sedang-sukar dapat dibuat 3-4-
3. 30 soal dengan kategori mudah, 40 soal dengan kategori sedang, dan 30 soal dengan kategori sukar. Perbandingan juga dapat dibuat 25-50-25, 25 soal dengan
kategori mudah, 50 soal dengan kategori sedang, dan 25 soal dengan kategori sukar. Soal dengan kategori sedang menempati proporsi lebih banyak dari soal
kategori mudah dan soal kategori sukar. Berdasarkan pendapat tiga ahli di atas dapat disimpulkan bahwa tingkat
kesukaran soal dapat diketahui dari banyaknya siswa yang menjawab soal dengan benar. Tingkat kesukaran soal dipandang dari sudut kemampuan siswa dalam
menjawab soal, bukan dari sudut guru sebagai pembuat soal. Proporsi soal dengan kategori mudah, sedang, dan sukar juga turut menentukan analisis tingkat kesukaran
soal. 3
Analisis Pengecoh Sudijono 2011: 409-411 memaparkan bahwa tes objektif bentuk pilihan ganda
setiap item soal butir soal dilengkapi dengan beberapa kemungkinan jawaban atau yang lebih dikenal dengan option atau alternatif. Option atau alternatif jumlahnya
berkisar tiga sampai lima buah. Kemungkinan-kemungkinan yang terpasang pada setiap item soal salah satu di antaranya merupakan jawaban benar sesuai dengan
kunci jawaban sedangkan sisanya merupakan jawaban salah. Jawaban-jawaban salah itulah yang disebut dengan pengecoh atau distraktor Inggris: distractor.
Tujuan dipasangnya pengecoh pada setiap butir soal adalah agar dari sekian banyak siswa yang mengikuti tes ada yang tertarik atau terangsang untuk
memilihnya, sebab mereka menyangka pengecoh yang dipilihnya merupakan jawaban benar. Pengecoh dinyatakan dapat menjalankan fungsinya dengan baik
apabila memiliki daya tarik atau daya rangsang sedemikian rupa. Daya rangsang atau daya tarik tersebut membuat siswa khususnya yang termasuk siswa kategori
kelompok bawah atau kurang pandai merasa bimbang dan ragu-ragu sehingga pada akhirnya mereka terkecoh untuk memilih pengecoh sebagai jawaban benar. Pengecoh
dinyatakan menjalankan fungsinya dengan baik apabila pengecoh tersebut sekurang- kurangnya dipilih oleh 5 dari seluruh peserta tes. Makin banyak siswa yang
terkecoh dapat dinyatakan bahwa pengecoh tersebut menjalankan fungsinya dengan baik. Semakin banyak siswa yang menjawab benar sesuai kunci jawaban, maka
pengecoh tidak dapat menjalankan fungsinya dengan baik atau pengecoh “tidak laku”.
Daryanto 2007: 193 menyatakan bahwa pengecoh dapat diperlakukan dengan tiga cara yaitu: “diterima”, “ditolak”, dan “ditulis kembali”. Pengecoh yang
“diterima” telah menjalankan fungsinya dengan baik yaitu sekurang-kurangnya 5 dari seluruh peserta tes. Pengecoh yang “ditolak” tidak menjalankan fungsinya
dengan baik atau seluruh peserta tes tidak memilih pengecoh tersebut. Pengecoh yang “ditulis kembali” kurang menjalankan fungsinya dengan baik. Pengecoh yang “ditulis
kembali biasanya memiliki kekurangan yang terletak pada rumusan kalimat yang kurang efektif sehingga memerlukan perubahan yang seperlunya.
Berdasarkan penjelasan pendapat ahli di atas dapat disimpulkan bahwa pengecoh digunakan pada tes objektif bentuk pilihan ganda. Pengecoh yang baik dipilih oleh
sekurang-kurangnya 5 dari seluruh peserta tes. Pengecoh dapat diperlakukan dengan tiga cara yaitu: “diterima”, “ditolak”, dan “ditulis kembali”.
Sub-pokok bahasan konstruksi tes hasil belajar dibagi menjadi tiga pokok bahasan yaitu validitas, reliabilitas, dan karakteristik butir soal yang terdiri dari daya
pembeda, tingkat kesukaran, dan analisis pengecoh. Validitas adalah kemampuan tes menunjukkan ketepatannya dalam mengukur yang seharusnya diukur. Validitas dapat
digolongkan dalam tiga kategori besar, yaitu validitas isi, validitas konstrak, dan validitas yang berdasarkan kriteria. Apabila validitas menunjukkan ketepatan tes
dalam mengukur yang seharusnya diukur, maka reliabilitas menunjukkan keajegan suatu tes dalam mengukur yang seharusnya diukur. Keajegan yang dimaksud
bukanlah hasil yang sama yang akan diperoleh setiap tes diujikan namun mengikuti perubahan secara ajeg. Tes ketika diujikan akan mengukur kemampuan siswa yang
pandai dan siswa yang kurang pandai yang juga disebut daya pembeda. Tes yang diujikan harus memiliki tingkat kesukaran yang baik yaitu soal pada kategori sedang
memiliki proporsi lebih banyak dari soal pada kategori mudan dan sukar. Soal kategori mudah dan sukar memiliki proporsi yang seimbang. Soal objektif bentuk
pilihan ganda perlu dianalisis keefektifan pengecohnya. Pengecoh yang baik akan dipilih oleh sekurang-kurangnya 5 peserta tes.
3. Pengembangan Tes Hasil Belajar
Mardapi dalam Widoyoko, 2015: 90-97 memaparkan ada sembilan langkah yang perlu ditempuh dalam mengembangkan tes hasil belajar. Kesembilan langkah
tersebut akan dijabarkan sebagai berikut: 1
Menyusun Spesifikasi Tes Menyusun spesifikasi tes merupakan langkah awal dalam pengembangan tes.
Spesifikasi tes berisi uraian yang menunjukkan keseluruhan karakteristik yang harus
dimiliki suatu tes. Penyusunan spesifikasi tes mencakup kegiatan a menentukan tujuan tes, b menyusun kisi-kisi tes, c memilih bentuk tes, dan d menentukan
panjang tes. a.
Menentukan Tujuan Tes Tujuan tes yang banyak digunakan oleh lembaga pendidikan antara lain: tes
kemampuan awal atau tes penempatan, tes dignostik, tes formatif, dan tes sumatif. b.
Menyusun Kisi-kisi Tes Kisi-kisi merupakan matriks yang berisi spesifikasi soal yang akan dibuat.
Matriks kisi-kisi soal terdiri dari dua jalur yaitu kolom dan baris. Kolom menyatakan kompetensi dasar KD dan indikator, pokok dan sub-pokok bahasan, serta uraian
materi. Baris menyatakan tujuan yang akan diukur dalam tes. Ada empat langkah dalam mengembangkan kisi-kisi tes, yaitu: 1 menulis
standar kompetensi SK dan kompetensi dasar KD, 2 menentukan indikator, 3 membuat daftar pokok bahasan dan sub-pokok bahasan yang akan diujikan, 4
menentukan jumlah butir soal tiap pokok bahasan dan sub-pokok bahasan. Kisi-kisi tes dapat disusun secara terpisah antara tes objektif dan tes subjektif tes
esai atau uraian. Tes objektif dan tes subjektif juga dapat dibuat dalam satu kisi-kisi soal. Sumber utama standar kompetensi SK, kompetensi dasar KD, indikator,
pokok bahasan, dan sub-pokok bahasan adalah silabus mata pelajaran. Jumlah soal yang digunakan bergantung pada waktu yang tersedia untuk tes dan materi yang
diujikan.
c. Memilih Bentuk Tes
Bentuk tes dapat ditentukan berdasarkan tujuan tes, jumlah peserta tes, waktu yang tersedia untuk memeriksa jawaban tes, cakupan materi, dan karakteristik mata
pelajaran yang diujikan. Bentuk pilihan objektif pilihan ganda dan bentuk tes benar salah tepat digunakan bila jumlah peserta banyak, waktu koreksi singkat, dan
cakupan materi yang diujikan banyak. d.
Menentukan Panjang Tes Durasi Pengerjaan Tes Panjang tes ditentukan berdasarkan cakupan materi ujian dan kelelahan peserta
tes. Tes tertulis pada umumnya menggunakan waktu 90 sampai 150 menit, sedangkan tes praktik membutuhkan waktu lebih dari itu. Tes pilihan ganda membutuhkan
waktu pengerjaan 2 sampai 3 menit untuk setiap butir soal. Hal ini juga dipengaruhi oleh tingkat kesulitan soal.
2 Menulis Soal Tes
Penulisan soal merupakan penjabaran indikator menjadi pernyataan-pernyataan yang karakteristiknya sesuai dengan perincian pada kisi-kisi yang telah dibuat.
Kualitas tes secara keseluruhan dipengaruhi oleh tingkat kebaikan masing-masing butir soal. Pertanyaan perlu dikembangkan dan dibuat dengan jelas dan simple. Soal
yang tidak jelas dan bertele-tele akan menyebabkan interpretasi tunggal dan membingungkan. Setiap pertanyaan perlu disusun sedemikian rupa sehingga jelas
yang ditanyakan dan jawaban yang diharapkan. 3
Menelaah Soal Tes Soal yang telah dibuat seringkali memiliki kesalahan dan kekurangan yang luput
meski telah dipersiapkan dengan baik. Kesalahan dan kekurangan tersebut ditelaah
oleh orang lain bukan si pembuat soal untuk menghindari bias. Telaah soal diharapkan menghasilkan kualitas soal yang lebih baik.
4 Melakukan Uji Coba Tes
Uji coba soal perlu dilakukan untuk memperbaiki kualitas soal sebelum soal digunakan. Uji coba dapat digunakan sebagai sarana memperoleh data empirik
mengenai tingkat kebaikan soal yang telah disusun. Hasil uji coba akan diperoleh data yang digunakan sebagai dasar analisis tentang validitas, reliabilitas, tingkat
kesukaran, daya pembeda, efektifitas pengecoh dan lain-lain. Berdasarkan hasil uji coba tersebut apabila soal yang disusun belum memenuhi kualitas yang diharapkan
maka akan dilakukan perbaikan atau pembenahan butir soal. 5
Menganalisis Butir Soal Tes Uji coba yang telah dilakukan dapat diperoleh beberapa informasi penting tentang
kualitas soal yang telah disusun. Hasil uji coba perlu kiranya dilakukan analisis butir soal yang telah disusun. Analisis dari hasil coba akan diketahui antara lain: tingkat
kesukaran, daya pembeda, dan juga efektifitas pengecoh. 6
Memperbaiki Tes Memperbaiki tes dilakukan pada butir soal yang belum mencapai kualitas yang
diharapkan. Ada kemungkinan beberapa soal sudah baik sehingga tidak perlu direvisi, beberapa soal perlu direvisi, dan beberapa soal mungkin harus dibuang karena tidak
memenuhi standar kualitas yang diharapkan. 7
Merakit Tes Butir soal yang telah dianalisis dan diperbaiki selanjutnya dirakit menjadi satu
kesatuan tes. Keseluruhan butir soal perlu disusun secara hati-hati menjadi kesatuan
soal tes yang terpadu. Perakitan tes perlu memperhatikan hal-hal yang dapat mempengaruhi validitas soal seperti nomor urut soal, pengelompokkan bentuk soal,
lay out dan sebagainya perlu diperhatikan. Hal ini sangat penting karena jika disusun sembarangan dapat menyebabkan soal tersebut menjadi tidak baik.
8 Melaksanakan Tes
Tes yang telah dirakit menjadi satu kesatuan diberikan kepada peserta tes untuk diselesaikan. Pelaksanaan tes dilakukan sesuai dengan waktu yang telah ditentukan.
Tes yang dilaksanakan perlu dipantau oleh pengawas agar tes benar-benar dikerjakan oleh peserta tes dengan jujur dan ketentuan yang telah digariskan. Pengawasan
dilakukan harus tidak mengganggu pelaksanaan tes. Peserta tes tidak boleh terganggu oleh kehadiran pengawas karena berakibat ketidak akuratan hasil tes.
9 Menafsirkan Hasil Tes
Hasil tes menghasilkan data kuantitatif berupa skor yang ditafsirkan menjadi nilai. Tinggi rendahnya nilai dikaitkan dengan acuan penilaian. Acuan penilaian yang
sering digunakan dalam bidang pendidikan ada dua macam yaitu acuan norma dan acuan kriteria. Nilai merupakan alat yang sangat berguna untuk memotivasi siswa
dalam belajar serta guru dalam mengajar lebih baik. Mengembangkan tes hasil belajar memerlukan langkah-langkah pengembangan
yang benar. Ada sembilan langkah yang perlu ditempuh dalam mengembangkan tes hasil belajar yaitu: 1 menyusun spesifikasi tes, 2 menulis soal tes, 3 menelaah
soal tes, 4 melakukan uji coba tes, 5 menganalisis butir soal tes, 6 memperbaiki tes, 7 merakit tes, 8 melaksanakan tes, dan 9 menafsirkan hasil tes.
4. Taksonomi Bloom yang Direvisi
Taksonomi adalah sebuah kerangka berpikir khusus AndersonKrathwohl, 2010: 6. Taksonomi dalam dunia pendidikan mengklasifikasi Tujuan Instruksional
Khusus TIK atau lebih dikenal indikator. Sebuah rumusan TIK berisikan satu kata kerja dan satu kata benda. Kata kerja mendeskripsikan proses kognitif yang
diharapkan sedangkan kata benda mendeskripsikan pengetahuan yang diharapkan untuk dikuasai siswa. Contohnya: Siswa dapat membedakan proses kognitif
bilangan genap dan bilangan ganjil pengetahuan AndersonKrathwohl, 2010: 6. Taksonomi Bloom memiliki satu dimensi, sedangkan taksonomi Bloom yang
direvisi memiliki dua dimensi. Dua dimensi yang dimaksud adalah proses kognitif dan pengetahuan. Interelasi antara kedua dimensi disebut dengan Tabel Taksonomi.
Dimensi proses kognitif memiliki enam kategori yaitu: Mengingat, Memahami, Mengaplikasikan, Menganalisis, Mengevaluasi, dan Mencipta. Kontinum yang
mendasari dimensi proses kognitif dianggap sebagai tingkatan kognisi yang kompleks AndersonKrathwohl, 2010: 6. Dimensi pengetahuan berisi empat kategori yaitu:
Faktual, Konseptual, Prosedural, dan Metakognitif. Kategori-kategori ini dianggap merupakan kontinum dari yang konkret faktual dampai dengan abstrak
metakognitif. Kategori-kategori dalam proses kognitif dan pengetahuan akan dijabarkan sebagai
berikut: a.
Mengingat Proses mengingat adalah mengambil pengetahuan yang dibutuhkan dari memori
jangka panjang AndersonKrathwohl, 2010: 99. Proses mengingat akan cocok
dengan tujuan pembelajaran yang menghendaki kemampuan untuk meretensi atau menyimpan materi yang pelajaran sama seperti materi yang diajarkan. Pengetahuan
yang dibutuhkan dalam proses mengingat adalah pengetahuan Faktual, Konseptual, Prosedural, atau Metakognitif, atau kombinasi dari beberapa pengetahuan tersebut.
Proses-proses kognitif dalam kategori mengingat meliputi mengenali dan mengingat kembali AndersonKrathwohl, 2010: 103-104.
b. Memahami
Proses memahami adalah mengkonstruksi makna dari pesan-pesan pembelajaran baik yang bersifat lisan, tulisan, maupun grafis yang disampaikan melalui pengajaran,
buku, atau layar komputer AndersonKrathwohl, 2010: 105. Pengetahuan yang mendasari proses kognitif memahami ialah pengetahuan Konseptual. Proses-proses
kognitif dalam kategori memahami meliputi menafsirkan, mencontohkan, mengklasifikasikan, merangkum, menyimpulkan, membandingkan, dan menjelaskan
AndersonKrathwohl, 2010: 106. c.
Mengaplikasikan Proses kognitif mengaplikasikan melibatkan penggunaan prosedur tertentu untuk
mengerjakan soal latihan atau menyelesaikan masalah. Pengetahuan yang berkaitan erat dengan pengetahuan Prosedural. Kategori mengaplikasikan terdiri dari dua
proses kognitif yaitu mengeksekusi berkaitan dengan menyelesaikan soal latihan dan
mengimplementasikan berkaitan
dengan menyelesaikan
masalah AndersonKrathwohl, 2010: 116.
d. Menganalisis
Menganalisis berkaitan dengan proses memecah-mecah materi menjadi bagian- bagian kecil serta mennetukan hubungan antar bagian dan antara setiap bagian dan
struktur keseluruhannya. Kategori proses menganalisis meliputi proses kognitif membedakan, mengorganisasi, dan mengatribusikan AndersonKrathwohl, 2010:
120. e.
Mengevaluasi Mengevaluasi berkaitan dengan membuat keputusan berdasarkan kriteria dan
standar. Kategori mengevaluasi mencakup proses kognitif memeriksa keputusan- keputusan yang diambil berdasarkan kriteria internal dan mengkritik keputusan-
keputusan yang diambil berdasarkan kriteria eksternal AndersonKrathwohl, 2010: 125.
f. Mencipta
Mencipta berkaitan dengan proses menyusun elemen-elemen jadi sebuah keseluruhan yang koheren atau fungsional. Proses kognitif yang terlibat dalam
mencipta sejalan dengan pengalaman-pengalaman belajar sebelumnya. Mencipta bukanlah ekspresi kreatif yang bebas sama sekali dan tak dihambat oleh tuntutan-
tuntutan tugas atau situasi belajar. Berdasarkan penjelasan di atas, dapat disimpulkan bahwa taksonomi adalah
sebuah kerangka berpikir khusus. Taksonomi Bloom yang direvisi memiliki dua dimensi yaitu proses kognitif dan pengetahuan. Interelasi antara kedua dimensi
disebut dengan Tabel Taksonomi. Dimensi proses kognitif memiliki enam kategori
yaitu: Mengingat, Memahami, Mengaplikasikan, Menganalisis, Mengevaluasi, dan Mencipta.
5. Program TAP Test Analysis Program
TAP Test Analysis Program merupakan salah satu software yang dapat digunakan untuk menganalisis soal tes hasil belajar. Program TAP digunakan untuk
menganalisis Lewis, dalam Wirastri, 2014: 43: a.
Total nilai yang didapat siswa untuk mengetahui rata-rata mean, maksimum nilai yang didapatkan, minimum nilai yang didapatkan, dan standar devisiasi.
b. Tingkat kesukaran item untuk mengetahui tingkat kesukaran soal.
c. Daya pembeda soal untuk membedakan siswa pintar dan siswa kurang pintar
dilihat dari skor yang didapatkan siswa. d.
Tingkat validitas soal yang digunakan untuk melihat valid atau tidaknya soal. e.
Kualitas pengecoh pada pilihan jawaban soal untuk mengetahui berfungsi atau tidaknya pengecoh.
Berdasarkan penjelasan di atas dapat disimpulkan bahwa program TAP dapat menganalisis validitas, reliabilitas, daya pembeda, tingkat kesukaran, dan kualitas
pengecoh.
B. Penelitian yang Relevan