Kajian Teori LANDASAN TEORI

9

BAB II LANDASAN TEORI

Bab II ini akan menjelaskan empat hal yaitu kajian teori, penelitian yang relevan, kerangka berpikir dan pertanyaan penelitian.

A. Kajian Teori

Kajian teori ini berisi tentang teori-teori relevan yang berhubungan dengan tes hasil belajar, konstruksi tes hasil belajar, dan pengembangan tes hasil belajar. 1. Tes Hasil Belajar a. Definisi Tes Hasil Belajar Tes adalah sejumlah pertanyaan yang memiliki jawaban benar atau salah. Tes diartikan juga sebagai sejumlah pertanyaan yang membutuhan jawaban, atau sejumlah pernyataan yang harus diberikan tanggapan dengan tujuan mengukur kemampuan seseorang atau mengungkapkan aspek tertentu dari orang yang dikenai tes Mardapi, 2008: 67. Nurkancana dan Sumartana Suwandi, 2010: 39 menyatakan hal yang senada bahwa tes adalah suatu cara penilaian dalam bentuk tugas-tugas yang harus dikerjakan siswa untuk mendapatkan data tentang nilai dan prestasi siswa yang dapat dibandingkan dengan standar yang ditetapkan. Widoyoko 2015: 57 memaparkan bahwa tes merupakan bagian tersempit dari penilaian. Berdasarkan tiga pendapat ahli di atas dapat disimpulkan jika tes merupakan salah satu cara yang dapat digunakan untuk mengukur tingkat kemampuan seseorang yang diperoleh melalui respon dari pertanyaan yang diberikan pada orang yang dikenai tes. Mudjijo dalam Kinanthi, 2006: 13 memaparkan bahwa tes hasil belajar adalah bentuk pertanyaan maupun pernyataan yang diberikan kepada individu yang dites testee yang harus dijawab dan atau dipecahkan. Tes hasil belajar menurut Purwanto 2009: 64 sama halnya dengan tes penguasaan. Tes hasil belajar berfungsi mengukur penguasaan siswa terhadap materi yang diajarkan guru atau materi yang telah dipelajari oleh siswa. Berdasarkan dua pendapat di atas dapat disimpulkan bahwa tes hasil belajar merupakan pertanyaan atau pernyataan yang diberikan kepada siswa untuk mengukur penguasaan siswa terhadap materi yang telah diajarkan. b. Jenis Tes Nurgiyantoro dalam Suwandi, 2009: 40 memaparkan bahwa tes dapat dibedakan menjadi berbagai macam bergantung pada dasar yang digunakan antara lain: berdasarkan individu yang dites, jawaban yang dikehendaki, penyusun tes, dan bentuk tes. Pertama, tes menurut individu yang dites dibedakan menjadi dua yaitu tes individual dan tes kelompok. Tes individual terjadi saat pelaksanaan kegiatan tes guru hanya menghadapi seorang siswa. Sebaliknya, dalam tes kelompok yang dihadapi guru adalah sejumlah siswa misalnya siswa dalam satu kelas. Kedua, tes menurut jawaban yang dikehendaki dibedakan menjadi dua yaitu tes perbuatan dan tes verbal. Tes perbuatan adalah tes yang menuntut respon siswa yang berupa tingkah laku yang melibatkan gerakan otot. Tes perbuatan dimaksudkan untuk mengukur tujuan-tujuan yang berkaitan dengan aspek psikomotor. Tes verbal memiliki makna sebaliknya, yaitu tes yang menghendaki jawaban siswa yang berupa tingkah laku verbal yang berbentuk bahasa yang berisi kata-kata dan kalimat. Tes verbal jika dilihat dari segi menjawabnya dibagi menjadi dua yaitu tes lisan dan tes tertulis. Tes lisan menghendaki jawaban siswa diberikan secara lisan. Pertanyaan ataupun pernyataan yang diberikan tidak selalu direspon dalam bentuk menulis jawaban namun dapat pula dalam bentuk lain seperti memberi tanda, mewarnai menggambar dan lain sebagainya. Tes tertulis menuntut jawaban siswa diberikan secara tertulis. Tes tertulis merupakan tes yang baik soal maupun jawaban diberikan dalam bentuk tulisan. Ketiga, tes menurut penyusun tes dibedakan menjadi dua yaitu tes buatan guru dan tes standar. Tes buatan guru merupakan tes yang dibuat oleh guru kelas itu sendiri. Tes tersebut dimaksudkan untuk mengukur tingkat keberhasilan siswa mencapai tujuan pembelajaran yang dikelola oleh guru kelas yang bersangkutan. Tes standar adalah kebalikan dari tes buatan guru. Tes standar adalah tes yang telah distandarkan. Tes standar dibedakan menjadi dua macam yaitu tes bakat aptitude test dan tes prestasi achievement test. Perbedaan antara tes buatan guru dengan tes standar selain dari penjelasan di atas ialah terletak pada kelayakan tes appropriateness test, kesahihan tes validity test, keajegan tes reliability test, dan ketertafsiran tes interpretability test. Keempat, tes menurut bentuknya dibedakan menjadi dua yaitu tes subjektif dan tes objektif. Bentuk tes subjektif sering juga disebut sebagai tes bentuk esai Inggris: essay. Tes esai adalah suatu bentuk pertanyaan yang menuntut jawaban siswa dalam bentuk uraian dengan mempergunakan bahasa sendiri. Tes bentuk esai memberi kebebasan yang kepada siswa untuk menyusun dan mengemukakan jawabannya sendiri dengan lingkup yang relatif dibatasi. Tes bentuk esai juga menuntut siswa untuk dapat menghubungkan fakta-fakta dan konsep-konsep, mengorganisasikannya ke dalam koherensi yang logis dan kemudian menuangkannya dalam bentuk ekspresi tulis dengan bahasa sendiri. Tes objektif memiliki pengertian yang kontras dengan tes bentuk esai. Tes objektif juga disebut dengan tes jawab singkat short answer test. Sesuai dengan namanya, tes jawab singkat menuntut siswa hanya dengan memberikan jawaban singkat, bahkan hanya dengan memilih kode-kode tertentu yang mewakili alternatif- alternatif jawaban yang telah disediakan. Jawaban terhadap tes objektif bersifat pasti, hanya ada satu kemungkinan jawaban yang benar. Jenis tes objektif yang banyak digunakan antara lain jawaban benar salah true-false, pilihan ganda multiple choice, isian completion, dan penjodohan matching. Keempat jenis tes yang telah dipaparkan di atas ada pula jenis tes sebagai pengukur keberhasilan. Tes pada dasarnya digunakan untuk mengukur tingkat keberhasilan siswa dalam mencapai tujuan dalam kegiatan belajar mengajar. Nurgiyantoro dalam Suwandi, 2010: 44 menyebutkan jika tes pengukur keberhasilan yang biasa digunakan terbagi menjadi empat yaitu: 1 tes kemampuan awal, 2 tes diagnostik, 3 tes formatif, dan 4 tes sumatif. Tes kemampuan awal dimaksudkan sebagai tes yang dilakukan sebelum siswa mengalami proses belajar mengajar. Tes diagnostik dilakukan sebelum atau selama berlangsungnya kegiatan belajar mengajar untuk menemukan bahan- bahan pelajaran yang masih menyulitkan siswa. Tes formatif dilakukan selama kegiatan belajar mengajar masih berlangsung, pada setiap akhir suatu bahasan untuk mengukur tingkat kemampuan siswa berkaitan dengan pokok bahasan yang baru saja diselesaikan. Tes sumatif dilakukan setelah semua kegiatan belajar mengajar atau program yang direncanakan selesai yang lazimnya dilaksanakan pada akhir semester dengan sebutan Ulangan Umum atau Ulangan Akhir Semester. Berdasarkan uraian di atas dapat disimpulkan bahwa jenis tes yang disusun dalam penelitian ini jika ditinjau berdasarkan individu yang dites merupakan tes kelompok, ditinjau dari jawaban yang dikehendaki termasuk tes verbal dengan cara menjawabnya termasuk tes tertulis. Sedangkan jika dilihat dari penyusun tes termasuk tes standar yaitu tes prestasi dengan bentuk tes objektif tipe pilihan ganda. c. Kelebihan dan Kekurangan Tes Tes yang biasa digunakan untuk mengukur hasil belajar siswa dibagi menjadi dua yaitu tes objektif dan tes subjektif Widoyoko, 2015: 57. Tes objektif maupun tes subjektif memiliki beberapa kelebihan dan kekurangan. Widoyoko 2015: 60- 88 memaparkan kelebihan dan kekurangan tes objektif dan tes subjektif sebagai berikut: 1 Tes Objektif a Kelebihan Tes Objektif 1 Lebih representatif mewakili isi dan luas bahan. 2 Lebih mudah dan cepat dalam memeriksa jawaban karena dapat menggunakan kunci jawaban bahkan dapat menggunakan alat-alat kemajuan teknologi misalnya mesin scanner. 3 Pemeriksaannya dapat diserahkan pada orang lain. 4 Pemeriksaan dan penskoran tidak ada unsur subjektif yang mempengaruhi, baik segi guru maupun responden. b Kekurangan Tes Objektif 1 Membutuhkan persiapan yang lebih sulit daripada tes subjektif karena butir soal atau item tesnya banyak dan harus teliti untuk menghindari kelemahan-kelemahan yang lain. 2 Butir-butir soal cenderung hanya mengungkapkan ingatan dan pengenalan kembali memahami, dan sulit untuk mengukur kemampuan berpikir tinggi seperti menganalisa dan mencipta. 3 Banyak kesempatan bagi responden untuk melakukan spekulasi atau untung-untungan dalam menjawab soal tes. 4 Kerjasama antar responden pada waktu mengerjakan soal tes lebih terbuka. 2 Tes Subjektif a Kelebihan Tes Subjektif 1 Tes objektif dapat digunakan mengukur hasil belajar yang kompleks seperti menganalisa dan mencipta. 2 Meningkatkan motivasi peserta tes untuk belajar dibandingkan bentuk tes objektif. 3 Mudah disiapkan dan disusun, sehingga tidak membutuhkan waktu yang lama bagi guru untuk mempersiapkannya. 4 Tidak banyak kesempatan untuk berspekulasi atau untung-untungan. 5 Mendorong responden untuk berani mengemukakan pendapat serta menyusun dalam bentuk kalimat yang baik. 6 Memberi kesempatan kepada responden untuk mengutarakan maksudnya dengan gaya bahasa dan caranya sendiri. b Kekurangan Tes Subjektif 1 Reliabilitas tes rendah karena skor yang dicapai tidak konsisten bila tes yang sama diuji beberapa kali. 2 Membutuhkan waktu yang lebih lama untuk mengoreksi lembar jawaban dan tidak dapat diwakilkan kepada orang lain. Berdasarkan penjelasan mengenai kelebihan dan kekurangan tes dapat disimpulkan bahwa tes yang biasa digunakan baik tes objektif maupun tes subjektif sama-sama memiliki kelebihan dan kekurangnya masing-masing. Sub-pokok bahasan mengenai tes hasil belajar membahas tiga hal yaitu definisi tes hasil belajar, jenis tes serta kelebihan dan kekurangan tes. Tes hasil belajar merupakan pertanyaan atau pernyataan yang diberikan kepada siswa untuk mengukur penguasaan siswa terhadap materi yang telah diajarkan. Tes dapat dibedakan menjadi empat antara lain: berdasarkan individu yang dites, jawaban yang dikehendaki, penyusun tes, dan bentuk tes. Ada pula jenis tes yang digunakan untuk mengukur keberhasilan antara lain tes kemampuan awal, tes diagnostik, tes formatif, dan tes sumatif. Tes hasil belajar yang biasa digunakan berupa tes objektif dan tes subjektif. Tes objektif maupun tes subjektif sama-sama memiliki kelebihan dan kekurangan. 2. Konstruksi Tes Hasil Belajar Konstruksi tes hasil belajar meliputi tiga pokok bahasan yaitu: validitas, reliabilitas, dan karakteristik butir soal. Penjabaran tiga pokok bahasan tersebut sebagai berikut. a. Validitas Masidjo 1995: 242 memaparkan pengertian validitas adalah taraf kemampuan tes mengukur yang seharusnya diukur. Validitas menurut Standard dalam Mardapi, 2008: 16 merupakan dukungan bukti dan teori terhadap penafsiran skor tes sesuai dengan tujuan penggunaan tes. Penafsiran skor tes tercantum pada tujuan penggunaan tes, bukan tes itu sendiri. Apabila skor tes yang digunakan ditafsirkan lebih dari satu makna, setiap penafsiran atau pemaknaan itu harus divalidasi. Validitas menurut Noor 2012: 132 adalah suatu indeks yang menunjukkan alat ukur yang digunakan benar-benar mengukur yang seharusnya diukur. Berdasarkan uraian di atas dapat disimpulkan bahwa validitas adalah kemampuan tes menunjukkan ketepatannya dalam mengukur yang seharusnya diukur. Validitas secara tradisional dapat digolongkan dalam tiga kategori besar, yaitu validitas isi content validity, validitas konstrak construct validity, dan validitas yang berdasarkan kriteria criterion-related validity Azwar, 2014: 41. 1 Validitas Isi Content Validity Validitas isi merupakan validitas yang diestiminasi lewat pengujian terhadap kelayakan atau relevansi isi tes melalui analisis rasional oleh panel yang berkompeten atau melalui expert judgement Azwar, 2014: 42. Hal senada juga diungkapkan oleh Arikunto 2013: 81 bahwa validitas isi bagi sebuah instrumen menunjukkan kondisi instrumen berdasarkan isi materi pelajaran yang dievaluasi. Secara lebih spesifik validitas isi dapat dibedakan menjadi dua tipe yaitu validitas muka face validity dan validitas logis logical validity. a Validitas Muka Face validity Validitas muka adalah bukti validitas yang walaupun penting namun paling rendah signifikansinya dikarenakan hanya didasarkan pada penilaian penampilan tes dan kesesuaian konteks aitem dengan tujuan tes Azwar, 2014: 43. b Validitas Logis Logical Validity Validitas logis atau validitas sampling adalah validitas yang menunjukkan sejauhmana aitem tes merupakan representasi dari ciri-ciri atribut yang hendak diukur Azwar, 2014: 44. Validitas logis menurut Arikunto 2013: 80 adalah kondisi sebuah instrumen yang memenuhi syarat valid berdasarkan hasil penalaran. Kondisi valid dipandang sudah memenuhi jika instrumen yang bersangkutan telah dirancang dengan baik mengikuti teori dan ketentuan yang ada. Validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen selesai disusun. 2 Validitas Konstrak Construct Validity AllenYen dalam Azwar, 2014: 45 menyatakan bahwa validitas konstrak adalah validitas yang menunjukkan sejauhmana hasil tes mampu mengungkap sebuah trait atau suatu konstrak teoretik yang hendak diukur. Validitas konstrak menurut Arikunto 2013: 81 adalah kondisi sebuah instrumen ditunjukkan berdasarkan aspek-aspek kejiwaan yang seharusnya dievaluasi. 3 Validitas Berdasarkan Kriteria Validitas berdasarkan kriteria dibedakan menjadi dua macam yaitu validitas prediktif predictive validity dan validitas konkuren concurrent validity. a Validitas Prediktif Validitas prediktif atau predictive validity adalah kemampuan sebuah instrumen untuk meramalkan apa yang akan terjadi pada masa yang akan datang Arikunto, 2013: 84. Yusuf 2014: 237 menyatakan hal yang yang senada mengenai validitas prediktif yaitu derajat kesesuaian antara hasil pengukuran dan kinerja di masa depan dalam aspek yang diukur. Validitas prediktif didapat dengan mencari korelasi antara skor predictor dengan skor yang ada tentang beberapa kriteria pada suatu waktu kemudian. b Validitas Konkuren Validitas konkuren merupakan indikasi validitas yang layak ditegakkan bila tes tidak dirancang untuk berfungsi sebagai prediktor dan merupakan validitas yang penting dalam situasi diagnostik Azwar, 2014: 49. Arikunto 2013: 83 memaparkan bahwa concurrent validity lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris ketika hasilnya sesuai dengan pengalaman. Kata “sesuai” mengkaitkan dua hal yang dipasangkan. Hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada ada sekarang. Membandingkan sebuah tes memerlukan suatu kriterium atau alat banding. Oleh karena itu, hasil tes merupakan sesuatu yang dibandingkan. Berdasarkan uraian mengenai validitas dapat disimpulkan bahwa validitas adalah kemampuan tes menunjukkan ketepatannya dalam mengukur yang seharusnya diukur. Validitas secara garis besar dapat dibedakan menjadi tiga yaitu validitas isi content validity, validitas konstrak construct validity, dan validitas yang berdasarkan kriteria criterion-related validity. Validitas isi dibedakan menjadi validitas tampang dan validitas logis. Validitas berdasarkan kriteria dibedakan menjadi validitas prediktif dan validitas konkuren. b. Reliabilitas Masidjo 1995: 208 menjelaskan pengertian reliabilitas adalah taraf kemampuan tes dalam menunjukkan konsistensi hasil pengukurannya yang diperlihatkan dalam taraf ketepatan dan ketelitian hasil. Sudijono 2011: 95 menyatakan reliabilitas sebagai keajegan atau kemantapan tes. Suatu tes yang baik harus memiliki reliabilitas atau bersifat reliabel. Suatu tes dinyatakan reliabel apabila hasil pengukuran dengan menggunakan tes tersebut dilakukan berulang kali terhadap subjek yang sama senantiasa menunjukkan hasil yang tetap sama atau sifatnya ajeg dan stabil. Arikunto 2013: 100 menyatakan hal yang senada bahwa reliabilitas adalah ketetapan hasil tes. Instrumen yang baik adalah instrumen yang dapat dengan ajeg memberikan data yang sesuai dengan kenyataan. Ajeg atau tetap tidak diartikan selalu sama, tetapi mengikuti perubahan secara ajeg. Berdasarkan pernyataan di atas dapat disimpulkan bahwa reliabilitas terlihat dari hasil sebuah instrumen jika diujikan dalam kurun waktu yang berbeda menghasilkan hasil yang tidak jauh berbeda dengan hasil yang diperoleh sebelumnya. c. Karakteristik Butir Soal Karakteristik butir soal meliputi tiga pokok bahasan yaitu daya pembeda, tingkat kesukaran, dan analisis pengecoh. Penjabaran ketiga pokok bahasan tersebut dijabarkan sebagai berikut: 1 Daya Pembeda Daya pembeda adalah kemampuan item soal dalam membedakan kemampuan siswa yang pandai dengan kemampuan siswa yang rendah Sulistyorini, 2011: 177. Masidjo 1995: 196 menyatakan bahwa daya pembeda adalah taraf jumlah jawaban benar siswa yang tergolong kelompok atas pandai = upper group berbeda dari siswa yang tergolong kelompok bawah kurang pandai = lower group untuk suatu item. Siswa yang tergolong kelompok atas KA adalah siswa yang mempunyai skor-skor tinggi, sedangkan siswa kelompok bawah KB adalah siswa yang mempunyai skor- skor rendah. Sudjana 2009: 141 menyatakan hal yang senada dengan Sulistyorini dan Masidjo bahwa daya pembeda merupakan kesanggupan soal dalam membedakan siswa yang tergolong mampu tinggi prestasinya dengan siswa yang tergolong kurang lemah prestasinya. Soal memiliki daya pembeda yang baik apabila diberikan pada siswa yang mampu hasilnya menunjukkan prestasi yang tinggi, sedangkan apabila diberikan pada siswa yang kurang mampu menunjukkan hasil yang rendah. Tes dikatakan tidak memiliki daya pembeda apabila tes tersebut jika diujikan pada siswa yang mampu menunjukkan hasil yang rendah, namun jika dikerjakan oleh siswa yang kurang mampu menunjukkan hasil yang tinggi. Tes yang tidak memiliki daya pembeda tidak akan menghasilkan gambaran hasil yang sesuai dengan kemampuan siswa yang sebenarnya. Berdasarkan pendapat tiga ahli di atas dapat disimpulkan bahwa daya pembeda merupakan kemampuan tes dalam membedakan siswa kelompok atas siswa dengan prestasi tinggi atau pandai dengan siswa kelompok bawah siswa dengan prestasi lemah atau kurang pandai. Tes yang memiliki daya pembeda akan menghasilkan gambaran kemampuan siswa yang sebenarnya. Sebaliknya tes yang tidak memiliki daya pembeda tidak akan menghasilkan gambaran kemampuan siswa yang sebenarnya. 2 Tingkat Kesukaran Tingkat kesukaran suatu item soal butir soal dapat diketahui dari banyaknya siswa yang menjawab benar. Taraf kesukaran suatu item dinyatakan dengan suatu bilangan indeks yang disebut Indeks Kesukaran IK Masidjo, 1995: 189. Tingkat kesulitan suatu item soal hendaknya memiliki keseimbangan yang proporsional antara soal dalam kategori mudah, sedang dan sukar Sulistyorini, 2009: 173. Sudjana 2009: 135 memaparkan bahwa tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawab soal, bukan dari sudut guru sebagai pembuat soal. Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan kategori soal yang termasuk mudah, sedang, dan sukar. Perbandingan proporsi jumlah soal untuk tiga kategori tersebut didasarkan atas kurva normal Sudjana, 2009: 136. Sebagian besar soal berada pada kategori sedang, sebagian lagi berada pada kategori mudah dan sukar dengan proporsi yang seimbang. Perbandingan antara soal yang mudah-sedang-sukar dapat dibuat 3-4- 3. 30 soal dengan kategori mudah, 40 soal dengan kategori sedang, dan 30 soal dengan kategori sukar. Perbandingan juga dapat dibuat 25-50-25, 25 soal dengan kategori mudah, 50 soal dengan kategori sedang, dan 25 soal dengan kategori sukar. Soal dengan kategori sedang menempati proporsi lebih banyak dari soal kategori mudah dan soal kategori sukar. Berdasarkan pendapat tiga ahli di atas dapat disimpulkan bahwa tingkat kesukaran soal dapat diketahui dari banyaknya siswa yang menjawab soal dengan benar. Tingkat kesukaran soal dipandang dari sudut kemampuan siswa dalam menjawab soal, bukan dari sudut guru sebagai pembuat soal. Proporsi soal dengan kategori mudah, sedang, dan sukar juga turut menentukan analisis tingkat kesukaran soal. 3 Analisis Pengecoh Sudijono 2011: 409-411 memaparkan bahwa tes objektif bentuk pilihan ganda setiap item soal butir soal dilengkapi dengan beberapa kemungkinan jawaban atau yang lebih dikenal dengan option atau alternatif. Option atau alternatif jumlahnya berkisar tiga sampai lima buah. Kemungkinan-kemungkinan yang terpasang pada setiap item soal salah satu di antaranya merupakan jawaban benar sesuai dengan kunci jawaban sedangkan sisanya merupakan jawaban salah. Jawaban-jawaban salah itulah yang disebut dengan pengecoh atau distraktor Inggris: distractor. Tujuan dipasangnya pengecoh pada setiap butir soal adalah agar dari sekian banyak siswa yang mengikuti tes ada yang tertarik atau terangsang untuk memilihnya, sebab mereka menyangka pengecoh yang dipilihnya merupakan jawaban benar. Pengecoh dinyatakan dapat menjalankan fungsinya dengan baik apabila memiliki daya tarik atau daya rangsang sedemikian rupa. Daya rangsang atau daya tarik tersebut membuat siswa khususnya yang termasuk siswa kategori kelompok bawah atau kurang pandai merasa bimbang dan ragu-ragu sehingga pada akhirnya mereka terkecoh untuk memilih pengecoh sebagai jawaban benar. Pengecoh dinyatakan menjalankan fungsinya dengan baik apabila pengecoh tersebut sekurang- kurangnya dipilih oleh 5 dari seluruh peserta tes. Makin banyak siswa yang terkecoh dapat dinyatakan bahwa pengecoh tersebut menjalankan fungsinya dengan baik. Semakin banyak siswa yang menjawab benar sesuai kunci jawaban, maka pengecoh tidak dapat menjalankan fungsinya dengan baik atau pengecoh “tidak laku”. Daryanto 2007: 193 menyatakan bahwa pengecoh dapat diperlakukan dengan tiga cara yaitu: “diterima”, “ditolak”, dan “ditulis kembali”. Pengecoh yang “diterima” telah menjalankan fungsinya dengan baik yaitu sekurang-kurangnya 5 dari seluruh peserta tes. Pengecoh yang “ditolak” tidak menjalankan fungsinya dengan baik atau seluruh peserta tes tidak memilih pengecoh tersebut. Pengecoh yang “ditulis kembali” kurang menjalankan fungsinya dengan baik. Pengecoh yang “ditulis kembali biasanya memiliki kekurangan yang terletak pada rumusan kalimat yang kurang efektif sehingga memerlukan perubahan yang seperlunya. Berdasarkan penjelasan pendapat ahli di atas dapat disimpulkan bahwa pengecoh digunakan pada tes objektif bentuk pilihan ganda. Pengecoh yang baik dipilih oleh sekurang-kurangnya 5 dari seluruh peserta tes. Pengecoh dapat diperlakukan dengan tiga cara yaitu: “diterima”, “ditolak”, dan “ditulis kembali”. Sub-pokok bahasan konstruksi tes hasil belajar dibagi menjadi tiga pokok bahasan yaitu validitas, reliabilitas, dan karakteristik butir soal yang terdiri dari daya pembeda, tingkat kesukaran, dan analisis pengecoh. Validitas adalah kemampuan tes menunjukkan ketepatannya dalam mengukur yang seharusnya diukur. Validitas dapat digolongkan dalam tiga kategori besar, yaitu validitas isi, validitas konstrak, dan validitas yang berdasarkan kriteria. Apabila validitas menunjukkan ketepatan tes dalam mengukur yang seharusnya diukur, maka reliabilitas menunjukkan keajegan suatu tes dalam mengukur yang seharusnya diukur. Keajegan yang dimaksud bukanlah hasil yang sama yang akan diperoleh setiap tes diujikan namun mengikuti perubahan secara ajeg. Tes ketika diujikan akan mengukur kemampuan siswa yang pandai dan siswa yang kurang pandai yang juga disebut daya pembeda. Tes yang diujikan harus memiliki tingkat kesukaran yang baik yaitu soal pada kategori sedang memiliki proporsi lebih banyak dari soal pada kategori mudan dan sukar. Soal kategori mudah dan sukar memiliki proporsi yang seimbang. Soal objektif bentuk pilihan ganda perlu dianalisis keefektifan pengecohnya. Pengecoh yang baik akan dipilih oleh sekurang-kurangnya 5 peserta tes. 3. Pengembangan Tes Hasil Belajar Mardapi dalam Widoyoko, 2015: 90-97 memaparkan ada sembilan langkah yang perlu ditempuh dalam mengembangkan tes hasil belajar. Kesembilan langkah tersebut akan dijabarkan sebagai berikut: 1 Menyusun Spesifikasi Tes Menyusun spesifikasi tes merupakan langkah awal dalam pengembangan tes. Spesifikasi tes berisi uraian yang menunjukkan keseluruhan karakteristik yang harus dimiliki suatu tes. Penyusunan spesifikasi tes mencakup kegiatan a menentukan tujuan tes, b menyusun kisi-kisi tes, c memilih bentuk tes, dan d menentukan panjang tes. a. Menentukan Tujuan Tes Tujuan tes yang banyak digunakan oleh lembaga pendidikan antara lain: tes kemampuan awal atau tes penempatan, tes dignostik, tes formatif, dan tes sumatif. b. Menyusun Kisi-kisi Tes Kisi-kisi merupakan matriks yang berisi spesifikasi soal yang akan dibuat. Matriks kisi-kisi soal terdiri dari dua jalur yaitu kolom dan baris. Kolom menyatakan kompetensi dasar KD dan indikator, pokok dan sub-pokok bahasan, serta uraian materi. Baris menyatakan tujuan yang akan diukur dalam tes. Ada empat langkah dalam mengembangkan kisi-kisi tes, yaitu: 1 menulis standar kompetensi SK dan kompetensi dasar KD, 2 menentukan indikator, 3 membuat daftar pokok bahasan dan sub-pokok bahasan yang akan diujikan, 4 menentukan jumlah butir soal tiap pokok bahasan dan sub-pokok bahasan. Kisi-kisi tes dapat disusun secara terpisah antara tes objektif dan tes subjektif tes esai atau uraian. Tes objektif dan tes subjektif juga dapat dibuat dalam satu kisi-kisi soal. Sumber utama standar kompetensi SK, kompetensi dasar KD, indikator, pokok bahasan, dan sub-pokok bahasan adalah silabus mata pelajaran. Jumlah soal yang digunakan bergantung pada waktu yang tersedia untuk tes dan materi yang diujikan. c. Memilih Bentuk Tes Bentuk tes dapat ditentukan berdasarkan tujuan tes, jumlah peserta tes, waktu yang tersedia untuk memeriksa jawaban tes, cakupan materi, dan karakteristik mata pelajaran yang diujikan. Bentuk pilihan objektif pilihan ganda dan bentuk tes benar salah tepat digunakan bila jumlah peserta banyak, waktu koreksi singkat, dan cakupan materi yang diujikan banyak. d. Menentukan Panjang Tes Durasi Pengerjaan Tes Panjang tes ditentukan berdasarkan cakupan materi ujian dan kelelahan peserta tes. Tes tertulis pada umumnya menggunakan waktu 90 sampai 150 menit, sedangkan tes praktik membutuhkan waktu lebih dari itu. Tes pilihan ganda membutuhkan waktu pengerjaan 2 sampai 3 menit untuk setiap butir soal. Hal ini juga dipengaruhi oleh tingkat kesulitan soal. 2 Menulis Soal Tes Penulisan soal merupakan penjabaran indikator menjadi pernyataan-pernyataan yang karakteristiknya sesuai dengan perincian pada kisi-kisi yang telah dibuat. Kualitas tes secara keseluruhan dipengaruhi oleh tingkat kebaikan masing-masing butir soal. Pertanyaan perlu dikembangkan dan dibuat dengan jelas dan simple. Soal yang tidak jelas dan bertele-tele akan menyebabkan interpretasi tunggal dan membingungkan. Setiap pertanyaan perlu disusun sedemikian rupa sehingga jelas yang ditanyakan dan jawaban yang diharapkan. 3 Menelaah Soal Tes Soal yang telah dibuat seringkali memiliki kesalahan dan kekurangan yang luput meski telah dipersiapkan dengan baik. Kesalahan dan kekurangan tersebut ditelaah oleh orang lain bukan si pembuat soal untuk menghindari bias. Telaah soal diharapkan menghasilkan kualitas soal yang lebih baik. 4 Melakukan Uji Coba Tes Uji coba soal perlu dilakukan untuk memperbaiki kualitas soal sebelum soal digunakan. Uji coba dapat digunakan sebagai sarana memperoleh data empirik mengenai tingkat kebaikan soal yang telah disusun. Hasil uji coba akan diperoleh data yang digunakan sebagai dasar analisis tentang validitas, reliabilitas, tingkat kesukaran, daya pembeda, efektifitas pengecoh dan lain-lain. Berdasarkan hasil uji coba tersebut apabila soal yang disusun belum memenuhi kualitas yang diharapkan maka akan dilakukan perbaikan atau pembenahan butir soal. 5 Menganalisis Butir Soal Tes Uji coba yang telah dilakukan dapat diperoleh beberapa informasi penting tentang kualitas soal yang telah disusun. Hasil uji coba perlu kiranya dilakukan analisis butir soal yang telah disusun. Analisis dari hasil coba akan diketahui antara lain: tingkat kesukaran, daya pembeda, dan juga efektifitas pengecoh. 6 Memperbaiki Tes Memperbaiki tes dilakukan pada butir soal yang belum mencapai kualitas yang diharapkan. Ada kemungkinan beberapa soal sudah baik sehingga tidak perlu direvisi, beberapa soal perlu direvisi, dan beberapa soal mungkin harus dibuang karena tidak memenuhi standar kualitas yang diharapkan. 7 Merakit Tes Butir soal yang telah dianalisis dan diperbaiki selanjutnya dirakit menjadi satu kesatuan tes. Keseluruhan butir soal perlu disusun secara hati-hati menjadi kesatuan soal tes yang terpadu. Perakitan tes perlu memperhatikan hal-hal yang dapat mempengaruhi validitas soal seperti nomor urut soal, pengelompokkan bentuk soal, lay out dan sebagainya perlu diperhatikan. Hal ini sangat penting karena jika disusun sembarangan dapat menyebabkan soal tersebut menjadi tidak baik. 8 Melaksanakan Tes Tes yang telah dirakit menjadi satu kesatuan diberikan kepada peserta tes untuk diselesaikan. Pelaksanaan tes dilakukan sesuai dengan waktu yang telah ditentukan. Tes yang dilaksanakan perlu dipantau oleh pengawas agar tes benar-benar dikerjakan oleh peserta tes dengan jujur dan ketentuan yang telah digariskan. Pengawasan dilakukan harus tidak mengganggu pelaksanaan tes. Peserta tes tidak boleh terganggu oleh kehadiran pengawas karena berakibat ketidak akuratan hasil tes. 9 Menafsirkan Hasil Tes Hasil tes menghasilkan data kuantitatif berupa skor yang ditafsirkan menjadi nilai. Tinggi rendahnya nilai dikaitkan dengan acuan penilaian. Acuan penilaian yang sering digunakan dalam bidang pendidikan ada dua macam yaitu acuan norma dan acuan kriteria. Nilai merupakan alat yang sangat berguna untuk memotivasi siswa dalam belajar serta guru dalam mengajar lebih baik. Mengembangkan tes hasil belajar memerlukan langkah-langkah pengembangan yang benar. Ada sembilan langkah yang perlu ditempuh dalam mengembangkan tes hasil belajar yaitu: 1 menyusun spesifikasi tes, 2 menulis soal tes, 3 menelaah soal tes, 4 melakukan uji coba tes, 5 menganalisis butir soal tes, 6 memperbaiki tes, 7 merakit tes, 8 melaksanakan tes, dan 9 menafsirkan hasil tes. 4. Taksonomi Bloom yang Direvisi Taksonomi adalah sebuah kerangka berpikir khusus AndersonKrathwohl, 2010: 6. Taksonomi dalam dunia pendidikan mengklasifikasi Tujuan Instruksional Khusus TIK atau lebih dikenal indikator. Sebuah rumusan TIK berisikan satu kata kerja dan satu kata benda. Kata kerja mendeskripsikan proses kognitif yang diharapkan sedangkan kata benda mendeskripsikan pengetahuan yang diharapkan untuk dikuasai siswa. Contohnya: Siswa dapat membedakan proses kognitif bilangan genap dan bilangan ganjil pengetahuan AndersonKrathwohl, 2010: 6. Taksonomi Bloom memiliki satu dimensi, sedangkan taksonomi Bloom yang direvisi memiliki dua dimensi. Dua dimensi yang dimaksud adalah proses kognitif dan pengetahuan. Interelasi antara kedua dimensi disebut dengan Tabel Taksonomi. Dimensi proses kognitif memiliki enam kategori yaitu: Mengingat, Memahami, Mengaplikasikan, Menganalisis, Mengevaluasi, dan Mencipta. Kontinum yang mendasari dimensi proses kognitif dianggap sebagai tingkatan kognisi yang kompleks AndersonKrathwohl, 2010: 6. Dimensi pengetahuan berisi empat kategori yaitu: Faktual, Konseptual, Prosedural, dan Metakognitif. Kategori-kategori ini dianggap merupakan kontinum dari yang konkret faktual dampai dengan abstrak metakognitif. Kategori-kategori dalam proses kognitif dan pengetahuan akan dijabarkan sebagai berikut: a. Mengingat Proses mengingat adalah mengambil pengetahuan yang dibutuhkan dari memori jangka panjang AndersonKrathwohl, 2010: 99. Proses mengingat akan cocok dengan tujuan pembelajaran yang menghendaki kemampuan untuk meretensi atau menyimpan materi yang pelajaran sama seperti materi yang diajarkan. Pengetahuan yang dibutuhkan dalam proses mengingat adalah pengetahuan Faktual, Konseptual, Prosedural, atau Metakognitif, atau kombinasi dari beberapa pengetahuan tersebut. Proses-proses kognitif dalam kategori mengingat meliputi mengenali dan mengingat kembali AndersonKrathwohl, 2010: 103-104. b. Memahami Proses memahami adalah mengkonstruksi makna dari pesan-pesan pembelajaran baik yang bersifat lisan, tulisan, maupun grafis yang disampaikan melalui pengajaran, buku, atau layar komputer AndersonKrathwohl, 2010: 105. Pengetahuan yang mendasari proses kognitif memahami ialah pengetahuan Konseptual. Proses-proses kognitif dalam kategori memahami meliputi menafsirkan, mencontohkan, mengklasifikasikan, merangkum, menyimpulkan, membandingkan, dan menjelaskan AndersonKrathwohl, 2010: 106. c. Mengaplikasikan Proses kognitif mengaplikasikan melibatkan penggunaan prosedur tertentu untuk mengerjakan soal latihan atau menyelesaikan masalah. Pengetahuan yang berkaitan erat dengan pengetahuan Prosedural. Kategori mengaplikasikan terdiri dari dua proses kognitif yaitu mengeksekusi berkaitan dengan menyelesaikan soal latihan dan mengimplementasikan berkaitan dengan menyelesaikan masalah AndersonKrathwohl, 2010: 116. d. Menganalisis Menganalisis berkaitan dengan proses memecah-mecah materi menjadi bagian- bagian kecil serta mennetukan hubungan antar bagian dan antara setiap bagian dan struktur keseluruhannya. Kategori proses menganalisis meliputi proses kognitif membedakan, mengorganisasi, dan mengatribusikan AndersonKrathwohl, 2010: 120. e. Mengevaluasi Mengevaluasi berkaitan dengan membuat keputusan berdasarkan kriteria dan standar. Kategori mengevaluasi mencakup proses kognitif memeriksa keputusan- keputusan yang diambil berdasarkan kriteria internal dan mengkritik keputusan- keputusan yang diambil berdasarkan kriteria eksternal AndersonKrathwohl, 2010: 125. f. Mencipta Mencipta berkaitan dengan proses menyusun elemen-elemen jadi sebuah keseluruhan yang koheren atau fungsional. Proses kognitif yang terlibat dalam mencipta sejalan dengan pengalaman-pengalaman belajar sebelumnya. Mencipta bukanlah ekspresi kreatif yang bebas sama sekali dan tak dihambat oleh tuntutan- tuntutan tugas atau situasi belajar. Berdasarkan penjelasan di atas, dapat disimpulkan bahwa taksonomi adalah sebuah kerangka berpikir khusus. Taksonomi Bloom yang direvisi memiliki dua dimensi yaitu proses kognitif dan pengetahuan. Interelasi antara kedua dimensi disebut dengan Tabel Taksonomi. Dimensi proses kognitif memiliki enam kategori yaitu: Mengingat, Memahami, Mengaplikasikan, Menganalisis, Mengevaluasi, dan Mencipta. 5. Program TAP Test Analysis Program TAP Test Analysis Program merupakan salah satu software yang dapat digunakan untuk menganalisis soal tes hasil belajar. Program TAP digunakan untuk menganalisis Lewis, dalam Wirastri, 2014: 43: a. Total nilai yang didapat siswa untuk mengetahui rata-rata mean, maksimum nilai yang didapatkan, minimum nilai yang didapatkan, dan standar devisiasi. b. Tingkat kesukaran item untuk mengetahui tingkat kesukaran soal. c. Daya pembeda soal untuk membedakan siswa pintar dan siswa kurang pintar dilihat dari skor yang didapatkan siswa. d. Tingkat validitas soal yang digunakan untuk melihat valid atau tidaknya soal. e. Kualitas pengecoh pada pilihan jawaban soal untuk mengetahui berfungsi atau tidaknya pengecoh. Berdasarkan penjelasan di atas dapat disimpulkan bahwa program TAP dapat menganalisis validitas, reliabilitas, daya pembeda, tingkat kesukaran, dan kualitas pengecoh.

B. Penelitian yang Relevan