Pengembangan Perangkat Lunak Analisis Butir Soal dan Angket

PENGEMBANGAN PERANGKAT LUNAK ANALISIS BUTIR SOAL DAN ANGKET SKRIPSI

Oleh :

ANNUR INDRA KUSUMADANI K4308025 PROGRAM STUDI PENDIDIKAN BIOLOGI FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SEBELAS MARET SURAKARTA 2012

PENGEMBANGAN PERANGKAT LUNAK ANALISIS BUTIR SOAL DAN ANGKET

Oleh: ANNUR INDRA KUSUMADANI K4308025

Skripsi

Ditulis dan diajukan untuk memenuhi syarat mendapatkan gelar Sarjana Pendidikan Program Studi Pendidikan Biologi Jurusan Pendidikan Matematika dan Ilmu Pengetahuan Alam

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SEBELAS MARET SURAKARTA 2012

PERSETUJUAN

Skripsi ini telah disetujui untuk dipertahankan di hadapan Tim Penguji

Skripsi Fakultas Keguruan dan Ilmu Pendidikan Universitas Sebelas Maret Surakarta.

Persetujuan Pembimbing

Pembimbing I Pembimbing II

Dr. Baskoro Adi Prayitno, S.Pd., M.Pd. Bowo Sugiharto, S.Pd., M.Pd. NIP. 19770125 200801 1 008

NIP. 19760125 200501 1 001

PENGESAHAN

Skripsi ini telah dipertahankan di hadapan Tim Penguji Skripsi Fakultas Keguruan dan Ilmu Pendidikan Universitas Sebelas Maret Surakarta dan diterima untuk memenuhi persyaratan mendapatkan gelar Sarjana Pendidikan.

Tim Penguji Skripsi Nama Terang

Tanda Tangan

Ketua

: Puguh Karyanto, M.Si., Ph.D.

.................... Sekretaris : Umi Fatmawati, S.Pd., M.Si.

....................... Anggota I : Dr. Baskoro Adi Prayitno, S.Pd., M.Pd.

..................... Anggota II : Bowo Sugiharto, S.Pd., M.Pd.

Disahkan oleh Fakultas Keguruan dan Ilmu Pendidikan Universitas Sebelas Maret Surakarta Dekan

Prof. Dr. H. Muhammad Furqon Hidayatullah, M.Pd. NIP. 19600727 198702 1 001

PERSEMBAHAN                            

        Kupersembahkan karya ini untuk:

Mama dan Papa, terima kasih atas doa dan kasih sayangmu yang selalu tercurah kepada diriku. Annisa dan Annas, adik-adikku tersayang.

Almarhum nenekku tersayang, Encum Ningsih Nur Haridz. Bapak Baskoro dan Bapak Bowo, terima kasih atas bimbingan, ilmu, dan dukungan dalam penelitian ini.

Ibu Sri Yamtinah, Bapak Rosihan Ari, dan Bapak Adi Nugroho, terima kasih atas kerjasama, bantuan dan ilmunya sehingga validasi AN Soft 1.0 dalam penelitian ini dapat terlaksana dengan baik.

Bapak Maridi, terima kasih atas bimbingan akademik selama perkuliahan. Bapak Puguh, terima kasih atas suasana baru di Program Studi Pendidikan

Biologi FKIP UNS yang memberikan semangat untuk segera menyelesaikan studi ini dengan baik. Bapak dan Ibu Dosen Program Studi Pendidikan Biologi FKIP UNS, terima kasih atas ilmu, pengalaman, kebersamaan dan kekeluargaan ini. Ferry, Rudy, dan Waryanto, terima kasih atas kebersamaan, bantuan, dan kerja sama selama 4 tahun masa kuliah. Semoga kebersamaan kita selama ini menjadi persaudaraan yang erat. Teman-Teman Pendidikan Biologi 2008, kebersamaan, semangat, dan perjuangan kita tidak akan pernah terlupakan.

MOTTO

Landasi hidupmu dengan niat dan tujuan karena Allah SWT Hidup ini indah bila kita selalu berada di sisi-Nya setiap waktu hingga kita hembuskan nafas yang terakhir

(Penulis)

Tugas kita bukanlah untuk berhasil. Tugas kita adalah untuk mencoba, karena di dalam mencoba itulah kita menemukan dan belajar membangun kesempatan untuk berhasil

(Mario Teguh)

KATA PENGANTAR

Segala puji dan syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat dan karunia-Nya, sehingga skripsi yang berjudul “Pengembangan Perangkat Lunak Analisis Butir Soal dan Angket” dapat diselesaikan untuk memenuhi sebagian persyaratan mendapatkan Gelar Sarjana Pendidikan Universitas Sebelas Maret Surakarta.

Selama penelitian hingga terselesaikannya laporan ini, penulis menemui berbagai hambatan. Namun, berkat bantuan dan dorongan dari berbagai pihak akhirnya hambatan yang ada dapat teratasi. Oleh karena itu, atas segala bentuk bantuan yang telah diberikan, dengan segala kerendahan hati penulis mengucapkan terima kasih kepada:

1. Dekan Fakultas Keguruan dan Ilmu Pendidikan Universitas Sebelas Maret Surakarta.

2. Ketua Jurusan Pendidikan Matematika dan Ilmu Pengetahuan Alam Fakultas Keguruan dan Ilmu Pendidikan Universitas Sebelas Maret Surakarta.

3. Ketua Program Studi Pendidikan Biologi Jurusan Pendidikan Matematika dan Ilmu Pengetahuan Alam Fakultas Keguruan dan Ilmu Pendidikan Universitas Sebelas Maret Surakarta.

4. Dr. Baskoro Adi Prayitno, S.Pd., M.Pd. selaku Pembimbing I dan Bowo Sugiharto, S.Pd., M.Pd. selaku Pembimbing II yang telah memberikan arahan, bimbingan, dan dorongan sehingga penulisan skripsi ini dapat berjalan lancar.

5. Maridi, S.Pd., M.Pd. selaku Pembimbing Akademik yang telah memberikan arahan, bimbingan, dan dorongan sehingga penulisan skripsi ini dapat diselesaikan tepat pada waktunya.

6. Mama dan Papa yang tiada hentinya memberikan segalanya demi masa depan penulis.

7. Teman-teman Program Studi Pendidikan Biologi FKIP UNS angkatan 2008 yang telah berkenan bekerja sama dalam uji coba lapangan AN Soft 1.0.

8. Berbagai pihak yang telah membantu menyelesaikan penulisan skripsi ini yang tidak mungkin disebutkan semua.

Penulis menyadari bahwa dalam menyusun skripsi ini masih jauh dari sempurna. Oleh karena itu, kritik dan saran sangat penulis harapkan demi perbaikan dan kesempurnaan skripsi ini. Semoga karya ini bermanfaat bagi semua pihak yang berkepentingan.

Surakarta, Agustus 2012

Penulis

DAFTAR TABEL

Halaman

Tabel 2.1 Kriteria Indeks Tingkat Kesukaran. ............................................... 21 Tabel 2.2 Kriteria Indeks Diskriminan. ......................................................... 23 Tabel 3.1 Penskoran Butir Angket Menurut Skala Likert............................... 31 Tabel 3.2 Range Persentase dan Kriteria Penilaian. ....................................... 32 Tabel 4.1 Data Hasil Wawancara Awal untuk Analisis Kebutuhan ................ 33 Tabel 4.2 Data Hasil Angket Awal untuk Analisis Kebutuhan ....................... 34 Tabel 4.3 Data Hasil Penilaian Pakar untuk Validasi ..................................... 35 Tabel 4.4 Data Hasil Penilaian Pengguna pada Uji Coba Lapangan 1 ............ 35 Tabel 4.5 Data Hasil Pengisian Angket oleh Pengguna Uji Lapangan 1 ......... 36 Tabel 4.6 Data Hasil Wawancara Pengguna pada Uji Coba Lapangan 1 ........ 37 Tabel 4.7 Data Hasil Penilaian Pengguna pada Uji Coba Lapangan 2 ............ 38 Tabel 4.8 Data Hasil Pengisian Angket oleh Pengguna Uji Lapangan 2 ......... 38 Tabel 4.9 Data Hasil Wawancara Pengguna pada Uji Coba Lapangan 2 ........ 39

DAFTAR GAMBAR

Halaman

Gambar 3.1 Bagan Alur Prosedur Pengembangan. ........................................ 28 Gambar 4.1 Grafik Peningkatan Persentase Hasil Penilaian. .......................... 48 Gambar 4.2 Grafik Peningkatan Persentase Hasil Angket.............................. 50

ABSTRAK

Annur Indra Kusumadani. PENGEMBANGAN PERANGKAT LUNAK ANALISIS BUTIR SOAL DAN ANGKET. Skripsi. Surakarta, Agustus 2012.

Penelitian ini betujuan untuk mengembangkan perangkat lunak analisis butir soal dan angket sehingga mempermudah umum yang sedang melakukan penelitian di sekolah dalam melakukan analisis butir soal dan angket. Perangkat lunak yang dikembangkan adalah AN Soft 1.0 yang berfungsi dan bertujuan untuk mempermudah pengguna dalam melakukan analisis butir soal dan angket. Perangkat lunak yang dikembangkan berbasis Microsoft Visual Foxpro 9.0 dengan pengendali Microsoft Office 2007 dan 2010.

Penelitian ini merupakan penelitian Research and Development dengan tahapan penelitian sebagai berikut. Penelitian dan pengumpulan data awal, perencanaan, pembuatan produk awal, uji coba awal, perbaikan produk awal, uji coba lapangan, dan perbaikan produk operasional. Penelitian ini melibatkan subjek coba sebagai berikut. (1) Uji coba awal melibatkan pakar pendidikan, pakar komunikasi visual, dan pakar teknologi informasi. (2) Uji coba kelompok kecil melibatkan 30 orang mahasiswa Pendidikan Biologi Universitas Sebelas Maret Surakarta. (3) Uji coba kelompok besar melibatkan 50 orang mahasiswa Pendidikan Biologi Universitas Sebelas Maret Surakarta. Teknik analisis data yang digunakan adalah analisis deskriptif kualitatif yaitu dengan mendeskripsikan dan memaknai data yang bersifat kualitatif. Sebelum dianalisis, dilakukan kuantifikasi data dari angket dan lembar penilaian kemudian data dianalisis secara kualitatif. Untuk data hasil wawancara dianalisis dengan analisis kualitatif.

Hasil uji coba lapangan 1 dan 2 menunjukkan bahwa terdapat peningkatan persentase skor total dari seluruh aspek. Hasil pengisian angket menunjukkan bahwa tingkat ketertarikan pengguna terhadap AN Soft 1.0 meningkat sebesar 4,47% dari 85,33% menjadi 89,8% yaitu tergolong sangat kuat, tingkat kemudahan penginstallan AN Soft 1.0 meningkat sebesar 9,87% dari 84,33% menjadi 94,2% yaitu tergolong sangat kuat, tingkat kemudahan pengoperasian AN Soft 1.0 meningkat sebesar 9,4% dari 84% menjadi 93,4% yaitu tergolong sangat kuat, dan tingkat penguasaan pengguna terhadap AN Soft 1.0 meningkat sebesar 9,6% dari 81% menjadi 90,6% yaitu tergolong sangat kuat.

Berdasarkan hasil tersebut, disimpulkan produk pengembangan perangkat lunak analisis butir soal dan angket dapat mempermudah pengguna untuk melakukan analisis butir soal dan angket sesuai dengan kaidah analisis instrumen yang benar.

Kata kunci: Perangkat Lunak, Analisis Butir Soal dan Angket, Sistem Teknologi

Informasi dan Komunikasi, Pengukuran Instrumen, dan Evaluasi.

ABSTRACT

Annur Indra Kusumadani. DEVELOPING OF ITEMS TEST AND QUESTIONNAIRE ANALYSIS SOFTWARE. Thesis. Surakarta, August. 2012.

The aim of the research is to develop items test and questionnaire analysis software in order to facilitate people who are conducting research in schools to analyze the items test and questionnaire. The software is AN Soft 1.0 that has function to facilitate the user in analyzing the items test and questionnaire. The software is based on Microsoft Visual Foxpro 9.0 with Microsoft Office 2007 and 2010 as controllers.

The research is belonged to Research and the Development Method. The following research stages: Research and initial data collection, planning, making the initial product, the initial product test, the initial product improvements, field test, operational and product improvements. The research involves the following trial subjects. (1) The initial test involving an educational expert, visual communication expert, and information technology expert. (2) The small trial group involves 30 students of Biology Education Department, Sebelas Maret University. (3) The large trial group involves 50 students of Biology Education Department, Sebelas Maret University. The data was analyzed using qualitative descriptive approach that describes and interprets the qualitative data. Before the data was analyzed, carried out the quantification of data from the questionnaires and the assessment form then the data was analyzed qualitatively. The interviews data was analyzed qualitatively.

The results of field test 1 and 2 showed that there is an increasing percentage of the total score from all aspects. The results of the questionnaire showed that the rate of interesting on AN Soft 1.0 users increased until 4,47% from 85.33% to 89.8% is classified as very strong, the ease of installing Soft AN

1.0 increased until 9,87% from 84.33% to 94.2% is classified as very strong, The ease of operations AN Soft 1.0 increased until 9,4% from 84% to 93.4% is

classified as very strong, and the mastery level of AN Soft 1.0 users increased until 9,6% from 81% to 90.6% which is classified as very strong.

Based on the results, it was concluded the developing of items test and questionnaire analysis software product can be facilitating users to analysis items test and questionnaire in accordance with the rules of proper instruments analysis.

Keywords: Software, The items test and questionnaire analysis, Information and

communication technology, Instrument Assessment, and Evaluation.

BAB I PENDAHULUAN

A. Latar Belakang Masalah

Abad ke-21 merupakan era globalisasi di mana terjadi persaingan bebas antar bangsa yang menuntut pola berpikir kritis dan adaptif terhadap perubahan dan perkembangan yang terjadi, salah satunya adalah berkembangnya teknologi informasi dan komunikasi (TIK). Pendidikan sebagai salah satu sistem untuk menjawab tuntutan tersebut juga mengalami perubahan seiring dengan perkembangan zaman, perubahan ini juga berpengaruh terhadap kualitas evaluasi yang dilakukan oleh guru. Evaluasi yang berkualitas sangat diperlukan dalam era globalisasi yang terus berkembang saat ini untuk meningkatkan kompetensi peserta didik.

Era globalisasi disikapi pemerintah Indonesia dengan menyelenggarakan program sertifikasi guru profesional. Program ini bertujuan untuk mencetak guru profesional yang berdaya saing global. Sikap pemerintah Indonesia ini menjadi motivasi mahasiswa pendidikan dalam meningkatkan kompetensi dan kualitas untuk menjadi guru profesional yang berdaya saing global. Salah satu kompetensi dan kualitas tersebut adalah dalam melakukan analisis butir soal dan butir angket dalam proses evaluasi.

Hasil wawancara dan pemberian angket kepada mahasiswa Pendidikan Biologi Universitas Sebelas Maret Surakarta yang sedang melakukan penelitian di sekolah menunjukkan bahwa masih banyak yang merasa kesulitan dalam mengukur keterhandalan instrumen serta menganalisis butir soal dan butir angket dengan menggunakan sistem teknologi informasi sehingga masih menggunakan penghitungan manual yang memakan banyak waktu, tenaga, dan ketelitian yang rendah dengan resiko tingkat kesalahan yang tinggi.

Kondisi yang terjadi pada mahasiswa Pendidikan Biologi Universitas Sebelas Maret Surakarta yang sedang penelitian di sekolah bila tidak segera diatasi akan berdampak pada rendahnya kualitas instrumen tes dan bukan tes serta

Solusi untuk mengatasi permasalahan di atas adalah menerapkan perangkat lunak yang mampu mempermudah dalam menganalisis butir soal dan angket.

AN Soft 1.0 adalah perangkat lunak analisis butir soal dan angket yang mempermudah dalam menganalisis butir soal dan angket berdasarkan pada validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh sesuai dengan kaidah analisis instrumen yang benar. Selain itu, AN Soft 1.0 juga dilengkapi dengan fasilitas penelusuran kata kerja operasional hasil belajar kognitif, afektif, dan psikomotor beserta fasilitas untuk merevisi database kata kerja operasional hasil belajar tersebut. Namun, fasilitas untuk merevisi database kata kerja operasional hasil belajar tersebut hanya boleh dilakukan oleh admin, yaitu pengembang AN Soft 1.0 dan para ahli dalam bidang evaluasi pendidikan. Dengan demikian, penerapan perangkat lunak AN Soft 1.0 berpotensi mempermudah pengguna dalam membuat instrumen tes dan bukan tes yang berkualitas. AN soft 1.0 mudah dalam penginstallan dan pengoperasian tanpa

harus belajar secara detail, tampilan yang komunikatif, fungsi lebih spesifik, isi lengkap, dan tidak terpisah serta sesuai dengan kaidah analisis instrumen yang benar. Jika dibandingkan dengan perangkat lunak analisis butir yang sudah ada sebelumnya, maka AN Soft 1.0 lebih mudah dalam penginstallan dan pengoperasian, fungsi lebih spesifik, tampilan lebih komunikatif, isi lebih lengkap, dan tidak terpisah sehingga sudah diintegrasikan menjadi satu perangkat lunak utuh yang dapat digunakan untuk analisis soal pilihan ganda, soal uraian (berbobot), dan angket serta analisis kata kerja operasional hasil belajar kognitif, afektif, dan psikomotor beserta fasilitas untuk merevisi database kata kerja operasional hasil belajar tersebut. Selain Itu, AN Soft 1.0 sudah sesuai dengan kaidah analisis instrumen yang benar, misalnya dalam hal pengukuran validitas tidak menggunakan formula product moment tetapi menggunakan formula content validity.

Berdasarkan latar belakang di atas, maka perlu dilakukan penelitian dan pengembangan perangkat lunak yang sekaligus dapat menjadi solusi terhadap permasalahan kualitas instrumen tes dan bukan tes yang dibuat oleh guru dengan

B. Identifikasi Masalah

Berdasarkan latar belakang masalah di atas, dapat dilakukan identifikasi masalah sebagai berikut.

1. Proses analisis butir soal dan angket masih manual.

2. Kurangnya pengetahuan mahasiswa tentang pengembangan dan peranan sistem teknologi informasi.

3. Mengembangkan suatu sistem analisis butir soal dan angket berbasis sistem teknologi informasi.

C. Pembatasan Masalah

Berdasarkan latar belakang masalah dan identifikasi masalah di atas, penelitian pengembangan ini dibatasi pada:

1. Pengembangan sistem analisis butir soal dan butir angket berbasis Microsoft Visual Foxpro 9.0 dengan pengendali Microsoft Office 2007 dan 2010.

2. Penilaian produk pengembangan sistem analisis butir soal dan butir angket berbasis sistem teknologi informasi meliputi 5 aspek, yaitu:

a. Aspek kelayakan isi

b. Aspek kebahasaan yang digunakan

c. Aspek sajian

d. Aspek kegrafisan

e. Aspek perangkat lunak

3. Penelitian ini ditujukan kepada mahasiswa Pendidikan Biologi Universitas Sebelas Maret Surakarta yang sedang melakukan penelitian di sekolah.

D. Rumusan Masalah

Berdasarkan latar belakang masalah, maka permasalahan yang menjadi pokok penelitian ini adalah bagaimana mengembangkan perangkat lunak analisis butir soal dan butir angket untuk mempermudah umum yang sedang penelitian di sekolah dalam melakukan analisis butir soal dan angket?

E. Tujuan Penelitian

Sesuai dengan perumusan masalah yang telah dikemukakan di atas, maka tujuan penelitian ini adalah mengembangkan perangkat lunak analisis butir soal dan butir angket untuk mempermudah umum yang sedang penelitian di sekolah dalam melakukan analisis butir soal dan angket.

F. Spesifikasi Produk yang Dikembangkan Spesifikasi produk yang dikembangkan berupa perangkat lunak AN Soft

1.0. AN Soft 1.0 yaitu perangkat lunak analisis butir soal dan butir angket yang mempermudah dalam menganalisis butir soal dan butir angket berdasarkan pada validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas distraktor sesuai dengan kaidah analisis instrumen yang benar. Salah satu contoh fasilitas pengukuran AN Soft 1.0 yang sesuai dengan kaidah analisis instrumen yang benar, yaitu dalam hal pengukuran validitas instrumen tidak menggunakan formula korelasi product moment tetapi menggunakan formula content validity (Gregory, 2007). Selain itu, perangkat lunak AN Soft 1.0 juga dilengkapi dengan fasilitas penelusuran kata kerja operasional hasil belajar kognitif, afektif, dan psikomotor beserta fasilitas untuk merevisi database kata kerja operasional hasil belajar tersebut. Namun, fasilitas untuk merevisi database kata kerja operasional hasil belajar tersebut hanya boleh dilakukan oleh admin, yaitu pengembang AN Soft 1.0 dan para ahli dalam bidang evaluasi pendidikan. Dengan demikian, penerapan perangkat lunak AN Soft 1.0 berpotensi mempermudah dalam membuat instrumen tes dan bukan tes yang berkualitas. AN Soft 1.0 adalah perangkat lunak analisis butir soal dan angket berbasis Microsoft Visual Foxpro 9.0 dengan pengendali Microsoft Office 2007 dan 2010. AN Soft 1.0 dapat beroperasi pada komputer/laptop dengan spesifikasi minimal, yaitu processor Pentium 4 dan RAM 256 mb. Selain itu, AN Soft 1.0 dapat beroperasi pada operating system Windows

95, 98, 98 SE, Me, NT 4.0, 2000, XP, 2003 Server, Vista, dan Windows 7.

Hasil penelitian ini diharapkan dapat bermanfaat bagi pihak-pihak sebagai berikut.

1. Mahasiswa Pendidikan Biologi UNS yang melakukan penelitian di sekolah

a. Memberikan kemudahan dalam melakukan analisis butir soal dan butir angket sekaligus menjadi solusi untuk permasalahan kualitas instrumen tes dan bukan tes.

b. Meningkatkan kompetensi guru biologi khususnya dalam hal evaluasi.

c. Mendukung pengembangan profesi guru biologi termasuk pengembangan keterampilan dalam menggunakan teknologi informasi dan komunikasi.

d. Perangkat lunak yang dibuat dapat menjadi cikal bakal pengembangan dari suatu perangkat lunak yang lebih baik dan lebih lengkap.

2. Sekolah

a. Meningkatkan kualitas pendidik untuk menunjang mutu sekolah

b. Meningkatkan hasil belajar siswa untuk mendukung prestasi sekolah.

3. LPTK

a. Menjalin kemitraan dengan sekolah untuk mendukung Tri Dharma Perguruan Tinggi.

b. Memberi wahana bagi calon lulusan LPTK untuk mendapatkan pengalaman nyata di dunia pendidikan

c. Perangkat lunak yang dibuat dapat menjadi cikal bakal pengembangan dari suatu perangkat lunak yang lebih baik dan lebih lengkap.

H. Asumsi dan Keterbatasan Pengembangan Dalam penelitian pengembangan perangkat lunak analisis butir soal dan butir angket ini terdapat asumsi dan keterbatasan sebagai berikut.

1. Asumsi

Analisis butir soal dan angket dapat menggunakan perangkat lunak.

2. Keterbatasan Belum ada mata kuliah yang spesifik pada perkuliahan S-1 Pendidikan untuk

BAB II LANDASAN TEORI

A. Kajian Pustaka

1. Evaluasi

a. Pengertian Evaluasi Pengertian evaluasi seringkali diartikan sama dengan pengukuran dan penilaian, padahal ketiganya memiliki arti yang berbeda, namun saling berkaitan satu sama lain. Arikunto (2010) mengemukakan bahwa mengukur adalah membandingkan sesuatu dengan suatu ukuran, sedangkan menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk. Adapun evaluasi meliputi kedua langkah tersebut, yaitu mengukur dan menilai. Pengukuran lebih bersifat kuantitatif, sedangkan penilaian bersifat kualitatif. Untuk evaluasi tidak hanya menyangkut gambaran secara kuantitatif, tetapi juga secara kualitatif.

Menurut pengertian bahasa kata evaluasi berasal dari bahasa Inggris evaluation yang berarti penilaian (tetapi dilakukan pengukuran terlebih dahulu). Sedangkan menurut pengertian istilah evaluasi merupakan kegiatan yang terencana untuk mengetahui keadaan suatu objek dengan menggunakan instrumen dan hasilnya dibandingkan dengan tolak ukur untuk memperoleh kesimpulan (Arikunto, 2010).

Sejalan dengan pendapat-pendapat yang dijelaskan di atas, Tyler (dalam Arikunto, 2010) mengemukakan bahwa evaluasi merupakan sebuah proses pengumpulan data untuk menentukan sejauh mana, dalam hal apa, dan bagian mana tujuan pendidikan sudah tercapai. Cronbanch dan Stufflebeam (dalam Arikunto, 2010) menambahkan bahwa proses evaluasi bukan sekedar mengukur sejauh mana tujuan tercapai, tetapi digunakan untuk membuat keputusan. Dari pengertian-pengertian tersebut, evaluasi dapat diartikan sebagai suatu kegiatan yang dilakukan untuk mengetahui keberhasilan suatu proses pendidikan.

b. Pentingnya Evaluasi Kegiatan evaluasi merupakan salah satu kegiatan yang penting dalam pendidikan, khususnya dalam kegiatan belajar mengajar. Dengan evaluasi kita akan mengetahui kelebihan dan kekurangan yang ada pada kegiatan pembelajaran yang telah dilakukan, sehingga kita bisa melakukan perbaikan. Ada tiga alasan utama mengapa dalam kegiatan pendidikan selalu memerlukan evaluasi, yaitu:

1) Untuk mengetahui apakah tujuan pendidikan sudah tercapai dengan baik dan untuk memperbaiki serta mengarahkan pelaksanaan proses belajar mengajar.

2) Kegiatan mengevaluasi terhadap hasil belajar merupakan salah satu ciri dari pendidik profesional.

3) Bila dilihat dari pendekatan kelembagaan, kegiatan pendidikan merupakan kegiatan manajemen, yang meliputi kegiatan: planning, programming, organizing, actuating, controlling, dan evaluating.

c. Fungsi Evaluasi Pendidikan merupakan salah satu aspek penting untuk kemajuan bangsa. Tetapi, pendidikan tanpa perkembangan (khususnya dalam hal prestasi belajar siswa dan umumnya dalam segala aspek pendidikan) tidak akan memberikan kontribusi yang besar bagi kemajuan bangsa. Kegiatan evaluasi akan memberikan gambaran tentang kemampuan dan kesulitan yang dihadapi siswa selama kegiatan pembelajaran, selain itu informasi tentang tingkat keberhasilan program pendidikan pun bisa diketahui. Fungsi evaluasi dalam pendidikan dan pengajaran dapat dikelompokkan menjadi empat fungsi sebagai berikut.

1) Untuk mengetahui kemajuan, perkembangan, serta keberhasilan siswa setelah mengalami atau melakukan kegiatan belajar selama jangka waktu tertentu. Hasil evaluasi tersebut, selanjutnya digunakan untuk menentukan lulus tidaknya seorang siswa dari suatu lembaga pendidikan tertentu.

2) Untuk keperluan Bimbingan Konseling (BK). Hasil-hasil evaluasi yang telah dilaksanakan oleh guru terhadap siswanya dapat dijadikan sumber informasi atau data bagi pelayanan BK oleh para konselor sekolah atau guru pembimbing lainnya.

3) Untuk mengetahui tingkat keberhasilan program pengajaran. Pengajaran sebagai suatu sistem terdiri dari beberapa komponen yang saling berkaitan satu sama lain. Komponen-komponen yang dimaksud antara lain: tujuan, materi pengajaran, metode dan kegiatan belajar mengajar, alat dan sumber pembelajaran, prosedur, serta alat evaluasi.

4) Untuk keperluan pengembangan dan perbaikan kurikulum sekolah.

Pendidikan itu terdiri dari berbagai komponen, diantaranya: guru, peserta didik, sekolah, orang tua, dan masyarakat. Oleh karena itu, untuk lebih jelasnya, fungsi evaluasi pendidikan bagi komponen tersebut dapat dirinci sebagai berikut. 1). Fungsi evaluasi pendidikan bagi guru

a) Mengetahui kemajuan belajar peserta didik.

b) Mengetahui kedudukan masing-masing individu peserta didik dalam kelompoknya.

c) Mengetahui kelemahan-kelemahan cara belajar mengajar dalam Proses Belajar Mengajar (PBM).

d) Memperbaiki PBM.

e) Menentukan kelulusan peserta didik. 2). Fungsi evaluasi pendidikan bagi peserta didik

a) Mengetahui kemampuan dan hasil belajar.

b) Memperbaiki cara belajar.

c) Menumbuhkan motivasi dalam belajar. 3). Fungsi evaluasi pendidikan bagi sekolah

a) Mengukur mutu hasil pendidikan.

b) Mengetahui kemajuan dan kemunduran sekolah.

c) Membuat keputusan kepada peserta didik.

4). Fungsi evaluasi pendidikan bagi orang tua

a) Mengetahui hasil belajar anaknya.

b) Meningkatkan pengawasan dan bimbingan serta bantuan kepada anaknya dalam usaha belajar.

c) Mengarahkan pemilihan jurusan, atau jenis sekolah pendidikan lanjutan bagi anaknya. 5). Fungsi evaluasi pendidikan bagi masyarakat dan pemakai jasa pendidikan

a) Mengetahui kemajuan sekolah.

b) Ikut mengadakan kritik dan saran perbaikan bagi kurikulum pendidikan pada sekolah tersebut.

c) Lebih meningkatkan partisipasi masyarakat dalam usahanya membantu lembaga pendidikan.

d. Tujuan Evaluasi Sesuai dengan fungsi evaluasi yang dijelaskan di atas, evaluasi mempunyai empat tujuan sebagai berikut.

1) Mendeskripsikan kecakapan belajar siswa, sehingga dapat diketahui kelebihan dan kekurangannya dalam berbagai bidang studi/mata pelajaran yang dbutirpuhnya.

2) Mengetahui keberhasilan proses pendidikan dan pengajaran di sekolah yakni seberapa jauh keefektifannya dalam mengubah tingkah laku para siswa ke arah tujuan yang diharapkan.

3) Menentukan tindak lanjut hasil penelitian, yakni melakukan perbaikan dan penyempurnaan dalam hal program pendidikan dan pengajaran serta strategi pelaksanaannya.

4) Memberikan pertanggungjawaban dari pihak sekolah kepada pihak-pihak yang berkepentingan. Pihak yang dimaksud meliputi: pemerintah, masyarakat, dan para orang tua siswa.

Dalam hal kurikulum, evaluasi pendidikan memiliki tujuan untuk melakukan penilaian total terhadap pelaksanaan kurikulum pada suatu lembaga Dalam hal kurikulum, evaluasi pendidikan memiliki tujuan untuk melakukan penilaian total terhadap pelaksanaan kurikulum pada suatu lembaga

e. Ruang Lingkup Evaluasi Stufflebeam (dalam Thoha, 2001) membagi evaluasi pendidikan menjadi empat ruang lingkup, yaitu:

1) Evaluasi masukan (input) adalah evaluasi yang berkaitan dengan kualitas masukan yang berupa calon peserta didik, baik menyangkut faktor kemampuan intelektualnya maupun aspek kepribadian yang bersifat nonintelektif.

2) Evaluasi proses. Merupakan evaluasi yang sasarannya adalah proses belajar mengajar, termasuk faktor instrumentalnya, seperti: evaluasi terhadap kemampuan guru dalam mengajar, kesesuaian metode yang digunakan oleh guru, evaluasi kurikulum, evaluasi terhadap media pendidikan, dan kelembagaan pendidikan.

3) Evaluasi produk (output) adalah penilaian pendidikan yang sasarannya hasil akhir suatu proses pendidikan, yaitu peserta didik.

4) Evaluasi konteks. Merupakan evaluasi yang berkaitan dengan masalah- masalah kompleks yang melibatkan hal-hal di luar proses pendidikan tetapi ia secara langsung mempengaruhi proses maupun hasil pendidikan.

2. Taksonomi Tujuan Pendidikan Menurut Bloom Hasil belajar adalah kemampuan-kemampuan yang dimiliki siswa setelah ia menerima pengalaman belajarnya. Untuk mengevaluasi hasil belajar siswa yang diharapkan, diperlukan tujuan yang bersifat operasional yaitu tujuan berupa tingkah laku yang dapat dikerjakan dan diukur. Tujuan berkaitan dengan sifat secara operasional dan tujuan pembelajaran khusus.

Benyamin Bloom mengklasifikasikan kemampuan hasil belajar ke dalam tiga kategori sebagai berikut.

a. Ranah kognitif, meliputi kemampuan menyatakan kembali konsep atau prinsip yang telah dipelajari dan kemampuan intelektual.

b. Ranah afektif, berkenaan dengan sikap dan nilai yang terdiri atas aspek penerimaan, tanggapan, penilaian, pengelolaan, dan penghayatan (karakterisasi).

c. Ranah psikomotorik, mencakup kemampuan yang berupa keterampilan fisik (motorik) yang terdiri dari gerakan refleks, keterampilan gerakan dasar, kemampuan perseptual, ketepatan, keterampilan kompleks, serta ekspresif dan interperatif.

Taksonomi tujuan pembelajaran dalam kawasan kognitif menurut Bloom terdiri atas enam tingkatan yaitu pengetahuan, pemahaman, penerapan, analisis, evaluasi dan mencipta. Keenam jenis taksonomi tersebut diuraikan satu per satu sebagai berikut.

a. Pengetahuan Pengetahuan adalah kemampuan yang paling rendah tetapi paling dasar dalam kawasan kognitif. Kemampuan untuk mengetahui adalah kemampuan untuk mengenal atau mengingat kembali sesuatu objek, ide, prosedur, prinsip atau teori yang pernah dbutirukan dalam pengalaman tanpa memanipulasikannya dalam bentuk atau simbol lain. Kemampuan mengetahui sedikit lebih rendah dibawah kemampuan memahami, karena itu orang yang mengetahui belum tentu memahami atau mengerti apa yang diketahuinya.

b. Pemahaman Pemahaman adalah kemampuan untuk memahami segala pengetahuan yang diajarkan seperti kemampuan mengungkapkan dengan struktur kalimat lain, membandingkan, menafsirkan, dan sebagainya. Kemampuan memahami dapat juga disebut dengan istilah “mengerti”.

Kemampuan-kemampuan yang tergolong dalam taksonomi ini, mulai dari yang terendah sampai yang tertinggi ialah:

1) Translasi, yaitu kemampuan untuk mengubah simbol tertentu menjadi simbol

2) Interpretasi, yaitu kemampuan untuk menjelaskan makna yang terdapat di dalam simbol, baik simbol verbal maupun nonverbal.

3) Ekstrapolasi, yaitu kemampuan untuk melihat kecenderungan atau arah atau kelanjutan dari suatu temuan.

c. Penerapan Penerapan ialah kemampuan untuk menggunakan konsep, prinsip, prosedur atau teori tertentu pada situasi tertentu. Seseorang menguasai kemampuan ini jika ia dapat memberi contoh, menggunakan, mengklasifikasikan, memanfaatkan, menyelesaikan, dan mengidentifikasikan mana yang sama.

d. Analisis Analisis adalah usaha memilah suatu integritas menjadi unsur-unsur atau bagian-bagian sehinggga jelas susunannya. Secara rinci Bloom mengemukakan tiga jenis kemampuan analisis, yaitu: Menganalisis unsur, Menganalisis hubungan, dan Menganalisis prinsip-prinsip organisasi.

e. Evaluasi Evaluasi merupakan kemampuan bila seseorang dapat melakukan penilaian terhadap suatu situasi, nilai-nilai, atau ide-ide. Evaluasi ialah kemampuan untuk mengambil keputusan, menyatakan pendapat atau memberi penilaian berdasarkan kriteria-kriteria tertentu baik kualitatif maupun kuantitatif.

f. Mencipta Mencipta merupakan kemampuan tertinggi yaitu bila seseorang dapat menggabungkan beberapa unsur menjadi suatu bentuk kesatuan. Ada tiga macam proses kognitif yang tergolong dalam kategori ini, yaitu: membuat (generating), merencanakan (planning), dan memproduksi (producing).

Taksonomi tujuan pengajaran pada kawasan afektif dikategorikan dalam lima jenis kategori yang menurut W. Gulo (2002) yaitu: penerimaan, tanggapan, penilaian, pengelolaan, dan penghayatan (karakterisasi).

a. Penerimaan, meliputi penerimaan secara pasif terhadap suatu masalah, situasi, a. Penerimaan, meliputi penerimaan secara pasif terhadap suatu masalah, situasi,

b. Tanggapan, berkenaan dengan jawaban dan kesenangan menanggapi atau merealisasikan sesuatu yang sesuai dengan nilai-nilai yang dianut masyarakat. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek tanggapan adalah mengajukan, melaporkan, menampilkan, mendukung, dan sebagainya.

c. Penilaian, berkenaan dengan nilai dan kepercayaan terhadap gejala atau stimulus tertentu. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek penilaian adalah meyakini, mengusulkan, menekankan, meyakinkan, dan sebagainya.

d. Pengelolaan, meliputi konseptualisasi nilai-nilai menjadi suatu sistem nilai. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek pengelolaan adalah mempertahankan, mengubah, memadukan, membentuk pendapat, dan sebagainya.

e. Penghayatan (karakterisasi), keterpaduan semua sistem nilai yang telah dimiliki seseorang yang mempengaruhi pola kepribadian dan tingkah lakunya. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek penghayatan adalah mendengarkan, memecahkan, mempengaruhi, dan sebagainya. Selain ranah kognitif dan ranah afektif, ranah psikomotorik termasuk ke dalam taksonomi tujuan pembelajaran menurut Bloom, seperti yang telah dijelaskan sebelumnya.

Taksonomi pembelajaran terhadap ranah psikomotorik secara garis besar dibedakan ke dalam empat tahap, yaitu:

a. Meniru merupakan kemampuan untuk melakukan sesuatu sesuai dengan contoh yang diamatinya walaupun belum mengerti makna atau hakikat dari keterampilanitu. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek ini adalah mengkonstruksi, menggabungkan, mengatur, menyesuaikan, dan sebagainya.

b. Memanipulasi merupakan kemampuan dalam melakukan suatu tindakan seperti yang diajarkan, dalam arti mampu memilih yang diperlukan. Kata kerja yang sering digunakan dalam mengukur aspek ini adalah menempatkan, membuat, memanipulasi, merancang, dan sebagainya.

c. Pengalamiahan merupakan suatu penampilan tindakan dimana hal-hal yang diajarkan (sebagai contoh) telah menjadi suatu kebiasaan dan gerakan-gerakan yang ditampilkan lebih meyakinkan. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek ini diantaranya adalah memutar, memindahkan, menarik, mendorong, dan sebagainya.

d. Artikulasi merupakan suatu tahap dimana seseorang dapat melakukan suatu keterampilan yang lebih komplek terutama yang berhubungan dengan gerakan interpretatif. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek ini adalah menggunakan, mensketsa, menimbang, menjeniskan, dan sebagainya.

3. Kata Kerja Operasional Hasil belajar Kognitif, Afektif, dan Psikomotor

a. Ranah Kognitif Ranah kognitif meliputi kemampuan menyatakan kembali konsep atau prinsip yang telah dipelajari dan kemampuan intelektual (knowledge). Sebagian besar tujuan instruksional berada dalam ranah kognitif. Kemudian Bloom membagi ranah kognitif kedalam enam jenjang kemampuan secara hierarkis, yaitu:

1) Recall of Data (Mengingat/C1) Merupakan kemampuan menyatakan kembali fakta, konsep, prinsip, prosedur atau istilah yang telah dipelajari tanpa harus memahami atau dapat menggunakannya. Tingkatan ini merupakan tingkatan yang paling rendah namun menjadi prasyarat bagi tingkatan selanjutnya. Kemampuan yang dimiliki hanya kemampuan menangkap informasi kemudian menyatakan kembali informasi tersebut tanpa harus memahaminya. Contoh kata kerja yang digunakan, yaitu menyebutkan, mendefinisikan, menggambarkan, dll.

2) Comprehension (Memahami/C2) Merupakan salah satu jenjang kemampuan dalam proses berpikir dimana siswa dituntut untuk memahami yang berarti mengetahui tentang sesuatu hal dan dapat melihatnya dari beberapa segi. Pada tingkatan ini, selain hapal siswa juga harus memahami makna yang terkandung misalnya dapat menjelaskan suatu gejala, dapat menginterpretasikan grafik, bagan atau diagram serta dapat menjelaskan konsep atau prinsip dengan kata-kata sendiri. Contoh kata kerja yang digunakan, yaitu menyajikan, menginterpretasikan, menjelaskan, dll.

3) Application (Menerapkan/C3) Merupakan kemampuan berpikir lebih tinggi daripada pemahaman. Jenjang penerapan merupakan kemampuan menggunakan prinsip, teori, hukum, aturan, maupun metode yang dipelajari pada situasi baru atau pada situasi kongkrit. Contoh kata kerja yang digunakan, yaitu mengaplikasikan, menghitung, menunjukkan, dll.

4) Analysis (Menganalisis/C4) Merupakan kemampuan untuk menganalisis atau merinci suatu situasi, atau pengetahuan menurut komponen yang lebih kecil atau lebih terurai dan memahami hubungan diantara bagian yang satu dengan yang lain. Contoh kata kerja yang dipakai, yaitu menganalisis, membandingkan, mengklasifikasikan. dll.

5) Evaluation (Mengevaluasi/C5) Merupakan kemampuan untuk membuat pertimbangan (penilaian) terhadap suatu situasi, nilai-nilai atau ide-ide. Kemampuan ini merupakan kemampuan yang dapat melakukan penilaian terhadap situasi, nilai-nilai atau ide-ide. Evaluasi adalah pemberian keputusan tentang nilai sesuatu yang mungkin dilihat dari segi tujuan, gagasan, cara kerja, materi dan kriteria tertentu. Untuk dapat membuat suatu penilaian, seseorang harus memahami, dapat menerapkan, menganalisis terlebih dahulu. Contoh kata kerja yang digunakan yaitu menilai, menafsirkan, menaksir, memutuskan, dll.

6) Create (Mencipta/C6) Merupakan kemampuan untuk menggabungkan beberapa unsur menjadi suatu bentuk kesatuan. Kemampuan ini adalah kemampuan tertinggi dari kemampuan lainnya. Untuk dapat mencipta, seseorang harus memahami, dapat menerapkan, menganalisis serta mengevaluasi terlebih dahulu. Contoh kata kerja yang digunakan, yaitu: membuat, merencanakan, memproduksi, dll

b. Ranah Afektif Ranah afektif berkenaan dengan sikap, apresiasi, dan motivasi siswa dalam kegiatan belajar mengajar. Kartwohl & Bloom membagi ranah afektif menjadi lima aspek, yaitu:

1) Receiving (Penerimaan) Merupakan tingkat afektif yang terendah, meliputi penerimaan secara pasif terhadap suatu masalah, situasi, gejala, nilai dan keyakinan. Misalnya mendengarkan dengan seksama penjelasan guru energi dan panas.

2) Responding (Jawaban) Merupakan bagian afektif yang meliputi keinginan dan kesenangan menanggapi atau merealisasikan sesuatu sesuai dengan nilai-nilai yang dianut masyarakat. Misalnya menyerahkan laporan praktikum/tugas tepat waktu.

3) Valuing (Penilaian) Mengacu pada nilai dan kepercayaan terhadap gejala atau stimulus tertentu. Misalnya menunjukkan rasa tanggung jawab terhadap alat-alat laboratorium yang dipakai waktu praktikum dan bersikap jujur dalam kegiatan pembelajaran.

4) Organization (Organisasi) Meliputi konseptualisasi nilai-nilai menjadi satu sistem nilai. Sikap- sikap yang membuat lebih konsisten dapat menimbulkan konflik-konflik internal dan membentuk suatu sistem nilai internal. Sikap yang ditunjukkan misalnya mampu menimbang akibat positif dan negatifnya tentang kemajuan sains terhadap kehidupan umat manusia.

5) Characterization (Karakteristik) Merupakan keterpaduan semua sistem nilai yang telah dimiliki seseorang yang mempengaruhi pola kepribadian dan tingkah lakunya. Misalnya bersedia mengubah pendapat jika ditunjukkan bukti-bukti yang tidak mendukung pendapatnya.

c. Ranah Psikomotor Ranah psikomotor tampak dalam bentuk keterampilan manual fisik (skills) dan kemampuan bertindak individu. Harrow (dalam Arikunto, 2010) mengembangkan ranah psikomotor dengan enam jenjang, yaitu:

1) Gerakan refleks, gerakan yang tidak disadari.

2) Keterampilan gerakan-gerakan dasar, yaitu gerakan yang menuntut kepada keterampilan yang sifatnya kompleks.

3) Kemampuan perseptual, termasuk membedakan visual, auditif, motoris.

4) Kemampuan dalam bidang fisik, misalnya kekuatan, keharmonisan dan ketepatan.

5) Gerakan-gerakan (skills), mulai dari keterampilan sederhana sampai kompleks.

6) Kemampuan yang berkenaan dengan komunikasi, seperti gerakan ekspresif & interpretatif.

4. Analisis Butir Soal Hal-hal yang perlu diperhatikan dalam melakukan analisis butir soal

adalah sifat dari instrumen soal tersebut. Sebagai contoh pada saat menganalisis sebuah instrumen soal pilihan ganda berbeda dengan pada saat menganalisis soal uraian yaitu soal berbobot yang memiliki rentang skor tiap butir soal. Pada soal pilihan ganda dapat dilakukan analisis validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas distraktor, sedangkan pada soal uraian tidak dilakukan analisis efektivitas distraktor. Selain itu, Analisis reliabilitas soal uraian tidak mungkin menggunakan formula KR-20 atau KR-21 seperti pada soal pilihan ganda, melainkan akan lebih tepat jika formula yang digunakan adalah formula

Alpha (Azwar, 2012; Linn & Groundlund, 2000; Widoyoko, 2010). Keterangan lebih detail akan dijelaskan sebagai berikut.

a. Validitas Validitas berasal dari bahasa Inggris dari kata validity yang berarti keabsahan atau kebenaran. Dalam konteks alat ukur atau instrumen asesmen, validitas berarti sejauh mana ketepatan alat ukur dalam melakukan fungsi ukurnya. Sebuah instrumen yang valid akan menghasilkan data yang tepat seperti yang diinginkan. Sebagai contoh, jika kita ingin mengetahui berat maka alat ukur yang tepat adalah timbangan/neraca bukan meteran atau alat yang lain. Dengan kata lain, sifat valid memberikan pengertian bahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yang diinginkan.

Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek dan mengendalikannya. Berbeda halnya jika kita akan melakukan pengukuran dalam dunia pembelajaran atau dunia pendidikan, tidak sesederhana seperti pada pengukuran berat ataupun panjang. Untuk mengetahui alat ukur prestasi belajar apakah valid atau tidak maka perlu dipelajari dengan hati -hati.

Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak berlaku secara umum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran yang baik (valid) untuk suatu tujuan tertentu yang sepesifik tetapi tidak valid untuk tujuan yang lain atau bahkan untuk tujuan yang sama pada kelompok yang lain.

Linn & Groundlund (2000) mengemukakan hakikat validitas tes dan asesmen sebagai berikut.

1) Validitas menyatakan ketepatan interpretasi hasil bukan pada prosedurnya.

2) Validitas merupakan persoalan yang berkaitan dengan derajat (tingkatan), sebagai konsekuensinya kita harus menghindari pemikiran hasil asesmen sebagai valid atau tidak valid. Oleh karena validitas adalah persoalan derajad maka sebuah instrumen dapat dikategorikan mempunyai derajad validitas tinggi, sedang, dan rendah.

3) Validitas selalu bersifat khusus untuk penggunaan atau interpretasi tertentu. Tidak ada asesmen yang valid untuk semua tujuan. Sebagai contoh, hasil tes aritmatika mungkin mempunyai tingkat validitas yang tinggi untuk kemampuan hitung, validitas yang rendah untuk alasan-alasan aritmatika, dan mempunyai derajat validitas sedang untuk memprediksi kesuksesan prestasi matematika yang akan datang.

4) Validitas merupakan kesatuan konsep. Hakikat konsep validitas dipandang sebagai sebuah kesatuan konsep berdasark an berbagai macam bagian dari fakta.

5) Validitas melibatkan sebuah keputusan evaliatif yang menyeluruh.

Formula untuk menentukan besarnya validitas secara matematis dirumuskan sebagai berikut (Gregory, 2007).

Content Validity (CV) =

A + B+ C + D

Formula content validity di atas memerlukan 2 orang ahli/panelis untuk memeriksa kecocokan antara indikator dengan butir-butir instrumen, dalam bentuk menilai relevan (skor 3-4) atau kurang relevan (skor 1-2) masing-masing indikator butir bila dicocokkan dengan butir-butirnya. Dari formula di atas, A adalah jumlah butir yang kurang relevan menurut kedua ahli/panelis, B adalah jumlah butir yang relevan menurut ahli 1 dan yang kurang relevan menurut ahli 2,

C adalah jumlah butir yang kurang relevan menurut ahli 1 dan yang relevan menurut ahli 2, dan D adalah jumlah butir yang relevan menurut kedua ahli/panelis. Hal yang diperhatikan ahli/panelis dalam menentukan kriteria butir adalah kesesuaian dengan indikator butir, konstruk butir dan tata bahasa. Dengan demikian, content validity dirumuskan untuk menghitung validitas keseluruhan instrumen. Kriteria yang digunakan adalah jika CV > 0,700, maka instrumen tersebut dinyatakan valid. Jika CV < 0,700 maka perlu merevisi butir-butir yang dinyatakan kurang relevan oleh ahli/panelis.

b. Reliabilitas Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi jika tes terebut memberikan data hasil yang ajeg (tetap) walaupun diberikan pada waktu yang berbeda kepada responden yang sama. Hasil tes yang tetap atau seandainya berubah maka perubahan itu tidak signifikan maka tes tersebut dikatakan reliabel. Oleh karena itu, reliabilitas sering disebut dengan keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya.

Dari uraian di atas, sebuah alat ukur yang baik harus valid dan reliabel. Walaupun demikian, validitas lebih penting dibandingkan dengan reliabilitas. Reliabilitas merupakan penyokong validitas. Sebuah alat ukur yang valid selalu reliabel. Akan tetapi alat ukur yang reliabel belum tentu valid. Seperti halnya validitas, reliabilitas juga merupakan tingkatan. Tingkat atau kadar reliabilitas dinyatakan dengan koefisien reliabilitas (Azwar, 2012).

Mengukur tingkat reliabilitas tes pilihan ganda berbeda dengan tes uraian (berbobot). Untuk mengukur tingkat reliabilitas tes pilihan ganda lebih tepat menggunakan formula KR-20 atau KR-21 (Linn & Gronlund 2000; Widoyoko, 2010). Jika membandingkan tingkat reliabilitas yang dihitung dengan KR-20 dan KR-21, maka KR-20 cenderung memberikan hasil yang lebih tinggi dari KR-21 (Riduan, 2004). Untuk mengukur tingkat reliabilitas tes uraian (berbobot) lebih tepat menggunakan formula Alpha (Azwar, 2012; Linn & Groundlund 2000; Widoyoko, 2010)

c. Tingkat Kesukaran (Dificulty Index) Indeks kesukaran butir sebagaimana dinyatakan oleh Allen & Yen (1986) adalah proportion of examinees who get that butir correct. Senada dengan mereka, Sax (1980) menulis bahwa indeks kesukaran adalah proporsi peserta ujian yang menjawab benar. Azwar (2003) menyatakan dengan lebih lugas bahwa indeks kesukaran butir adalah rasio penjawab butir dengan benar dan banyaknya penjawab butir.

Formula untuk menentukan besarnya indeks kesukaran secara matematis dirumuskan oleh Azwar (2003) sebagai berikut.

P adalah indeks kesukaran butir, n 1 adalah jumlah peserta tes yang

menjawab benar sedangkan N adalah banyaknya siswa yang menjawab butir soal tersebut. Dengan demikian untuk menghitung indeks kesukaran butir dilakukan dengan tidak membagi kelompok peserta tes kedalam kelompok atas dan bawah sebagaimana untuk menentukan daya beda.