Reliabilitas. Analisis Kualitas Soal.

digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id 40 tingkat kesulitan di atas 0,7 dianggap terlalu mudah. Kriteria indeks daya beda butir soal yang bo leh digunakan adalah ≥ 0,3 . 59 Menurut Crocker dan Algina tingkat kesukaran atau proporsi adalah nilai rata-rata dari kelompok peserta tes. Oleh karena itu tingkat kesukaran merupakan rata-rata dari suatu distribusi skor kelompok dari suatu soal. Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Menurut Sukiman “Butir soal yang digunakan untuk keperluan ulangan atau ujian semester memiliki tingkat kesukaran yang sedang”. Indeks tingkat kesukaran butir soal yang baik antara 0,3- 0,7. 60 Jadi dalam penelitian ini intrumen penlaian hasil belajar yang dikembangkan harus memiliki indeks tingkat kesukaran soal pada rentang 0,3- 0,7.

4. Daya Pembeda Soal.

Yang dimaksud dengan daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai dengan siswa yang kurang pandai. Logikanya adalah siswa yang pandai akan lebih mampu menjawab mendapat skor lebih baik dibanding dengan siswa yang kurang. 61 Untuk menentukan daya pembeda pada soal uraian dilakukan dengan cara mengurutkan seluruh peserta tes berdasarkan perolehan skor total dari skor yang tinggi ke skor rendah. Setelah itu seluruh peserta tes 59 Djemari Mardapi, Teknik Penyusunan Instrumen Tes, 143. 60 Sukiman, Pengembangan Sistem Evaluasi. Yogyakarta: Insan Madani, 2012 201. 61 Daryanto, Evaluasi Pendidikan. 183. digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id 41 dibagi menjadi 27 kelompok atas, yaitu kelompok yang memiliki skor total tinggi dan 27 kelompok bawah, yaitu kelompok yang memiliki skor rendah. 62 Menurut Suharsimi Arikunto Butir soal yang baik adalah butir soal yang mempunyai indeks diskriminasi 0,3 sampai dengan 0,70. 63 Tindak lanjut butir soal sesudah dianalisis daya pembedanya sebagai berikut: 64 a. Butir soal yang memiliki daya pembeda baik disimpan. b. Butir soal dengan daya pembeda rendah, ada dua kemungkinan tidak lanjut yaitu: 1 ditelusuri untuk kemudian diperbaiki dan selanjutnya digunakan kembali dalam tes hasil belajar mendatang guna mengetahui daya pembedanya meningkat atau tidak. 2 Dibuang. c. Butir item yang angka indeks diskriminasinya bertanda negatif, sebaiknya dibuang karena kualitas butir soalnya sangat jelek. Dalam penelitian ini intrumen penilaian hasil belajar yang dikembangkan harus memiliki kriteria indeks daya beda soal pada rentangan 0,3 sampai 0,70. 62 Sumarna Surapranata, Analisis, Validitas, 31. 63 Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan Jakarta: Bumi Aksara, 2013 23. 64 Anas Sudijono, Pengantar Evaluasi, 408. digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id digilib.uinsby.ac.id

BAB V KESIMPULAN DAN SARAN

A. Kesimpulan.

Berdasarkan tujuan penelitian, hasil analisis dan pembahasan dalam penelitian ini, diperoleh kesimpulan sebagai berikut: 1. Proses pengembangan Instrumen penilaian hasil belajar berpedoman pada model pengembangan Djemari Mardapi yang terdiri dari tujuh langkah dan terbagi menjadi dua tahap, yaitu tahap perancangan dan tahap uji coba. Pada tahap perancangan dihasilkan kisi-kisi tes, instrumen penilaian berupa tes tertulis bentuk uraian non objektif yang terdiri dari enam butir soal yang disusun berdasarkan perjenjangan Taksonomi Bloom edisi revisi, telaah para ahli yang menghasilkan rata-rata total validitas sebesar 3,62 dan revisi dari instrumen yang dikembangkan. Pada tahap uji coba diperoleh karakteristik instrumen penilaian yang dikembangkan 2. Karakteristik instrumen penilaian hasil belajar yang dikembangkan dalam penelitian ini adalah sebagai berikut: instrumen memiliki parameter tingkat kesulitan pada rentang 0,3-0,7 dengan indeks kesulitan terrendah adalah 0,53 dan tertinggi adalah 0,70. Daya pembeda berada pada rentang 0,3-0,4 dengan indeks daya pembeda terrendah adalah 0,24 dan tertinggi 0,36. Instrumen memiliki reliabilitas yang sangat tinggi yaitu 0,819.