Model Analisis IRT Kriteria Penilaian Kualitas Tes Hasil Belajar

Dari keempat model itu tidak sama penekanannya dan sudah barang tentu tiap-tiap model itu memiliki kelebihan dan kekurangan. Kelebihan dan kekurangan itu dapat diklasifkasikan sesuai dengan jumlah parameter yang ditentukan pada masing-masing model dan tujuan menggunakan model yang bersangkutan. Adapun contoh kurva ciri soal model satu parameter atau Rasch terlihat seperti pada grafik di bawah ini. Kalibrasi Butir Soal dan Pengukuran Kemampuan Orang Kalibrasi butir soal dan pengukuran kemampuan orang merupakan proses estimasi parameter pada model respon butir. Model persamaan dasar Rasch adalah model probabilistik yang mencakup hasil dari suatu interaksi butir soal-orang. Proses mengestimasi kemampuan orang dinamakan pengukuran, sedangkan proses mengestimasi parameter tingkat kesukaran butir soal dinamakan kalibrasi. Jadi kalibrasi soal merupakan proses penyamaan skala soal yang didasarkan pada tingkat kesukaran butir soal dan tingkat kemampuan siswa. Adapun ciri suatu skala adalah mempunyai titik awal, biasanya 0, dan mempunyai satuan ukuran atau unit pengukuran. Prosedur estimasi dapat dilakukan dengan tangan atau komputer. Ada beberapa langkah yang dapat dilakukan dalam mengkalibrasi butir dan menguki.r kemampuan orang dengan tangan Wright and Linacre, 1992: 32-45 seperti berikut ini: 1 Menyusun Jawaban Peserta Didik untuk Setiap Butir Soal Ke dalam Tabel Dalam menyusun jawaban peserta didik untuk setiap butir ke dalam tabel perlu disediakan kolom: a siswa, b butir soal, c skor siswa, dan Data berbentuk angka 1 untuk jawaban benar dan 0 untuk jawaban salah. 2 Mengedit data Berdasarkan model Rasch, butir soal yang dijawab siswa betul semua atau salah semua dan siswa yang dapat menjawab dengan betul semua atau salah semua, soal atau siswa yang bersangkutan tidak dianalisis atau dikeluarkan dari tabel. Pada langkah kedua ini perlu disediakan tambahan kolom: - proporsi skor siswa dan - proporsi skor butir soal. Proporsi skor peserta didik adalah skor siswa : jumlah butir soal; sedangkan proporsi skor soal adalah skor soal : jumlah siswa. 3 Menghitung distribusi skor soal Berdasarkan skor soal yang sudah diedit, maka skor soal diklasifikasikan menjadi beberapa kelompok berdasarkan skor yang sama. Untuk memudahkan penghitungan Distribusi skor butir soal, maka perlu disusun beberapa kolom di dalam tabel, seperti kolom: - Kelompok skor soal, kelompok skor yang didasarkan pada skor soal yang sama, kolom ini berhubungan langsung dengan kolom 2 dan kolom 3; - Nomor butir soal, - Skor soal si, - Frekuensi soal fi yaitu jumlah soal yang memiliki sama; - Proporsi benar pi yaitu si : jumlah peserta tes; - Proporsi salah 1-pi, 7 logit log odds unit-proporsi salah xi yaitu Ln [1 -PiPi], - Hasil kali frekuensi soal dengan logit proporsi salah fixi, - Kuadrat logit proporsi salah fixi2 , 10 hasil kali frekuensi soal dengan kuadrat logit proporsi salah, 11 inisial kalibrasi butir soal yaitu di° = Xi - nilal rata-rata skor soal, dan 12 hasil kali antara frekuensi soal dengan kuadrat nilai rata-rata skor coal FIX ?. 4 Menghitung distribusi skor peserta didik. Untuk memudahkan di dalam menghitung distribusi skor peserta didik perlu disusun beberapa kolom yaitu kolom: - Kemungkinan skor peserta didik r yang disusun secara berurutan dimulai dan skor terendah sampai tertinggi; - Skor peserta didik, yaitu berupa toli skor peserta didik; - Frekuensi peserta didik nr yang memperoleh skor; - Proporsi benar pi yaitu skor peserta didik dibagi jumlah soal, - Logit proporsi benar yr yaitu ln [pr1-pr]; - Perkalian antara frekuensi siswa dengan logit proporsi benar nryr; - Logic proporsi benar yang dikuadraktan yr kuadrat; - Hasil perkalian antara frekuensi peserta didik dengan logic proporsi benar yang dikuadratkan nryr kuadrat; - Inisial pengukuran kemampuan peserta didik br yr; 10 perkalian antara frekuensi peserta didik dengan nilai rata-rata skor peserta didik nryr kuadrat. Menghitung faktor ekspansi kemampuan peserta didik x dan kesukaran butir soal Y. Dalam menghitung faktor ekspansi diperlukan variasi distribusi kelompok skor soal U dan variance distribusi kelompok skor siswa V. Faktor ekspansi kemampuan peserta didik terhadap keluasan tes adalah X = [I 4-U2,891- UV8,35] 2 Faktor ekspansi kemampuan peserta didik terhadap penyebaran sampel adalah X =_ [ 1+U2,89 1-UV8,35] 5 Menghitung tingkat kesukaran dan kesalahan standar butir soal Dalam menghitung tingkat kesukaran dan kesalahan standar soal perlu disusun beberapa kolom di dalam tabel, yaitu kolom: - Kelompok skor soal 1; - Nomor soal; - Inisial kalibrasi soal d; - Faktor ekspansi kesukaran soal terhadap penyebaran sampel Y; tingkat kesukaran soal atau Yd; = d;; - Skor soal S; - Kesalahan standar kalibrasi soal yang dikoreksi [SE] atau SE = [ NSi N-Si]ll2 6 Menghitung tingkat kemampuan dan kesalahan standar siswa Dalam menghitung tingkat kemampuan dan kesalahan standar siswa disusun beberapa kolom, yaitu kolom: - Kemungkinan skor siswa r; - Initial pengukuran kemampuan siswa br; - Faktor ekspansi kemampuan siswa terhadap keluasan tes X; - Tingkat kemampuan siswa br atau Xbr; - Kesalahan standar pengukuran kemampuan siswa yang dikoreksi [SE br] yaitu X [ Lr L-r]112 ; - Peserta tes. 7 Menghitung probabilitas atau peluang menjawab benar setiap butir soal Untuk menghitung peluang menjawab benar setiap butir pada model Rasch atau model satu parameter digunakan rumus berikut ini. Estimasi data yang lebih teliti dan akurat hasilnya adalah menggunakan komputer seperti menggunakan program Bigsteps. Dalam program Bigsteps, estimasi data digunakan metode Appoximation Maximum Likelihood PROX dan Unconditional Maximum Likelihood UCON. Untuk menghasilkan hasil yang akurat, estimasi data dengan komputer dapat melakukan iterasi maksimum untuk metode PROX, misal bisa sampai 20 kali kemudian dilanjutkan dengan metode UCON sampai dengan 50 kali tergantung banyaknya data. Perbedaan hasil kalibrasi pada setiap iterasi semakin lama semakin kecil dan akan berhenti bila prosesnya sudah terpenuhi converge atau lebih kecil dari 0,01. Kriteria data sesuai dengan model Rasch adalah apabila hasil korelasi point bhiserial tidak negatif dan outfitnya 2 baik outfit butir soal maupun outfit orang. Hal ini menunjukkan bahwa data adalah fit dengan model. Maksudnya bahwa data soal sesuai dengan model Rasch atau valid yang memiliki mean= 0 dan SD=1. Metode pengujian fit tergantung pada jumlah butir soal dalam tes: a tes sangat pendek 10 atau beberapa butir, b tes pendek 11-20 butir, atau c tes panjang 20 butir. Output orang maksudnya statistik orang menunjukkan bagaimana perilaku yang tidak diharapkan pada butir soal yang mempunyai tingkat kesukaran jauh dengan kemampuan orang yang bersangkutan. Adapun Output butir maksudnya statistik butir soal menunjukkan bagaimana perilaku yang tidak diharapkan dari orang yang mempunyai kemampuan lebih dengan tingkat kesukaran butir yang bersangkutan. Dalam pelaksanaannya, analisis secara IRT tidak serumit seperti penjelasan di atas. Pelaksanaannya sangat mudah dipahami oleh para guru karena dalam analisis digunakan program komputer, seperti program RASCAL, PASCAL, BIGSTEPS, atau QUEST. AA. Analisis Kualitas Instrumen Evaluasi Hasil Belajar

1. Makna dan Tujuan Analisis Kualitas Instrumen Evaluasi Hasil Belajar

Instrumen evaluasi dapat dibedakan menjadi tiga kelompok, yaitu instrumen evaluasi hasil belajar kognitif, instrumen evaluasi hasil belajar afektif, dan instrumen evaluasi hasil belajar psikomotor. Instrumen evaluasi hasil belajar tersebut perlu dianalisis sebelum dan sesudah digunakan, yang bertujuan agar dapat dihasilkan instrumen evaluasi yang memiliki kualitas tinggi. Tujuan dari analisis kualitas instrument evaluasi hasil belajar ini adalah untuk mengetahui seperti apa kualitas dari masing masing instrument tersebut, apakah instrument tersebut telah layak dipakai. Atau apakah instrument tersebut sudah sesuaideengan syarat syarat instrument hasil belajar. Dalam analisis ini dilihat dari hasil tes yang telah dilakukan. Tes dari masing masing ranah akan dilihat hasilnya untuk menentukan kualitas dari instrument evaluasi hasil belajar tersebut. Selain itu pelaksanaan analisis kualitas instrument juga ditentukan waktunya. Analisis instrument bisa dilaksanakan atau dilakukan sebelum maupun sesudah dilaksanakan uji coba. Cara analisis instrument yang telah disusun adalah dengan cara dilihatkesesuaiannya dengankopetensi dasar dan indikator yang di ukur serta pemenuhan persyaratan baik dari ranah materi, konstruksi dan bahasa.

2. Kelompok Instrumen Evaluasi Hasil Belajar

Instrument evaluasi dapat dibagi menjadi tiga kelompok, yaitu instrumen evaluasi hasil belajar kognitif, instrumen evaluasi hasil belajar efektif, instrumen evaluasi hasil belajar psikomotor. Instrumen evaluasi untuk ketiga hasil belajar tersebut perlu dianalisis sebelum dan sesudah digunakan yang tujuannya agar dapat dihasilkan instrument evaluasi yang memiliki kualitas tinggi. Pada uraian berikut akan dibahas teknik analisis kualitas instrument secara berurutan mulai kualitas instrument evaluasi hasil belajar koknitif, instrument evaluasi hasil belajar afektif dan instrument hasil belajar psikomotor. a. Analisis Kualitas Instrumen Evaluasi Hasil Kognitif Pada umumnya hasil belajar kognitif dinilai dengan tes. Tes dalam bentuk butir-butir soal sebelum digunakan hendaknya dianalisis terlebih dahulu agar memenuhi syarat sebagai alat evaluasi yang memiliki kualitas tinggi. Cara menganalisis butir-butir tes tersebut dapat ditempuh melalui dua cara, yaitu: 1 Analisis Tes Secara TeoritikAtau Analisis Kualitatif Analisis secara teoritis atau analisis kualitatif dapat dilakukan sebelum maupun setelah dilaksanakan uji coba. Cara analisisnya adalah dengan cara mencermati butir-butir soal yang telah disusun dilihat dari: kesesuaian dengan kompetensi dasar dan indikator yang diukur serta pemenuhan persyaratan baik dari ranah materi, konstruksi dan bahasa. Butir-butir soal yang akan di analisis dapat berupa butir soal bentuk uraian, butir soal bentuk melengkapi,dan butir soal bentuk pilihan ganda multiple choice. 2 Analisis Tes Secara Kuantitatif Analisis ter secara kuantitatif diarahkan untuk menelaah tingkat validitas soal, reliabilitas, daya pembeda, tingkat kesukaran, dan khusus untuk model atau tipe soal pilihan ganda perlu juga ditelaah efektifitas fungsi distraktor. a Analisis Validitas Tes Validitas validity, kesahihan, berkaitan dengan permasalahan apakah tes yang dimaksudkan untuk mengukur sesuatu itu memang dapat mengukur secara tepat sesuatu yang akan dikur tersebut Nurgiyantoro. Dkk. 2005. Secara singkat dapat dikatakan bahwa validitas tes mempersoalkan apakah tes itu dapat mengukur apa yang akan diukur. Misalnya, jika tes itu dimaksudkan untuk mengukur tingkat kognitif atau ingatan tentang macam-macam rukun iman, memang secara tepat dapat untuk mengukur kemampuan itu, bukan pengetahuan yang lain, misalnya penjelasan tentang pengertian iman. Jika tes itu dimaksudkan untuk menanyakan kemampuan menganalisis sebab- sebab suatu kaum diberi azab oleh Allah kognitif tingkat