12 khusus untuk model 1-PL berupa Rasch Model RM antara 30 sampai 300 dengan batas
INFIT t sebesar -2 sampai +2 Bond Fox, 2007: 43. Penelitian ini menggunakan Partial Credit Model PCM sekaligus Rasch Model RM
untuk pengujian fit item tes. Dasar pertimbangan yang digunakan, yang pertama bahwa PCM sebagai perluasan RM yang merupakan model 1-PL, dapat menggunakan sampel yang
tidak sebesar kalau melakukan kalibrasi data politomus menggunakan model 2-PL atau 3- PL Keeves Masters, 1999: 12-13. Kedua, bahwa karakteristik respons terhadap item
keterampilan proses sains mengikuti PCM. Karakteristik PCM ditandai tingkat kesukaran dari suatu tahapan kategori di bawahnya ke kategori di atasnya tidak sama antaritem satu
dan yang lain, sehingga besarnya delta untuk suatu tahapan kategori di bawahnya dan delta untuk tahapan kategori di atasnya tidak sama antaritem satu dengan item lainnya.
1. Perhitungan Estimasi untuk Item
Penetapan fit item secara keseluruhan dengan model dalam program QUEST Adam Kho, 1996 didasarkan pada besarnya nilai rata-rata INFIT Mean of Square INFIT MNSQ
beserta simpangan bakunya atau nilai rata-rata INFIT Mean of INFIT t. Penetapan fit tiap item dengan model dalam program QUEST didasarkan pada besarnya nilai INFIT MNSQ
atau nilai INFIT t item yang bersangkutan. Langkah untuk memperolehnya adalah sebagai berikut Wright Masters, 1982, 93-104.
2. Perhitungan Estimasi untuk Testi
Penetapan fit testi caseperson secara keseluruhan dengan model dalam program QUEST Adam Kho, 1996 didasarkan pada besarnya nilai rata-rata INFIT Mean of
Square INFIT MNSQ beserta simpangan bakunya. Dapat pula didasarkan pada besarnya nilai rata-rata INFIT Mean of INFIT t. Penetapan fit tiap testi caseperson dengan model
13 dalam program QUEST didasarkan pada besarnya nilai INFIT MNSQ atau nilai INFIT t
item yang bersangkutan. Langkah perhitungannya sebagai berikut Wright Masters, 1982: 108-109.
3. Pengujian Validitas untuk Mengetahui Fit Item dan Testi terhadap Model
Item characteritic curve ICC akan mendatar flat bila besarnya INFIT MNSQ untuk item atau e lebih besar dari satuan logit 1,30 atau 0,77. Akibatnya membentuk
platokurtic curve dan tidak lagi membentuk leptokurtic curve Keeves Alagumalai 1999: 36. Oleh karena itu, dalam program QUEST ditetapkan bahwa suatu item atau
testicaseperson dinyatakan fit dengan model dengan batas kisaran INFIT MNSQ dari 0,77 sampai 1,30 Adam Khoo, 1996:30 90. Ada pula peneliti yang menggunakan batas
yang lebih ketat, yakni dengan kisaran 0,83 sampai dengan 1,20 dan ada yang menggunakan pengujian berdasarkan besarnya nilai INFIT t. Dalam hal ini menggunakan kisaran nilai t
adalah ± 2 pembulatan ± 1,96 jika taraf kesalahan atau alpha sebesar 5 Keeves Alagumalai 1999: 34-36; Bond Fox, 2007: 43.
4. Estimasi Reliabilitas
Etimasi reliabilitas berdasarkan item dihitung berdasarkan besarnya Item Variance Adjusted for Calibration Error sebesar SA
I 2
. Jika seluruh item didifinisikan sebagai variabel tunggal dengan nilai rata-rata sebesar v, maka SA
I 2
= SD
I 2
– vMSE
I
. Variabel dikatakan fit dengan model apabila memiliki nilai v sama dengan satu. Bila nilai v lebih besar dari satu
maka variabel dinyatakan tidak fit dengan model. Dengan kata lain, keseluruhan item atau tes tidak fit dengan model. Wright Masters, 1982: 91-93. Dalam pendekatan IRT
reliabilitas berdasarkan atas besarnya indkes sparasi person dapat dipandang sebagai