11
D. Peskalaan dan Konsekuensi Model Analisis
Instrumen tes kemampuan berpikir divergen hanya dapat diukur dengan menggunakan item tes dalam bentuk uraian nonobjektif. Jawaban yang diberikan testi dalam tes uraian
nonobjektif diharapkan luas dan komprehensif. Tes ini dimaksudkan sesuai dengan situasi di mana pengetahuan komprehensif harus diuji, dan kunci pemilihan bentuk tes ini adalah
menjamin bahwa pengetahuan kognitif yang dimaksud adalah umum dan luas Roid Haladyna, 1982: 58-62.
Penskalaan atau penskoran politomus diberikan kepada respons tes uraian karena respons yang muncul dapat diberi poin nilai dengan kisaran performans yang terendah nol
hingga lebih dari satu level di atasnya misalnya 2, 3, atau n. Model yang dapat dipakai untuk mencari karakteristik informasi item yang terkait dengan penskalaan terhadap respons
yang muncul cukup banyak. Keragaman model tersebut terdapat baik pada penskalaan politomus maupun dikhotomus. Hal yang perlu diperhatikan adalah bila mendikotomikan
skala politomus. Pengubahan dari skala atau skor politomus menjadi skala atau skor dikotomus akan mengubah sifat skala pengukuran, yang dapat mengancam validitas
pengukuran Han Hambleton, 2007: 15-20; Theissen et. al., 2001: 295-325. Semakin bertambah banyak parameter di dalam model multikategori sebagai lawan
model dikotomus, akan semakin bertambah pula informasi di dalam data. Namun, diperlukan estimasi yang stabil di dalam ukuran sampel yang sama. Ukuran sampel untuk
data politomus menggunakan Graded Model GM, yang merupakan model 2-PL, sekitar 250 ntuk aplikasi dalam penelitian, sedangkan 500 sampai 1000 untuk penggunaan
operasional Muraki Bock, 1998: 35. Ahli lain menyatakan ukuran sampel antara 200 sampai 1000 tergantung model yang dipilih. Penelitian disertasi dapat menggunakan sampel
yang kecil Crocker Algina, 1986: 322. Ada pula ahli yang menyatakan ukuran sampel
12 khusus untuk model 1-PL berupa Rasch Model RM antara 30 sampai 300 dengan batas
INFIT t sebesar -2 sampai +2 Bond Fox, 2007: 43. Penelitian ini menggunakan Partial Credit Model PCM sekaligus Rasch Model RM
untuk pengujian fit item tes. Dasar pertimbangan yang digunakan, yang pertama bahwa PCM sebagai perluasan RM yang merupakan model 1-PL, dapat menggunakan sampel yang
tidak sebesar kalau melakukan kalibrasi data politomus menggunakan model 2-PL atau 3- PL Keeves Masters, 1999: 12-13. Kedua, bahwa karakteristik respons terhadap item
keterampilan proses sains mengikuti PCM. Karakteristik PCM ditandai tingkat kesukaran dari suatu tahapan kategori di bawahnya ke kategori di atasnya tidak sama antaritem satu
dan yang lain, sehingga besarnya delta untuk suatu tahapan kategori di bawahnya dan delta untuk tahapan kategori di atasnya tidak sama antaritem satu dengan item lainnya.
1. Perhitungan Estimasi untuk Item
Penetapan fit item secara keseluruhan dengan model dalam program QUEST Adam Kho, 1996 didasarkan pada besarnya nilai rata-rata INFIT Mean of Square INFIT MNSQ
beserta simpangan bakunya atau nilai rata-rata INFIT Mean of INFIT t. Penetapan fit tiap item dengan model dalam program QUEST didasarkan pada besarnya nilai INFIT MNSQ
atau nilai INFIT t item yang bersangkutan. Langkah untuk memperolehnya adalah sebagai berikut Wright Masters, 1982, 93-104.
2. Perhitungan Estimasi untuk Testi
Penetapan fit testi caseperson secara keseluruhan dengan model dalam program QUEST Adam Kho, 1996 didasarkan pada besarnya nilai rata-rata INFIT Mean of
Square INFIT MNSQ beserta simpangan bakunya. Dapat pula didasarkan pada besarnya nilai rata-rata INFIT Mean of INFIT t. Penetapan fit tiap testi caseperson dengan model