11
D. Peskalaan dan Konsekuensi Model Analisis
Instrumen tes kemampuan berpikir divergen hanya dapat diukur dengan menggunakan item tes dalam bentuk uraian nonobjektif.  Jawaban yang diberikan testi dalam tes uraian
nonobjektif diharapkan luas dan komprehensif. Tes ini dimaksudkan sesuai dengan situasi di mana pengetahuan komprehensif harus diuji, dan kunci pemilihan bentuk tes ini adalah
menjamin bahwa pengetahuan kognitif yang dimaksud adalah umum dan luas Roid Haladyna, 1982: 58-62.
Penskalaan atau penskoran politomus diberikan kepada respons tes uraian karena respons yang muncul dapat diberi poin nilai dengan kisaran performans yang terendah nol
hingga lebih dari satu level di atasnya misalnya 2, 3, atau n. Model yang dapat dipakai untuk mencari karakteristik informasi item yang terkait dengan penskalaan terhadap respons
yang muncul cukup banyak. Keragaman model tersebut terdapat baik pada penskalaan politomus maupun dikhotomus. Hal yang perlu diperhatikan adalah bila mendikotomikan
skala politomus. Pengubahan dari skala atau skor politomus menjadi skala atau skor dikotomus akan mengubah sifat skala pengukuran, yang dapat mengancam validitas
pengukuran Han  Hambleton, 2007: 15-20; Theissen et. al., 2001: 295-325. Semakin bertambah banyak parameter di dalam model multikategori sebagai lawan
model dikotomus, akan semakin bertambah pula informasi di dalam data. Namun, diperlukan estimasi yang stabil di dalam ukuran sampel yang sama. Ukuran sampel untuk
data politomus menggunakan Graded Model  GM, yang merupakan model 2-PL, sekitar 250 ntuk aplikasi dalam penelitian, sedangkan 500 sampai 1000 untuk penggunaan
operasional Muraki  Bock, 1998: 35. Ahli lain menyatakan ukuran sampel antara 200 sampai 1000 tergantung model yang dipilih. Penelitian disertasi dapat menggunakan sampel
yang kecil Crocker  Algina, 1986: 322. Ada pula ahli yang menyatakan ukuran sampel
12 khusus untuk model 1-PL berupa Rasch Model  RM antara 30 sampai 300 dengan batas
INFIT t sebesar -2 sampai +2 Bond  Fox, 2007: 43. Penelitian ini menggunakan Partial Credit Model PCM sekaligus Rasch Model RM
untuk pengujian fit  item tes. Dasar pertimbangan yang digunakan, yang pertama bahwa PCM sebagai perluasan RM yang merupakan model 1-PL, dapat menggunakan sampel yang
tidak sebesar kalau melakukan kalibrasi data politomus menggunakan model 2-PL atau 3- PL Keeves  Masters, 1999: 12-13. Kedua, bahwa karakteristik respons terhadap item
keterampilan proses sains mengikuti PCM. Karakteristik PCM ditandai  tingkat kesukaran dari suatu tahapan kategori  di bawahnya ke kategori di atasnya tidak sama antaritem satu
dan yang lain, sehingga besarnya delta untuk suatu tahapan kategori di bawahnya dan delta untuk tahapan kategori di atasnya tidak sama antaritem satu dengan item lainnya.
1. Perhitungan Estimasi untuk Item
Penetapan fit item secara keseluruhan dengan model dalam program QUEST Adam Kho, 1996 didasarkan pada besarnya nilai rata-rata INFIT Mean of Square INFIT MNSQ
beserta simpangan bakunya atau nilai rata-rata INFIT Mean of  INFIT t. Penetapan  fit  tiap item dengan model dalam program QUEST didasarkan pada besarnya nilai INFIT MNSQ
atau nilai INFIT t item yang bersangkutan. Langkah untuk memperolehnya adalah sebagai berikut Wright  Masters, 1982,  93-104.
2. Perhitungan Estimasi untuk Testi
Penetapan  fit  testi caseperson secara keseluruhan dengan model dalam program QUEST Adam  Kho, 1996 didasarkan pada besarnya nilai rata-rata INFIT Mean of
Square  INFIT MNSQ beserta simpangan bakunya. Dapat pula didasarkan pada besarnya nilai rata-rata INFIT Mean of INFIT t. Penetapan fit tiap testi caseperson dengan model