Validitas Konstruk Tingkat Skor

faktor lain. Namun model fit satu faktor tetap dapat tercapai dengan catatan korelasi antar kesalahan item harus dibebaskan terlebih dahulu. Dengan kondisi di atas, maka TIM sesi performance tidak layak digunakan. TIM bisa digunakan apabila scoring menggunakan true score atau skor murni dimana hasil tidak dipengaruhi oleh tingkat error. Beberapa item juga sebelumnya harus dikaji ulang, direvisi atau bahkan diganti karena beberapa diantaranya ternyata tidak memberikan kontribusi yang positif terhadap faktor yang seharusnya terukur. Beberapa hal yang dapat menyebabkan muldimensionalitas dalam setiap subtes ini antara lain: 1. Pada subtes DS, terjadi kerancuan antara bentuk power test testi diuji berdasarkan kemampuan, dan speed test testi diuji berdasarkan kecepatan. DS memang diteorikan mengukur memori dan kecepatan. Namun DS tidak dapat juga disebut sebagai speed test karena item DS terlalu sedikit sehingga hampir semua yang menempuh tes ini dapat menjawab dengan benar. Akibatnya subtes DS tidak dapat membedakan kemampuan antar indivdu. DS juga tidak dapat dikatakan sebagai power test karena tingkat kesukaran item DS terlalu rendah sehingga setiap orang dapat dipastikan bisa menjawab dengan benar asalkan waktu yang diberikan cukup. Sama sekali tidak ada kemampuan berfikir yang diperlukan dalam mengerjakan subtes DS. Ketidakjelasan sifat subtes DS ini mengakibatkan subtes ini menjadi multidimensional. Tidak ada satu faktor yang terdifinisi dalam subtes ini. 2. Pada subtes PC, bentuk pilihan jawaban dapat menyebabkan multitafsir. Bentuk jawabannya yang hanya terdiri dari huruf depan dari benda yang dihilangkan. Bentuk jawaban seperti ini beresiko menyebabkan terjadinya multikonotasi sehingga dapat menyebabkan multitafsir. Huruf yang sama bisa dipahami berbeda oleh orang yang berbeda. 3. Pada subtes SPA, alokasi waktu terlalu singkat sehingga banyak testi cenderung menjawab secara random karena kehabisan waktu. Waktu yang disediakan pada subtes ini terlalu sempit sedangkan item yang harus dikerjakan cukup banyak padahal setiap item memerlukan waktu untuk mengidentifikasi jawaban. Kurangnya waktu ini membuat peserta tes akhirnya menjawab secara random karena kepanikan dan kemungkinan besar faktor waktu ini juga yang menyebabkan item 41-50 tidak ada yang menjawab dengan benar sesuai dengan kunci jawaban. Maka untuk memperbaiki tes ini sebaiknya dilakukan pengujian kembali mengenai alokasi waktu. 4. Pada subtes PA dan OA, bentuk soal berubah dari gambar nyata menjadi pilihan ganda. terjadinya multidimensionalitas pada item OA dan PA adalah cara pengerjaan tes yang berubah dari bentuk benda nyata yang langsung dilihat, dapat diraba, dan dapat digerak-gerakkan dengan mudah pada tes WAIS menjadi bentuk gambar statis yang tidak dapat digerakkan dan dicoba sehingga menyebabkan cara pengerjaannya lebih sulit. Hasil pengujian menggunakan CFA menunjukkan banyaknya korelasi antar measurement error pada item-item subtes TIM Tabel 5.2. Ini berarti bahwa banyak item tes TIM yang juga mengukur hal lain selain aspek yang hendak diukur multidimensional. Pada subtes DS terdapat 204 buah korelasi antar kesalahan pengukuran pada satu item dengan kesalahan pengukuran pada item lainnya dalam subtes tersebut. Pada subtes PC terdapat 116 korelasi sejenis, pada subtes SPA terdapat 556 korelasi, pada subtes PA terdapat 82 korelasi, pada subtes OA terdapat 112 korelasi. TIM sesi performance tidak layak digunakan karena sifatnya multidimensional sehingga terlalu banyak faktor yang terukur . Melalui analisis faktor dua tingkat second order confirmatory analysis ditemukan bahwa seluruh subtes secara signifikan mengukur skor performance. Namun perlu juga diperhatikan bahwa dalam analisis ini yang digunakan adalah skor faktor true score. Skor faktor diambil karena subtes dalam TIM seluruhnya bersifat multidimensional. Terdapat banyak korelasi kesalahan anatar item. Maka pada penelitian ini muatan error pada setiap item harus disingkarkan terlebih dahulu untuk mendapatkan skor faktor yang murni. Dalam analisis ini item-item yang berkoefisien negatif dan tidak signifikan pada setiap subtes juga telah disingkirkan terlebih dahulu karena hanya akan mengganggu hasil perhitungan. Hasil perhitungan menunjukan bahwa setiap subtes secara signifikan memberikan kontribusi kepada skor performance. TIM memang belum pernah diuji validitasnya, namun alat tes yang diterjemahkanya, yaitu MAB, sudah pernah diteliti. Jackson 2003 menghitung iterkorelasi antara raw score dari 10 subtes dalam MAB Tabel 5.3. Sample yang digunakan sebanyak 3121 siswa dan siswi SMA dengan kisaran usia antara 16-19 tahun. Dari penelitian ini dapat terlihat bahwa subtes pada sesi verbal cenderung berkorelasi lebih tinggi dengan subtes sesi verbal lainya, begitu pula subtes pada sesi performance.