B. Pembahasan
1. Analisis Indeks Kesukaran Aitem Subtes AN
Berdasarkan hasil analisis diketahui bahwa dari total 20 aitem yang ada dalam subtes AN, hanya 10 aitem yang baik karena memiliki nilai indeks
kesukaran aitem berkategori sulit yang sesuai untuk tujuan penggunaan IST yaitu untuk tujuan seleksi. Artinya hanya 50 saja dari 20 aitem subtes AN yang sesuai
dan dapat menjalankan fungsinya didasarkan pada penggunaan tes tersebut. Sementara itu, 10 aitem lainnya berada dalam kategori mudah dan sedang
sehingga aitem-aitem tersebut harus direvisi untuk meningkatkan taraf kesukaran aitemnya dalam artian menurunkan nilai p nya.
Menurut Azwar 2005 Taraf kesukaran terbaik bergantung pada tujuan dari suatu tes disusun. Berdasarkan tujuan penggunaannya, IST dipakai untuk
seleksi dan penempatan karyawan. Untuk memenuhi tujuan ini, berdasarkan kategorisasi indeks kesukaran aitem Allen Yen subtes AN harus memiliki nilai
p kecil dari 0,3, artinya membutuhkan aitem-aitem dengan tingkat kesukaran yang tinggi karena hanya sebagian kecil saja dari pelamar yang akan diterima. Hal ini
didukung oleh pernyataan Lord dalam Murphy Davidshofer, 2003 bahwa untuk tes seleksi karyawan sebaiknya tes berisi aitem dengan nilai p
mendekati 0,2 dan jika tujuan tes adalah untuk menyaring kelompok pelamar yang paling
baik tes harus berisi aitem-aitem yang sangat sulit.
Universitas Sumatera Utara
2. Analisis Indeks Daya Beda Aitem Subtes AN
Hasil analisis indeks daya beda aitem yang didasarkan pada kategori nilai d menurut Ebel dalam Crocker Algina, 2005 diketahui bahwa 10 aitem saja
dari total aitem subtes AN yang dinilai sangat baik. Masing-masing aitem ini memiliki indeks daya beda aitem diatas 0,4. Angka ini mengindikasikan bahwa
aitem-aitem ini memiliki kualitas sangat baik dan memuaskan dalam membedakan individu yang memiliki level kompetensi yang diharapkan dan individu yang tidak
memilikinya. Selain itu ada 4 aitem yang dinilai lumayan baik dan tidak memerlukan
revisi. Aitem-aitem tersebut memiliki nilai indeks daya beda aitem antara 0,3 sampai 0,4. Sebanyak 5 aitem dinilai belum memuaskan dan masih perlu direvisi,
karena aitem-aitem tersebut memiliki nilai indeks daya beda aitem antara 0,2 sampai 0,3. Sementara, 1 aitem lainnya dinilai buruk karena memiliki nilai indeks
daya beda aitem di bawah 0,2. Secara keseluruhan, dapat dikatakan bahwa ada 14 aitem yang memiliki
kualitas baik dan siap pakai untuk dijadikan tes seleksi. Sementara itu 6 aitem lainnya memiliki kualitas buruk. Aitem-aitem ini memiliki indeks daya beda
relatif rendah, yaitu dibawah 0,3. Hal ini mengindikasikan bahwa aitem-aitem tersebut tidak mampu menangkap perbedaan antara individu yang memiliki
kompetensi yang diharapkan dan individu yang tidak memilikinya. Dari 6 aitem tersebut, 5 aitem di antaranya masih mungkin untuk diterima dengan syarat aitem
tersebut harus direvisi terlebih dahulu. Sementara itu, 1 aitem lainnya langsung
Universitas Sumatera Utara
dianggap gugur karena indeks daya beda aitem yang dimilikinya berada dibawah angka 0,2 Ebel dalam Crocker Algina, 2005.
3. Analisis Efektifitas Distraktor Subtes AN
Hasil analisis efektifitas distraktror menunjukkan hanya 10 aitem saja yang memiliki efektifitas distraktor yang baik karena dipilih dan tersebar relatif oleh
kebanyakan subjek dari kelompok rendah yaitu kelompok yang dianggap tidak memiliki atribut atau kompetensi yang diharapkan. Sementara itu 10 aitem lainnya
masih perlu direvisi karena masih terdapat distraktor yang tidak berfungsi bahkan lebih mengecoh kelompok tinggi dibandingkan kelompok rendah.
Menurut Azwar 2005 efektivitas distraktor dapat dilihat dengan dua kriteria yaitu, distraktor dipilih oleh individu dari kelompok rendah, pemilih
distraktor tersebar relatif proporsional pada masing-masing distraktor yang ada. Pada penelitian ini efektivitas ditraktor dilihat berdasarkan hasil perhitungan nilai
d untuk tiap pilihan jawaban yang didapat dengan bantuan program
iteman
versi 3.0
dan dari pola penyebaran distraktor itu sendiri pada kelompok tinggi dan kelompok rendah yang dilihat dengan bantuan program SPSS versi 16.0.
Berdasarkan analisis dari hasil program
iteman
versi 3.0, distraktor yang efektif dan baik adalah distraktor dengan nilai d yang negatif dan tinggi sementara
nilai daya beda yang positif pada suatu distraktor memiliki arti bahwa banyak juga dari kelompok tinggi atau yang memiliki pengetahuan terjebak pada distraktor
suatu aitem tes yang seharusnya dipilih lebih banyak dari kelompok rendah atau subjek yang tidak memiliki pengetahuan atribut ukur. Berdasarkan pola
Universitas Sumatera Utara
penyebarannya, distraktor yang efektif dan baik adalah yang dipilih secara merata oleh subjek dari kelompok rendah Azwar, 2005.
4. Analisis Karakteristik Psikometri Aitem Berdasarkan Nilai p, Nilai d dan
Efektifitas Distraktor Proses analisis ini, peneliti mencoba melakukan seleksi aitem berdasarkan
nilai p, d dan efektifitas distraktor aitem-aitem subtes AN. Hasil analisis karakteristik Psikometri menunjukkan hanya ada 1 aitem yang diterima, 18 aitem
dalam kategori membutuhkan revisi, serta 1 aitem lainnya langsung dianggap gugur. Artinya, untuk subtes AN pada IST, secara keseluruhan hanya 1 aitem ini
saja yang siap pakai dan dalam kondisi baik serta memuaskan. Aitem ini adalah aitem bernomor 50. Aitem ini memiliki indeks kesukaran aitem yang sesuai
dengan tujuan seleksi, mampu menangkap perbedaan antara individu yang memiliki level kompetensi yang diharapkan dan individu yang tidak memilikinya,
serta distraktor yang terdapat pada aitem ini berfungsi dengan baik. Indeks kesukaran p dan indeks daya beda d saja tidaklah cukup
memberikan informasi mengenai kualitas aitem. Bagaimana jawaban-jawaban subjek tersebar pada pilihan jawaban yang tersedia juga harus diperhatikan agar
fungsi suatu aitem dapat dipenuhi secara maksimal. Tentu saja kombinasi penyebaran jawaban akan sangat banyak variasinya, namun dasar terpenting
dalam melakukan penilaian terhadap kualitas aitem adalah dengan melihat fungsi pilihan jawaban, terutama distraktor-distraktor yang harus tampak sebagai
jawaban benar bagi subjek dari kelompok rendah Azwar, 2005.
Universitas Sumatera Utara
Kesimpulannya, secara keseluruhan aitem-aitem dalam subtes AN pada IST yang digunakan untuk tujuan masih memiliki kualitas yang kurang
memuaskan. Dari total 20 aitem, hanya 1 aitem yang berada dalam kondisi layak dan baik. Hal ini menunjukkan bahwa meskipun tiga karakteristik Psikometri ini
dihitung secara terpisah, namun dalam evaluasinya terhadap aitem, karakteristik aitem tersebut tidak bisa berdiri sendiri melainkan dilihat sebagai kesatuan
komponen yang akan menentukan apakah suatu aitem itu dapat dianggap baik atau tidak Azwar, 2005.
Hasil ini mendukung pernyataan Azwar 2005 bahwa untuk melihat kualitas tes berdasarkan kualitas aitem per aitem yang menyusunnya tidak bisa
hanya menggunakan satu pendekatan saja. Pendekatan yang dilakukan harus komprehensif berkaitan dengan karakteristik aitem tersebut secara total. Hal ini
terbukti dari hasil analisis bahwa aitem-aitem yang dinilai baik secara tinjauan karakteristik indeks kesukaran aitem ternyata masih ada yang tidak lolos ketika
diujii dengan menggunakan pendekatan karakteristik indeks daya beda aitem. Aitem yang lolos setelah diuji dengan pendekatan karakteristik indeks daya beda
aitem ternyata masih banyak yang memiliki efektifitas distraktor yang buruk karena distraktor yang ada pada aitem yang dianggap memiliki nilai p dan d yang
baik itu tidak berfungsi sebagaimana mestinya. Kualitas tes secara keseluruhan sangat bergantung pada karakteristik aitem-aitem yang menyusunnya Murphy
Davidshofer, 2003.
Universitas Sumatera Utara
5. Analisis Reliabilitas IST subtes AN
Berdasarkan hasil analisis didapati bahwa nilai koefisien reliabilitas subtes AN pada IST yang masih digunakan di P3M adalah sebesar 0,728. Hal ini
mengandung arti 72,8 dari variasi tampak merupakan variasi skor murni subjek yang bersangkutan. Dengan kata lain, 27,2 merupakan variasi eror atau
kesalahan. Hasil tersebut mengindikasikan bahwa subtes AN pada IST tidak dapat
dipercaya dalam menentukan taraf intelegensi seseorang yang menjadi salah satu dasar dalam seleksi dan penempatan kerja, karena tidak mencapai koefisien
reliabilitas yang seharusnya. Berdasarkan Murphy dan Davidshoper 2003 IST harus memiliki nilai koefisien reliabilitas minimal 0,900 karena secara
keseluruhan IST merupakan salah satu bentuk dari tes intelegensi dan digunakan untuk tujuan diagnostik.
Nilai reliabilitas yang belum memuaskan ini dianggap karena terjadinya variasi yang kurang logis dalam karakteristik aitem berkaitan dengan nilai p, d dan
efektifitas distraktor masing-masing aitem dalam subtes AN tersebut. Hal ini juga bisa saja terjadi dikarenakan penggunaan IST yang sudah terlalu lama bahkan
kebocoran tes yang terjadi sudah sangat luar biasa, sehingga perbedaan-perbedaan individu dalam skor tes disebabkan karena kesalahan peluang bukan disebabkan
oleh perbedaan-perbedaan yang sesungguhnya dalam karakteristik individu Anastasi Urbina, 2006.
Peneliti mengambil kesimpulan bahwa subtes AN pada IST yang masih digunakan di P3M Fakultas Psikologi USU sudah tidak reliabel. Artinya, dengan
Universitas Sumatera Utara
melihat hasil analisis karakteristik aitem secara keseluruhan, peneliti melihat bahwa subtes ini memang memiliki nilai eror yang cukup besar.
6. Analisis Validitas Konstak Subtes AN
Validitas konstrak antar subtes pada IST ditunjukkan dalam bentuk matriks untuk melihat bagaimana hubungan antar subtes yang yang ada pada IST.
Dari matriks tersebut dapat dilihat korelasi subtes AN dengan 8 subtes lainnya yang terdapat pada IST. AN berkorelasi sebesar 0,676 dengan SE. AN berkorelasi
sebesar 0,579 dengan WA. AN berkorelasi dengan GE sebesar 0,509. AN berkorelasi sebesar 0,604 dengan RA dan ZR. AN berkorelasi sebesar 0,410
dengan FA. AN berkorelasi sebesar 0,434 dengan WU. AN berkorelasi sebesar 0,597 dengan ME.
Analisis validitas konstrak subtes AN didasarkan pada pendekatan
multitrait multimethod
, dimana pendekatan ini akan menguji serentak dua atau lebih trait yang diukur melalui dua atau lebih metode. Dari prosedur ini akan
diperoleh adanya bukti validitas diskriminan dan validitas konvergen Azwar, 2005. Validitas diskriminan diperlihatkan oleh rendahnya korelasi antara skor
skala atau tes yang mengukur trait yang berbeda terutama bila digunakan metode yang sama, sedangkan validitas konvergen ditunjukkan oleh tingginya korelasi
skor tes-tes yang mengukur trait yang sama dengan menggunakan metode yang berbeda Azwar, 2005.
Koefisien validitas dapat dianggap memuaskan apabila melebihi 0,30 Azwar, 2005. Berdasarkan hasil korelasi yang didapat antara subtes AN dengan
Universitas Sumatera Utara
8 subtes lainnya, menunjukkan korelasi yang tinggi antar subtes. Hal ini menunjukkan bahwa semua subtes mempunyai hubungan konvergen satu sama
lain karena perpotongan antar subtes menjadi lebih besar, misalnya saja antara subtes AN dan WU menunjukkan korelasi sebesar 0,434. Artinya AN dan WU
memiliki interkorelasi sebesar 18,8, padahal jika dilihat dari trait yang diukur subtes AN dan WU seharusnya dua subtes ini memiliki korelasi yang sangat
rendah bahkan tidak boleh ada sama sekali karena mengukur trait yang berbeda. Subtes AN mengukur kelincahan berfikir sementara WU mengukur daya bayang
ruang. Artinya AN merupakan diskriminan WU dan sebaliknya. Begitu juga dengan korelasi antara AN dengan ZR, meskipun kedua subtes
ini merupakan konvergen masing-masing karena mengukur satu trait yang sama yaitu kelincahan berfikir tetapi korelasi yang ditunjukkan adalah sebesar 0,604,
artinya AN dan ZR saling berpotongan sebesar 36,5 yang menunjukkan bahwa apa yang terukur pada AN juga bisa diukur dengan ZR, sehingga subtes ini tidak
bisa lagi sebagai
s factor
sebagaimana seharusnya dan sudah tidak menjalankan fungsi dan tujuan ukurnya.
Artinya, fungsi IST telah berubah dari awal tes ini disusun oleh Amthauer. Pada dasarnya antara subtes satu dengan lainnya yang terdapat pada IST, ada yang
saling berhubungan karena mengukur faktor yang sama
general factor
atau
group factor
, tetapi ada juga yang tidak berhubungan karena masing-masing subtes mengukur faktor khusus
special factor
. Oleh karena itu, karakteristik dari baterai tes Amthauer saat penyusunannya menunjukan adanya suatu interkorelasi yang
rendah antar subtesnya r=0.25 dan korelasi antara subtes dengan jumlah
Universitas Sumatera Utara
keseluruhan subtes yang rendah pula r=0.60. Artinya masing-masing subtes dapat berdiri sendiri mengukur traitnya Diktat Kuliah Universitas Padjajaran,
2008. Dapat disimpulkan bahwa subtes-subtes pada IST tidak dapat lagi berdiri
sendiri dan mengukur
s factor
, karena perpotongan antar subtes menjadi lebih besar dari yang seharusnya. Hasil analisis menunjukkan antar subtes merupakan
konvergen masing-masing, artinya kesembilan subtes IST mengukur hal yang sama. Maka dapat disimpulkan secara keseluruhan IST sudah tidak valid lagi
terutama pada subtes AN.
Universitas Sumatera Utara
BAB V KESIMPULAN DAN SARAN